汉字一共有多少个字-一个汉字到底占几个字节

汉字大约有将近十万个左右。

从先秦上古到十一世纪,汉字的数量一直在增长,比如目前发现和整理的甲骨文字数量有4055个,到了东汉《说文解字》中,汉字数量增长到9353个。汉字又称中文,是汉语的记录符号,与英文、印地文、俄文等表音的字母文字不同,汉字是典型的意音文字,与拼音文字单词的单音或多音表义不同,汉字一般单字单音表义。

汉字的数量在随着历史发展有着不同的变化:

秦代的《仓颉》、《博学》、《爰历》三篇共有3300字。

汉代扬雄作《训纂篇》有5340字,到许慎作《说文解字》就有9353字了。

我国文字从古代的象形文字发展到今天的汉字,中间是经过多次变化和改革的;但是历代的改革几乎都是兼收并蓄的,以致使汉字越积越多。

当前我国文字之多是非常惊人的,比较常用的《新华字典》就有10000多个汉字;1990年出版的《辞海》有14872个汉字。

1716年编撰的《康熙字典》有47035个汉字;郭沫若生前曾根据日本朋友的估计,我国大约有60000多个汉字。

一个汉字到底占几个字节

中文在utf-8中占3or4个字节。
utf8字符是变长字符,在这里补充一下uft-8的编码方式。
一字节:0*******
两字节:110*****,10******
三字节:1110****,10******,10******
四字节:11110 ,10******,10******,10******
五字节:111110
,10******,10******,10******,10******
六字节:1111110
,10******,10******,10******,10******,10******
因此,拿到字节串后,想判断UTF8字符的byte长度,按照上文的规律,只需要获取该字符的首个Byte,根据其值就可以判断出该字符由几个Byte表示。

GBK编码,一个汉字占两个字节。UTF-16编码,通常汉字占两个字节,CJKV扩展B区、扩展C区、扩展D区中的汉字占四个字节(一般字符的Unicode范围是U+0000至U+FFFF,而这些扩展部分的范围大于U+20000,因而要用两个UTF-16)。UTF-8编码是变长编码,通常汉字占三个字节,扩展B区以后的汉字占四个字节。

一个汉字占用几个字节?

一个汉字=2字节

中文标点占三个字节,一个英文字母占一个字节,英文标点占一个字节。

字节的换算关系为:

1字节(Byte)=8字位=8个二进制数

1字位(bit)=1个二进制数

1B=8b

1KB=1024B

1MB=1024KB

1GB=1024MB

b称为字位、B称为字节、KB称为千字节、MB称为兆字节、GB称为吉字节。

扩展资料:

不同的编码格式占字节数是不同的,以下为不同编码汉字、标点符号所占用的字节:

1、ASCII码:一个中文(含繁体)占两个字节,一个中文标点占三个字节。一个英文字母占一个字节的,一个英文标点占一个字节。

2、UTF-8编码:一个中文(含繁体)占三个字节,一个中文标点占三个字节。一个英文字母占一个字节,一个英文标点占一个字节。

3、Unicode编码:一个中文(含繁体)占两个字节,一个中文标点占两个字节。一个英文占两个字节,一个英文标点占一个字节。

汉字有多少个字

汉字是语素文字,总数非常庞大。汉字总共有多少字?到目前为止,恐怕没人能够答得上来精确的数字。

关于汉字的数量,根据古代的字书和词书的记载,可以看出其发展情况。

秦代的《仓颉》、《博学》、《爰历》三篇共有3300字,汉代扬雄作《训纂篇》,有5340字,到许慎作《说文解字》就有9353字了,晋宋以后,文字又日渐增繁。据唐代封演《闻见记·文字篇》所记晋吕忱作《字林》,有12824字,后魏杨承庆作《字统》,有13734字,梁顾野王作《玉篇》有16917字。唐代孙强增字本《玉篇》有22561字。到宋代司马光修《类篇》多至31319字,到清代《康熙字典》就有47000多字了。1915年欧阳博存等的《中华大字典》,有48000多字。1959年日本诸桥辙次的《大汉和辞典》,收字49964个。1971年张其昀主编的《中文大辞典》,有49888字。

随着时代的推移,字典中所收的字数越来越多。1990年徐仲舒主编的《汉语大字典》,收字数为54678个。1994年冷玉龙等的《中华字海》,收字数更是惊人,多达85000字。

如果学习和使用汉字真的需要掌握七八万个汉字的音形义的话,那汉字将是世界上没人能够也没人愿意学习和使用的文字了。幸好《中华字海》一类字书里收录的汉字绝大部分是“死字”,也就是历史上存在过而今天的书面语里已经废置不用的字。

有人统计过十三经(《易经》、《尚书》、《左传》、《公羊传》、《论语》、《孟子》等13部典籍),全部字数为589283个字,其中不相同的单字数为6544个字。因此,实际上人们在日常使用的汉字不过六七千而已。

「点点赞赏,手留余香」

赞赏

  • 木火创业邦
  • 小虎多多出评
  • 苏苏s么
  • 阿山整合包
  • 坤坤永相随
  • 6人赞过
6
3
0
评论 0 请文明上网,理性发言

相关文章