按西方音节定义,英语的单音节词的使用比汉语要频繁。根据统计分析。汉语使用者平均词长约为1.5字上下。(见《ReadingChinese Script: A Cognitive Analysis》这本书里有一个章节《Eye Movements in Reading Chinese andEnglish Text》),而成年英语使用者平均每词音节数约为1.4(见http://www.waisman.wisc.edu/phonology/pubs/PUB30.pdf,这也得到了另一个研究的支持:分析10小时的发听录音,平均没词音节长度为1.38)。
在《ReadingChinese Script: A Cognitive Analysis》这本书里有一个章节《Eye Movements in Reading Chinese andEnglish Text》专门讲阅读中英文时的眼球移动。这是中科院和悉尼大学的两位学者写的。这其中发现。熟练的中文阅读者能够每分钟阅读386个中文词汇(580个汉字),而熟练的英文阅读者可以每分钟阅读382个英文词汇。一般人可能会低100词左右。具体速度还取决于文章的复杂程度,文章简单的话阅读速度就更快。
I saw a car with a big flag, which looked really evil.
哪个看起来很邪恶,车还是旗子?
China will not be the first to use a nuclear weapon.
这应该是上面的解释1还是3?
想要做到严谨,都需要考虑到其他人阅读时的想法,然后用其他语句来消除歧义。(顺便推荐搞笑英语书籍《Anguished English: AnAnthology of Accidental Assaults Upon Our Language》,里面收录了很多爆笑的歧义句,比如If you have not got any fresh vegetables, you may get canned.)
[ Last edited by zzz19760225 on 2017-6-3 at 13:19 ]作者: zzz19760225 时间: 2016-6-26 18:41 拼音,笔画,象形体,音字体,
要把18030全部摊开来过一遍,
将拼音与笔画联系起来,不是满足人的使用需要,而是寻找一种规律,这个规律因人的加入而具有人的内容,属于人为寻找的规律,因为寻找的不是人,而是规律这个可以理解使用的力量形式,所以会排斥人的直接存在,具有非人化,类似辩证那个矛盾体。
这个18030其具有的内容是复杂的,具有各种概念合集群,但是这些内容具有一些独特与不同层面的共性,在共性基础上就可以再次有机组合建立起来。
其中会有死脑筋的知识直线延伸,还有各种随机假设的巧合,以及神奇的奇迹,会是一个非常有意思的世界。
外设添加
USB TAT SSD A:
优盘 硬盘机械盘 硬盘固体盘 优盘:固盘:机盘: 或者后面的冒号不需要了,用盘就代表了,尽量全部用汉字表达,除了数组数群数字公式的符号,专门集中书写运算,其他尽量使用汉字。这样处理汉字的编辑器主要处理的是汉字和标点符号,如何标点符号也汉字化,就基本在汉字环境中工作,相对的工作内容反而简化。在全汉字方向的路上,行列和标点符号都用汉字代替,需要专用于行列和标点符号的汉字!
开始计算机只在美国用。八位的字节一共可以组合出256(2的8次方)种不同的状态。 他们把其中的编号从0开始的32种状态分别规定了特殊的用途,一但终端、打印机遇上约定好的这些字节被传过来时,就要做一些约定的动作:遇上0×10, 终端就换行;遇上0×07, 终端就向人们嘟嘟叫;遇上0x1b, 打印机就打印反白的字,或者终端就用彩色显示字母。他们看到这样很好,于是就把这些0×20以下的字节状态称为”控制码”。他们又把所有的空 格、标点符号、数字、大小写字母分别用连续的字节状态表示,一直编到了第127号,这样计算机就可以用不同字节来存储英语的文字了。大家看到这样,都感觉 很好,于是大家都把这个方案叫做 ANSI 的”Ascii”编码(American Standard Code for Information Interchange,美国信息互换标准代码)。当时世界上所有的计算机都用同样的ASCII方案来保存英文文字。
正在这时,大天使加百列及时出现了——一个叫 ISO(国际标谁化组织)的国际组织决定着手解决这个问题。他们采用的方法很简单:废了所有的地区性编码方案,重新搞一个包括了地球上所有文化、所有字母和符号 的编码!他们打算叫它”Universal Multiple-Octet Coded Character Set”,简称 UCS, 俗称 “unicode“。
unicode开始制订时,计算机的存储器容量极大地发展了,空间再也不成为问题了。于是 ISO 就直接规定必须用两个字节,也就是16位来统一表示所有的字符,对于ASCII里的那些“半角”字符,unicode包持其原编码不变,只是将其长度由原来的8位扩展为16位,而其他文化和语言的字符则全部重新统一编码。由于”半角”英文符号只需要用到低8位,所以其高8位永远是0,因此这种大气的方案在保存英文文本时会多浪费一倍的空间。
unicode在很长一段时间内无法推广,直到互联网的出现,为解决unicode如何在网络上传输的问题,于是面向传输的众多 UTF(UCS Transfer Format)标准出现了,顾名思义,UTF-8就是每次8个位传输数据,而UTF-16就是每次16个位。UTF-8就是在互联网上使用最广的一种unicode的实现方式,这是为传输而设计的编码,并使编码无国界,这样就可以显示全世界上所有文化的字符了。UTF-8最大的一个特点,就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度,当字符在ASCII码的范围时,就用一个字节表示,保留了ASCII字符一个字节的编码做为它的一部分,注意的是unicode一个中文字符占2个字节,而UTF-8一个中文字符占3个字节)。从unicode到utf-8并不是直接的对应,而是要过一些算法和规则来转换。