淘客熙熙

主题:【原创】加密汉语之十进制编码初探 -- 老菟

共:💬13 🌺12 新:
全看分页树展 · 主题 跟帖
家园 写的有意思。就是不太明白你用数字编码汉语语音的目的是什么

完全同意汉字汉语的编码,实际上是一种检索码。汉字因为数量多,所以检索也相对复杂,但是冗余小,而汉语的话,因为声母、韵母数量有限,也就是发音的音节有限,所以检索码也会相对简单,但是冗余明显,比如说同音不同字。

对发音编码,可以实现人工合成朗读文字,但是我不太明白为什么要用数字编码汉语语音?是为了在数字键盘上对汉字实现一种语音输入法么?我觉得,相对于单个字的精确编码而言,可能还是对短句、词组的拼音进行识别来得更容易。

如果我没理解错,你是想用数字串对应语音,而语音对应汉字,从而实现数字串编码汉字。如果是这样,似乎存储消耗比现有的两个字节对应一个汉字要大不少。好处是在于,你的编码方式,一个数字串不但对应于汉字,还能提供相应的发音。不过,拼音码已经是这样了。除非这个编码只能在简单的输入界面上实现。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河