词库指纹是什么?
Alone_
2024-09-28 18:32:01
最佳回答
词库指纹就是编写输入法的公司为了保护词库的版权加入的识别系统。其实说起来很简单。就是将一些生僻、或者根本不存在的词加入词库。当你输入一定的拼音组合时,这个词会处于第一备选词位置。好比说,前面闹得很凶的goole【谷歌】和sougou【搜狗】事件。比如这个茹立云.在搜狗与google中均是ruliyun这个拼音的首选词,通过搜索可以发现,茹立云是搜狗的一名员工,据此搜狗便说这是他们此前的词库指纹,认定google抄袭.在google中搜索茹立云,可以得到44个结果,而且结果中都是关于茹立云的一些介绍,匹配度达到了100%,也就是说的确存在茹立云这么一个人.而如果是输入如立云的话,只有18项结果,而这些结果都没有100%的匹配,都是些回廊殿宇如立云中,景色奇伟之类十分生硬的分词结果,也就是说网络上根本就没有如立云这样的词存在,因此google输入法当然不会将其作为首选词,这也充分说明了google输入法的准确性,而搜狗输入法还需要加入所谓的词库指纹,也就是人工的加入这个词才能将茹立云这个真实的人名作为首选词,孰好孰坏已经十分清楚.回答完毕。加精华。 20210311