搜狗输入法为什么做得比其他的输入法好?
只是做得比较早而已...
我把话说全,免得总有人乱咬...
搜狗之前是基于词库的,搜狗据我所知做了一个词法分析的数学模型的简单ai进去...
这个技术在当时刚刚成熟...只是他先做出来了而已...
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-
补:本来在上班不想打太多字的
前面也有很多人回答过了,有些人提到了入场时机问题...
我以为可以过来跟个风露个脸就好了..
没想到评论里居然被人嘲讽了...结果还是要打这么一长段...
at20151016 15:45
键盘是英文的,输入要是中文...所以这里面涉及到一个文字的转换问题...
常用中文字有六千多个,键盘只有26个字母...抛去同音字不谈,不可能一个键对应一个字,所以就需要多次敲击键盘来对应一个字...
在计算机发展到我国的初期...大家对这个方案是非常棘手的,可以说没有成熟的应对方案...
于是开辟了两种思路...基于字形和字音...不过解决方案非常的暴力,并且野蛮...
那么汉字输入需要解决什么问题呢?
1,怎么输入...
2,歧义问题...
首先...当时的人们误入一个误区,可能长达近十年吧...
就是...人们觉得,怎么解决打字输入速度问题呢???...少敲键盘嘛...如果我单位时间内敲击键盘数一定,那么我输入文字需要的敲击次数越少,输入越快...
于是五笔和双拼应运而生...
基于字形就是五笔...基于拼音就是双拼...
这两种输入法最大的特点就是输入敲击少...一个按键对应多种意思...
五笔要记字根,双拼要记声母韵母...
我犹记得当年我爸爸拿了一本五笔字根表给我记,记不住就打的情景...(话说我到现在也没解决五笔字根的问题...)
尤其是五笔...真的是划时代的巨坑...
难学难精...除了一些表演节目好像啪啪啪打得很快以外,没卵用...
因为五笔需要经常打字,经常练习,没事就联系拆字...根本就不符合正常人对字的认知...不像拼音,只要你还在正常说话,就不会忘...就能打字...
但是当年拼音输入法相当的疲软...于是给五笔钻了空子...因为五笔只要打2-4下就可以输入文字了,而且基于字形拆分,命中率感觉上比拼音高一点...拼音的同音字是一个绕不过去的坑...
所以在我们需要解决的两大问题上,输入方式问题和命中率问题上,五笔在当年似乎都小胜一筹...
提到的智能ABC就是这个时代标准的全拼解决方案...设计无任何亮点...一五一十的打拼音,打一个字输入一个字...(不要说ABC打词组,ABC的词组是匮乏的)
后来出来一个紫光拼音,算是吧穷苦的普罗大众从五笔的奴役下解救了出来...
其实紫光的解决方案并没有多么先进...
ABC存在的问题是什么...词组的匮乏...
因为当年即手机并不普及,我估计微软也没精力来处理汉语词组的问题,于是随便录入了一些常规的词组了事...
既然ABC武力解决,那么紫光就自己花了大力气解决了词组的问题...
首先,他可以自定义词组,而且词组是配置文件,可以到处传播...
于是在问题一,输入方式没有改进的情况下,紫光将打字命中率提高了几个等级...
一下子风靡起来...
但是紫光也有紫光的问题...
其实从输入原理上,紫光和ABC并没有本质的区别...只是紫光将词库用到了一定的境界...
但是一味的扩大词库也造成了问题...比如说你的词库太大了,打字的时候,拼音打玩了,词库还在搜索呢...而且紫光早期版本的词库匹配模式就是一个字一个字的找...一种野蛮的线性搜索...
好了,终于可以说到搜狗了...
首先说结论...我认为搜狗之所以成功,并没有自己解决很难的东西...
只是刚好科技发展,理论到了一定的程度,厚积薄发,于是应运而生...
但是之前大家没想到,或者有可能有人想到了,但是不屑于去做...
搜狗正好做了,做了以后大家又很喜欢,于是大家突然发现,原来输入法有这么大的市场啊...于是成功了...
这里多扯一点...据说当年QQ呗麻花藤想卖给谁来着...结果买家觉得麻花藤要价太高,这种技术的软件,我随便找几个高级工程师也就做了...于是没成交...最后没办法咯...麻花藤只好自己把QQ包装包装自己经营吧...结果一推出来,大家需求量原来这么高呀,于是成功了...
那你说QQ为什么能成功,真的是代码技术多NB么???
搜狗呢,用了几个技术
1,从紫光那里学来的词库...不过他用词库做了改良,起码不是 野蛮的从上到下顺序搜索一下...所以速度有提升...
2,动态词频...也就是打字经常被选中的词会优先显示出来,这样就可以不翻页命中,优化命中率...不翻页也就减少了按键的次数
3,上下文语义(这个我不太确定,但是应该有),基于词法分析,可以根据你已经打的文字,还有你打的拼音,推测你将打上去的是什么文字...
4.还有一些零零散散的...
而且,他优化命中率优化到一定境界以后,也可以间接减少按键次数...
刚从紫光转搜狗的时候...你有没有这么一种感觉...同一个词组,在紫光上可能你不把拼音打全合适的词组总是不来...而转搜狗以后,可能我打个首字母,词组就出来了...于是间接的,打搜狗按键次数也下滑了...
还有就是网络的应用...紫光的时代,没联网的电脑多了去了...你打字只能自己算...
到了搜狗时代,大家开始联网,于是有一些东西可以云帮着算...
比如说自己本机程序粗算一次,云细算一次,如果没来得及等云呢,结果更美好,等不到云呢,粗算的结果也过得去...
而且大家的电脑配置也跟上来了,输入法不是一个复杂度会急剧上升的需求...比如说CS1.5对战的时代我玩着有棱有角的人物模型,还很卡...但是到现在如果我再去玩CS肯定不卡了,但是我对画质的精细度的需求也上升了...
输入法我个人认为,没有类似于游戏这种随着硬件急剧上升的占资源的需求...所以我认为硬件更迭了以后,输入法有大量以前想象不到的资源来解决一些以前不是没方案但是没资源解决的问题...
所以最后我觉得,搜狗用过的一些东西,有可能有一些高精尖的东西,但是大部分都是现有的一些东西,被他拿来借鉴,应用了过来...
搜狗在当年能想到,将输入法作为一个拳头产品推出来与其他的软件上抗衡,杀出一条血路...而且将这些技术应用到输入法这个产品中...这个创新点是值得讨论和研究的...至于他为什么成功了...因为顺应了时事呗...
其他人为什么没成功...因为其他人在他身后呗,他先进场的...你见过哪个领域,先进场,进完了后进的还有饭吃的...如果输入法界的输入算法没有重大变革或者新的什么技术引入的话,可能未来两三年甚至更长,就是这么个格局了,搜狗占有率就是高,因为人家先进场,而且后进场的也没硬实力去超越它...
注:部分借鉴了<数学之美>吴军著...
共有 0 条评论