第798章 图灵测试(3 / 6)
好书推荐:
诱捕小乖宝,野痞队长强势攻陷
锦鲤团宠:神医萌妃五岁半
九天玄神帝
永志传
少夫人她又穷又抠
帝君重修
开局和天后离婚她反悔了
重生之人族大帝
从紫府圣地开始签到的遮天
乖软妹妹黑化后,哥哥们跪求原谅
因此,国际上的人工智能研究分成了两派。
一派是模仿人的鸟飞派,一派是数据驱动派。
而后者之所以没有迅速发展起来,主要是因为数据获取非常困难。
第一,当时没有机读资料。
第二,很多文学明珠不同版本分散在不同国家,并且其翻译常常不是一一对应。
当然还有很多其它原因就不一一细说了。
但,这个困难在互联网时代被改变了。
它的出现,让研究机构可以轻易获得全球的机读资料。
而且数据量还在随着互联网的发展,每年呈几倍,甚至十几倍的增长。
在庞大的数据支持下,从1994年到2004年的十年里,语音识别的错误率减少了一半。
而机器翻译的准确性提高了一倍。
其中20的贡献来自方法的改进,80来自数据量的提升。
再就是今年2月份,在美国召开的全球机器翻译系统大赛。
鸿蒙和Googe通过数据驱动的方法,取得了50以上的BLEU分数。
比著名的南加州大学、IBM沃森实验室等研究机器翻译几十年的顶尖研究机构领先了5。
而提高这五个百分点在过去需要研究510年的时间。
在到英文的翻译中,鸿蒙的得分比第三名领先了17,同样采用数据驱动方法的Googe比第二名领先了15,这个差距已经超出了一代人的水平。
而鸿蒙和Googe都是成立不超过十年的新公司。
在人工智能研发上的底蕴肯定没有南加州和沃森实验室深厚。
但我们却超过了他们。
原因是我们比他们更优秀吗?