谢谢邀请仅仅个人观点,供参考基于端到端技术的语音识别能力:“知音”引擎的语音识别速度提升3倍,错误率相对下降30%以上单就语音识别来看,根据最新的关于LSTM等论文显示,LSTM一般比DNN相对提升10%左右,端到端的能力,如 LSTM-CTC 架构,百度 早就开放了源代码,也就是说这个技术,一般语音公司都会实现,每家公司都会有自己的一套tricks,不过听说大多都是来源于Google的研究;错误率相对下降30%,这个不敢恭维,速度提升3倍,不知是怎么比较的,是FPGA与GPU对比吗?利用自然语言交互的语音纠错能力用户可以说把“张”改为立早“章”,这个一听就知道用户体验肯定做不上去,因为你需要把所有的badcase收集起来,并且把用户可能的纠错说话都覆盖到,这个可能吗?基于知识图谱技术的行业知识整合能力这个知识图谱,据我所知大部分基于RDF搞的,如百度的知心,搜狗的知立方,还有国外的WordNet, Freebase,NELL等,效果一直比较鸡肋。以前我知道一个部门搞知识图谱,可是最后因为没有找到适合的业务结合点,或是效果不好,很多靠人工,最后被砍掉了。基于多轮对话技术的复杂语义理解能力。语义理解,我一直悲观的认为,在100年以内,机器都没法像人一样理解人说的话那么容易,目前很多种技术的出现,都是解决某某特定领域,或特定场合的问题,根本解决不了随意说的那种!因为人与人对话的规律太难寻觅了,太难以用模型来精确模拟!搜狗搜索日均语音搜索次数增长超过4倍,搜狗手机输入法日均语音输入超过14亿次,目前是国内语音输入功能使用量最大的移动产品。搜狗方面还表示,在语音输入上的准确性上,与科大讯飞大致持平,但领先百度。这点仅仅听听而已吧