2016 - 2024

感恩一路有你

搜狗怎么翻译别人说的话 搜狗语音实时翻译技术是如何实现的?

浏览量:3492 时间:2023-04-26 23:16:17 作者:采采

搜狗语音实时翻译技术是如何实现的?

齐鲁晚报11月23日讯:在语音实时翻译这件事上,搜狗先一步实现了历史性进阶,质量全都至少专业同声传译水平。11月17日,在乌镇北京举办的第三届世界互联网大会上,搜狗CEO发表文章题为《人工智能的未来之路》的演讲时,其中文讲话内容在实时动态语音识别的基础上,同步汉语翻译为英文并上屏显示,引起了全场嘉宾的轰动。

语音识别机器翻译迭代的背后

语音识别在过去一直都是科幻小说的较常见场景,哪怕在大多数领域,科幻作家的想象力远不如达到现实。语音识别则是少见的例外,其独特性不单是而且其飞快得到出手不凡成果,更只不过其背后有大量值得去爱挖据的领域,其中就中有令人生畏的实时翻译。

从概念上来看,语音识别是让机器实际识别和理解过程把语音信号变为相应的文本或命令的高技术。在这一领域,搜狗其实也有了5年的积累,早在2011年便结束不断深耕语音识别的搜狗,借用其独天的条件:大量的数据资源、庞然的用户量,这些领先对手的算法,目前搜狗拼音语音识别准确率已最多97%,识别速度提升了400字每分钟。技术进步下良好的用户体验,也给予了用户使用量的提升,输入法第三季度财报总是显示,搜狗输入法的语音输入日频次比一年前增长几倍多,单日客流语音只是请求已突破1.9亿次。

而机器翻译则是依靠计算机将一种自然语言(源语言)转换的为另一种自然语言(目标语言)的过程。实际上,搜狗输入法在6.8正式版中就再推出了在线翻译的功能,解决了日常注意输入输入中输入输入英文的问题。

在今年夏天的奇点大会上,王小川2002年演示了搜狗的实时语音识别技术,将演讲内容歌词同步识别为文字,在屏幕中总是显示出来,并在8月3日正式地对外发布搜狗输入法知音引擎,三个月之后世界互联网大会上,搜狗知音引擎再推新功能,在识别演讲内容的同时参与实时翻译。

但是,大多数人都可不知道这些突破从本质上说都是同样的突破。它们均是从一种名为深度神经网络的人工智能(AI)技术来实现。

深度神经网络最值得注意的地方是,没有人编制人员出计算机来负责执行上列的任何技术功能。要知道,没有人能做到这一点。因为则是,编程人员给计算机核心中怎么学习算法,给它能提供海量的数据(如大量的语音样本),由此对其采取进行训练,让它让其理解如何能去能识别物体、单词或则句子。简单说来,这种计算机有自学能力,超过用软件自己编写软件。

神经网络不是他新概念。该概念可追朔到1950年代,而许多最重要的算法晋阶是又出现在上世纪末。类似于当时,如今的人工智能研究者再一次是可以同样的用来极为强大的计算性能和海量的数据(密布于互联网的图像、视频、音频和文本文件),这两点是对神经网络的良好运作不可缺少,目前,搜狗输入法PC

端用户渗透率在排名第一,无线网络领域排名如何所有应用形式的第三位,其中第一、第二四个为腾讯的和另外搜狗搜索目前在PC

端排名第三,移动端早就缓慢上升到第二。在强大的计算性能和海量数据方面,搜狗拼音有着十分难得的优势。正如业内人士所评价,“这是搜狗深度学习的寒武纪生命大爆发。”

“机器同传”的突破与创举

由两名到三名译员轮换进行不打断讲话者听他说话的情况下的歌词同步翻译,与会嘉宾同时经常佩戴同传耳机,已成了规模很大研讨会和国际会议的标配。但,人在通过同声传译时,受限于记忆力、听他们说速度有限等因素,修真者的存在丢失的细节汉语翻译、翻译的结果没能立马转成文字等缺点,此外而时间没限制和领域特殊性,汉语翻译质量也会大大减,同样同声传译人员的费用也的很高,所以如何导入机器通过自动启动语音实时语音翻译也是科研研究只是希望攻破的难题。

在这次世界互联网大会上,也为嘉宾都会配备了同声传译和同传耳机,不过当王小川说到“搜索的未来是人工智能时代的皇冠”时,屏幕上实时展示出了语音识别的中文和“In he future,searchwill betheCrownof theAI

Era”……在王小川的演讲中,机器还能够随着语句的逐渐地求完整,根据语义自动修改调整之前无法识别的内容,斯坦福大学杰瑞·卡普兰教授等外宾们纷纷取下了同传耳机,正在感觉得到这不寻常的“机器同传”。

这是全球数月前基于组件神经网络的实时机器翻译技术在大型活动上的展示,从现场演示效果来看,搜狗语音识别准确率已将近97%,机器翻译准确率达90%,已接近人类同传翻译结果。

为啥会是搜狗简单的方法实现方法了这一重大突破?据介绍,输入法机器翻译凝炼了业界再次领先的端到端神经机器翻译技术包括实现实例的翻译技术,建议使用的端到端神经网络翻译模型编码端查看源端句子的分布式表示,依靠注意力模型聚焦源端,使用循环神经网络生成翻译结果,汉语翻译的结果比民间机器翻译极其不卡,效果更好。在近期人工多评测中,搜狗机器翻译在演讲、旅游、聊着天、日常口语等领域,采用五分制毛石混凝土评分能提升到4.4分,走进实用化。

搜狗拼音在人工智能上较深的技术积累,根源上不如作为一个搜索公司对技术的各方面应用方法不以为然关系。无论大数据的运用,我还是对深度学习(深度神经网路)的应用,都远超其他休闲的公司。事实上Google早就将自己的未来定义成了一家人工智能和机器学习公司,在未来,技术走很远,搜狗的业务就到底能走多远。

此外,传承文化、促进组织讲解,打乱语言对人们沟通交流所会造成的障碍或壁垒确实是搜狗向来的使命。从数据来看,目前全球有50%的互联网内容是英语,但仅有20%的人掌握到英语技能。就算是目前的智能翻译系统只包含8种语言,也覆盖了全球33%的人口。

可以说,搜狗输入法长期不断深耕技术和产品所积累知识的海量数据包括在人工智能技术上的沉淀都为语音实时翻译技术的成功奠定了良好基础。搜狗输入法语音实时翻译技术设计和实现大数据和深度学习,涵盖面了搜狗自主研发的语音识别、机器翻译两项不重要技术,搜狗语音实时翻译代表着这两大技术在实时性和实用性上迈出一步了会增大的三步,并且高效率的加强了起来。

据介绍,在实时性上面,中文结果实时显示,搜狗的准确率和响应速度稳居第一行业首位,实时自动反映英文的结果理想的将服务器延迟再控制在了2秒以内。在标准的普通话度方面,搜狗拼音语音翻译区分设计和实现语义的断句模型来断句,断句更加合算,英译中结果更加求下载和不卡。在态度力上面,搜狗语音实时翻译技术网络同步会显示听写的中文结果和翻译的英文结果,既也可以通过屏幕不显示展示给观众,也这个可以按照手机软件邮箱里给观众。报告结束后可立玄能生成双语编号演讲文稿,更方便后续整理好和报道。

对此实时翻译的未来,输入法另外很多工作要做,只不过搜狗拼音语音实时翻译华指着一个必然里程碑。继续前行,输入一系列优化系统语音实时翻译的性能和效果,给予极其惊艳的机器同传产品。甚至于,从语音识别走到能生成再到思维决策,在技术变化生活的道路上,搜狗还会创造出新的更多的奇迹。

劈手点个好看呗~(≧▽≦)/~

手机搜狗输入法的工具栏中怎么没有中英互译?

有啊,再点击输入框自动弹出搜狗拼音输入法键盘,刚刚进入搜狗输入法工具栏最左边的图标,再次进入加号,再添加中英互译。

语音 技术 翻译 搜狗 机器

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。