2016 - 2024

感恩一路有你

人工智能语音现状 人工智能技术和智能语音技术的区别有哪些?

浏览量:2938 时间:2023-04-30 12:48:41 作者:采采

人工智能技术和智能语音技术的区别有哪些?

智能语音技术是人工智能领域落下时运用最好的技术之一,是普通人外界人工智能的有用窗口。

智能语音仅是语义推测,相对很简单。人工智能真包含智能语音,应用领域总体应用广泛,某个特定领域也更难开发。

人工智能涵盖面的内容很多,智能语音一类AI领域的一个子领域,是可以如果说他们两者是乾坤二卦和被包含的关系

如何解决人工智能的智能语音问题?

因为牵涉到到的问题都很多,我尽量以更通俗语言来具体解释。

智能语音真包含几个层面:1语音合成;2语音识别;3语义识别。

1语音合成

日常生活中更多的见于导航软件、听书软件、银行系统智能语音机器人、上门推销等,将文字是从语音展示出不出来。和语音识别比起,语音合成的技术相对于说来要完全成熟那些,并已又开始大规模行动商用中。

语音合成技术的最的问题在2个方面:

1)文本不规整、词的切分、语法分析和语义分析。

举个例子,“我是人”,这句话真包含“我”,“是”,“人”三个词或词组,主、谓、宾关系清晰,只不过就现有技术水平来说,还需进一步增强,听书软件中,我们经常听了的是匀速运动大声朗读,还没有太很明显的断句和词组切分。

2)缺少情感。

更多的是照念式朗读文章,情绪变化不肯定,很顺耳都很生硬。在有所不同的语境下,语言和文字代表意思已经差别,倒致音量、音色、减弱长短等也有了完全不同。

相对而言,语音识别成熟度比语音识别、语义识别更好,推广和商业化运作程度比较比较好,可是一定程度上还必然不足以,但随着语法分析、语义分析技术的提升,这样,语音合成效果也将是越来越棒。

2语音识别

一句话概括,按照识别和理解过程把语音信号变化为或则的文本或命令的技术。

目前市场通常集中行业,比如说公安、司法(检查院、法院)、边检等,较常见于会议、刑讯、庭审、问过等。同语义理解、语义识别比较好来说,难度介乎二者之间。

语音交互比较多的产品主要有:

1)短语音,主要常见于个人通信,简短精悍交流等场合。

2)长语音,要注意多见于会议记录等。

3)实时语音,要注意作用于在旁边能接收音频数据,在旁边需要提供录音转写结果,都能够动态实时某些和依靠文字信息。

语音识别难点取决于人几个方面:

1)识别准确率。据分析,电视台/广播电台的播音员语音识别率换算下来约80-85%(当然,某些情况下也可能达到90,这里讲的是你算算水平),更别提一般普通人了。

2)环境造成负面影响。诸如车辆、工地、空调、会议噪声等,会对语音识别有都很大的影响。

3)口音差异。各省各地的方言差异较小,必须充足的训练集来训练。

4)互联网时代,新的词语层出不穷,需要定期更新词库。

5)音调、音量、音色、声音持续等,也会对最终造成很大的影响。

总的说来,语音识别效果也可以逐渐优化软件,行业应用中,最好就是变动到最佳状态。

3语义识别

举个通俗的例子来那说明“语音识别”与“语义分析”在人工智能技术层次上的不同:用户对着电视机说一部具体看的电影或者电视剧的全名,电视机会对用户语音通过识别,不自动收索片名、可以播放,这那是“语音识别”可是,如果用户对电视机说“一部爱情片”、“正热播的动作片”、“导演的电影”、“好莱坞大片”等模糊不堪语句,电视机依据什么用户的性别、爱好、平时的点播倾向等特征来进行智能的分析,并参与精准的推荐,这是“语义分析”,在智商上比“语音识别”高了好几个层次,领先对手一大步。

最常见的如智慧家居、车载语音、可穿戴设备、VR、机器人等。

语义识别难点本质几个方面:

1)词序的变化,主谓关系的颠倒或省略。例如港台片中的“我走先”,能够语法中是没有此说法,但是这个叫法现在大家都懂,不过机器一点不懂。

2)语境的影响。

举个生活中的一个例子,女朋友给男朋友打个

女:我在电影院门口等你,晚上7五点半我没有到的话,你等下;

女:我在电影院门口等到你,晚上7点钟你是没有到的话,你等下;

很确实,语境稍有变化,导致的语义几乎有所不同。

我认为,语义识别最难,目前市面上可是有部分产品试用,但还达将近如此大规模正式商用的水平。况且另外一个话题-声纹识别,要注意运用在公安、司法领域,应用于取证和预警等,在今天谈些的范围内。以后有机会再聊。

大家有疑问,也可以私聊我交流探讨。

语音 语义 智能 技术 变化

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。