人工智能语音现状 人工智能技术和智能语音技术的区别有哪些?
人工智能技术和智能语音技术的区别有哪些?
智能语音技术是人工智能领域落下时运用最好的技术之一,是普通人外界人工智能的有用窗口。
智能语音仅是语义推测,相对很简单。人工智能真包含智能语音,应用领域总体应用广泛,某个特定领域也更难开发。
人工智能涵盖面的内容很多,智能语音一类AI领域的一个子领域,是可以如果说他们两者是乾坤二卦和被包含的关系
如何解决人工智能的智能语音问题?
因为牵涉到到的问题都很多,我尽量以更通俗语言来具体解释。
智能语音真包含几个层面:1语音合成;2语音识别;3语义识别。
1语音合成
日常生活中更多的见于导航软件、听书软件、银行系统智能语音机器人、上门推销等,将文字是从语音展示出不出来。和语音识别比起,语音合成的技术相对于说来要完全成熟那些,并已又开始大规模行动商用中。
语音合成技术的最的问题在2个方面:
1)文本不规整、词的切分、语法分析和语义分析。
举个例子,“我是人”,这句话真包含“我”,“是”,“人”三个词或词组,主、谓、宾关系清晰,只不过就现有技术水平来说,还需进一步增强,听书软件中,我们经常听了的是匀速运动大声朗读,还没有太很明显的断句和词组切分。
2)缺少情感。
更多的是照念式朗读文章,情绪变化不肯定,很顺耳都很生硬。在有所不同的语境下,语言和文字代表意思已经差别,倒致音量、音色、减弱长短等也有了完全不同。
相对而言,语音识别成熟度比语音识别、语义识别更好,推广和商业化运作程度比较比较好,可是一定程度上还必然不足以,但随着语法分析、语义分析技术的提升,这样,语音合成效果也将是越来越棒。
2语音识别
一句话概括,按照识别和理解过程把语音信号变化为或则的文本或命令的技术。
目前市场通常集中行业,比如说公安、司法(检查院、法院)、边检等,较常见于会议、刑讯、庭审、问过等。同语义理解、语义识别比较好来说,难度介乎二者之间。
语音交互比较多的产品主要有:
1)短语音,主要常见于个人通信,简短精悍交流等场合。
2)长语音,要注意多见于会议记录等。
3)实时语音,要注意作用于在旁边能接收音频数据,在旁边需要提供录音转写结果,都能够动态实时某些和依靠文字信息。
语音识别难点取决于人几个方面:
1)识别准确率。据分析,电视台/广播电台的播音员语音识别率换算下来约80-85%(当然,某些情况下也可能达到90,这里讲的是你算算水平),更别提一般普通人了。
2)环境造成负面影响。诸如车辆、工地、空调、会议噪声等,会对语音识别有都很大的影响。
3)口音差异。各省各地的方言差异较小,必须充足的训练集来训练。
4)互联网时代,新的词语层出不穷,需要定期更新词库。
5)音调、音量、音色、声音持续等,也会对最终造成很大的影响。
总的说来,语音识别效果也可以逐渐优化软件,行业应用中,最好就是变动到最佳状态。
3语义识别
举个通俗的例子来那说明“语音识别”与“语义分析”在人工智能技术层次上的不同:用户对着电视机说一部具体看的电影或者电视剧的全名,电视机会对用户语音通过识别,不自动收索片名、可以播放,这那是“语音识别”可是,如果用户对电视机说“一部爱情片”、“正热播的动作片”、“导演的电影”、“好莱坞大片”等模糊不堪语句,电视机依据什么用户的性别、爱好、平时的点播倾向等特征来进行智能的分析,并参与精准的推荐,这是“语义分析”,在智商上比“语音识别”高了好几个层次,领先对手一大步。
最常见的如智慧家居、车载语音、可穿戴设备、VR、机器人等。
语义识别难点本质几个方面:
1)词序的变化,主谓关系的颠倒或省略。例如港台片中的“我走先”,能够语法中是没有此说法,但是这个叫法现在大家都懂,不过机器一点不懂。
2)语境的影响。
举个生活中的一个例子,女朋友给男朋友打个
女:我在电影院门口等你,晚上7五点半我没有到的话,你等下;
女:我在电影院门口等到你,晚上7点钟你是没有到的话,你等下;
很确实,语境稍有变化,导致的语义几乎有所不同。
我认为,语义识别最难,目前市面上可是有部分产品试用,但还达将近如此大规模正式商用的水平。况且另外一个话题-声纹识别,要注意运用在公安、司法领域,应用于取证和预警等,在今天谈些的范围内。以后有机会再聊。
大家有疑问,也可以私聊我交流探讨。
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。