
活动专题
时间:2021-03-08 14:53:34 来源:北京捷通华声科技股份有限公司
[内容导读] 灵云智声一体机是捷通华声针对日常办公、演讲汇报、问询审讯、会议记录等多种语音场景设计的高度集成化软硬一体智能产品。
一、适用业务
便携式审讯:针对公安局、检察院、司法局等问讯(询)工作场景,可通过双角色分离麦克风,自动区分问话人、被问话人角色,将双方对话实时转为文字并录音,帮助办案人员快速生成笔录。灵云智声一体机同时支持中-英、汉-维等多种双语互译,自动识别讲话人语言环境并提供翻译,满足跨语种办案需求。
智能会议记录:用于内部办公及案情讨论会,实时采集音频并转写成文字,自动区分发言人,字幕投屏按需选用,会后快速成稿输出会议纪要,并支持音字对照和多维度检索。
业务培训:将发言人讲话实时转为文字并以字幕形式呈现,方便在场人员观看理解。字幕可以灵活叠加在演示文档、视频播放器等多种软件上层,并支持视频会议形式,丰富培训场景展现形式。
日常办公:提供语音输入法功能,解决工作人员打字速度慢、准确率低的问题。用户可以自由选择文本输入位置,灵活适配多种录入场景,例如:长语音录入,填写表单,语音速记等等。
二、核心技术
(一)语音识别
灵云语音识别能力基于深层神经网络技术,相比传统的混合高斯模型+隐马尔科夫模型识别技术,大大提高了识别的准确率和抗噪性能。通过与自然语言理解技术结合使用,能够有效地识别人的语音,分析语音的意图并给出反馈。
1.高识别准确率:16K采样率的预料识别准确度可达98%,传统电话8K采样率训练后,识别准确率可达90%以上。
2.支持多语种方言:支持中文,英文,法语,德语等多个语种识别;支持维、蒙、藏(安多、康巴、卫藏)、彝、朝等少数民族语言识别支持粤语,四川话,上海话,闽南话等多种方言识别,支持中文、英文、数字混合识别的场景。
3.文本后处理:对识别的结果提供自动添加标点符号、智能分段、文本顺滑、数字归一化等后处理功能,满足输入法、会议记录、语音质检分析等各领域的业务需求。
4.专业语音识别模型:自主核心技术,针对行业、企业特点,提供模型训练功能,可根据客户应用场景进行模型的定制训练,迅速提高领域内识别率。
(二)机器翻译
灵云机器翻译技术具有完全自主知识产权,采用深度神经网络算法,结合词嵌入、NER等NLU技术,在Attention方案的基础上,提高了机器翻译的水平,支持中英、中法、中日、中俄、中韩和汉维、汉藏等多语种双向互译。
(三)声纹识别
灵云声纹识别技术可以准确拟合各种环境不同人的高维声纹特征,已在行业内率先取得《移动金融基于声纹识别的安全应用技术规范》认证。
1.多种识别模式:支持文本相关、文本半相关、文本无关的识别模式;
2.语速速度快:一对一识别毫秒级响应,30,000个模型一对多识别时间小于1秒;
3.识别准确率高:文本相关99.5%,文本半相关99.8%,文本无关98.0%;
4.占用资源小:模型占用空间较小,单个声纹模型仅2KB。
三、可解决的问题
1.公安党组会议、工作会议、案件会议等诸多会议,会议发言,自动分角色生成会议记录,大幅减轻人工记录负担,同时支持会议纪要溯源可查。
2.讯问室警务人员与嫌疑人的对话,实时分角色转写,同时支持跨语种环境交流,解决因语言不通带来的交流障碍,有效加速办案进度。
3.外出办案,采用智声一体机进行讯问语音转写,无需联网,本机处理。更加安全、快速地生成笔录文件,缩短办案时间。
四、可复制推广性
灵云智声一体机是捷通华声针对日常办公、演讲汇报、问询审讯、会议记录等多种语音场景设计的高度集成化软硬一体智能产品。软件所调用语音识别、机器翻译、声纹识别等人工智能技术,完全有硬件本身提供运算支撑,开机即用,无需联网,适用于各种办公、办案场景。
责任编辑:广汉
声明:
凡文章来源标注为"智领安平行业网"的文章版权均为本站所有,如需转载请务必注明出处为"智领安平行业网",违反者本网将追究相关法律责任。非本网作品均来自互联网并标明了来源,如出现侵权行为,请立即与我们联系,待核实后,我们将立即删除,并向您致歉。