联系我们

苏州奥尔马电子科技有限公司

江苏省苏州市高新区金猫路9号B幢

丁经理

13584892482

135848924828

首页天翼云产品正文

【阿里云】实时语音识别

发布者：极豹云发布时间：2022-05-19访问量：353

对不限时长的音频流做实时识别，达到“边说边出文字”的效果，内置智能断句，可提供每句话开始结束时间。可用于视频实时直播字幕、实时会议记录、实时法庭庭审记录、智能语音助手等场景。

如有私有化部署（本地部署软件）需求，及商务问题，请联系：nls_support@service.aliyun.com

产品优势

识别准确率高
国内独创的字级LC-BLSTM/DFSMN-CTC建模，相对业界传统CTC方法降低了20%的错误率，大幅提高了语音识别的精度。

超快的解码速率
国内独创的LFR解码技术，在不损失识别精度的情况下，将解码速率提高了3倍以上，大幅缩短了反馈时间，提升用户体验。

独创的模型优化工具
可以结合模型优化工具子产品，针对特定的领域定制专属模型，最大限度的提升识别效果。

广泛的领域覆盖
广泛应用于教育、金融、互联网、家电、出行、传媒、交通、餐饮、通信、医疗等各行各业。

适用场景
视频实时直播字幕
现场演讲场景、直播场景下，将视频中的音频实时转写成字幕。还可以辅助视频平台进行内容合规治理。

实时会议记录
将会议中的音频实时转换成文字，特别适用于电视会议等远距离场景。

实时法庭庭审记录
将庭审各方在庭审过程中的语音转变为文字，供各方在庭审页面上查看，减少书记员的工作。

实时客服记录

将呼叫中心的语音实时的转写到文字，可实现实时质检、服务风险管理等。

更多产品与服务

录音文件识别
对用户上传的录音文件进行识别，上传完之后24小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。

一句话识别
对时长较短（一分钟以内）的语音进行识别，适用于较短的语音交互场景，如语音搜索、语音指令、语音短消息等，可集成在各类App、智能家电、智能助手等产品中。

语音合成
语音合成服务，通过先进的深度学习技术，将文本转换成自然流畅的语音。目前有多种音色可供选择，并提供调节语速、语调、音量等功能。适用于智能客服、语音交互、文学有声阅读和无障碍播报等场景。

语言模型自学习工具
用户可以自行上传数据，对阿里的语音技术进行深度定制，从而提升特定业务领域的识别准确度。目前仅支持上传文本数据对语言模型进行定制，未来会推出上传音频数据对声学模型进行定制。

联系我们

首页 天翼云产品正文

【阿里云】实时语音识别

首页天翼云产品正文