苏州奥尔马电子科技有限公司
江苏省苏州市高新区金猫路9号B幢
丁经理
13584892482
13584892482
135848924828
实时语音转写(Real-time ASR),将连续的音频流实时转换成文本,语音识别更快。可应用于直播实时字幕、会议实时记录、即时文本生成等场景。
产品优势
识别速度快
把语言模型,词典和声学模型统一集成为一个大的神经网络,同时在工程上进行了大量的优化,大幅提升解码速度,使识别速度在业内处领先地位
多种识别模式
支持多种实时语音转写模式,如流式一句话、连续和单句模式,灵活适应不同应用场景
定制化服务
可定制特定垂直领域的语言层模型,识别更多专有词汇和行业术语,进一步提高识别准确率
功能特性
智能断句
通过提取上下文相关语义特征,并结合语音特征,智能划分断句及添加标点符号,提升输出文本的可阅读性
中英文混合识别
支持在中文句子识别中可夹带英文字母、数字等,从而实现中、英文以及数字的混合识别
语言支持
支持中文普通话,含带方言口音的普通话识别
即时输出识别结果
连续识别语音流内容,即时输出结果,并可根据上下文语言模型自动校正
自动静音检测
对输入语音流进行静音检测,识别效率和准确率更高
应用场景
直播实时字幕
直播实时字幕
将视频直播或现场直播中的音频实时转为字幕,为观众提供更高效的观会体验,方便对内容进行监控
优势
速度快
实时识别直播语音内容
识别准确
语音识别准确率高
即时文本录入
会议实时记录
将视频或电话会议中的音频实时转为文字,可实时校核、修改及检索转写会议内容,提高会议效率
优势
高效便捷
快速进行会议记录
识别准确
语音识别准确率高
即时文本录入
即时文本录入
手机APP上实时录音并即时提供转写的文本,例如语音输入法等,方便后期文字处理和内容存档,省去记录的人力和时间成本,大幅提升了转换效率
优势
高效便捷
快速记录音频内容
不间断识别
可对大于60秒的长语音数据流不间断识别
帮助文档
开发者资源
API
实时语音转写服务API参考
地区和终端节点
实时语音转写服务当前可服务区域和服务的Endpoint
SDK
通过SDK实现调用实时语音转写服务API