语音 AI
灿声-语音识别与交互引擎
实时语音识别/合成,面向业务场景优化
- 低延迟流式ASR,行业词典增强
- TTS 多音色,支持情绪与语速控制
- 降噪与回声抑制,复杂场景稳定
能力概览
ASR语音转文字
提供高准确率、低延迟的8K,16K的录音文件识别和实时语音流识别能力。
TTS文字转语音
提供多种超高音质的、多种语言的适用于不同场景的音色。支持SSML参数对输出的声音进行控制。
自学习与热词
提供热词强化接口及语言自学习能力,不断提高不同业务场景下的准确率。
产品体验
您同意我们将您的语音数据用于此功能体验,我们不会将其用于其他用途。
点击下方按钮上传本地音频文件,进行体验
支持常见格式:wav、mp3、m4a 等,小于 10MB
点击“开始采集”并对着麦克风讲话,实时识别结果将同步更新
浏览器将请求麦克风权限,请允许访问
识别结果
空闲
(等待开始识别)
语音合成编辑器
可选音色