语音 AI

灿声-语音识别与交互引擎

实时语音识别/合成，面向业务场景优化

低延迟流式ASR，行业词典增强
TTS 多音色，支持情绪与语速控制
降噪与回声抑制，复杂场景稳定

灿声-语音识别与交互引擎 Banner

能力概览

ASR语音转文字

提供高准确率、低延迟的8K，16K的录音文件识别和实时语音流识别能力。

TTS文字转语音

提供多种超高音质的、多种语言的适用于不同场景的音色。支持SSML参数对输出的声音进行控制。

自学习与热词

提供热词强化接口及语言自学习能力，不断提高不同业务场景下的准确率。

产品体验

您同意我们将您的语音数据用于此功能体验，我们不会将其用于其他用途。

点击下方按钮上传本地音频文件，进行体验

支持常见格式：wav、mp3、m4a 等，小于 10MB

识别结果

空闲

（等待开始识别）

语音合成编辑器

可选音色

音量 1.0x

音调 1.0x

语速 1.0x