提供数百种专业音色,覆盖男女老少、播音主持、动漫角色等,满足不同场景需求。
支持中英日韩等多国语言及方言,精准发音,助力全球化内容创作与传播。
基于深度学习的情感建模,让语音带有喜怒哀乐,表达更加真实自然,富有感染力。
科大讯飞推出“讯飞配音”App,面向普通用户提供基础语音合成服务,支持文本转音频,成为国内最早一批移动端AI配音工具。
“讯飞配音”升级为“讯飞智作”品牌,正式上线PC端网页平台,新增多风格发音人、长文本合成和背景音乐叠加功能,开始服务媒体、出版等专业领域。
讯飞智作2.0版本发布,引入虚拟主播“小晴”,支持基于文本驱动的数字人播报,同时开放API接口,企业用户可批量接入语音合成能力。
平台新增中英文混合发音能力,支持粤语、日语、韩语等多语种合成,并推出“声音复刻”功能,用户只需录制少量语音即可生成个人专属声库。
讯飞智作整合多情感合成模型,提供愤怒、悲伤、快乐等6种情绪参数调节;上线“直播配音”低延迟模式,延迟控制在300毫秒以内,适配实时直播场景。
平台推出“超写实数字人”定制服务,结合面部动作捕捉,实现唇形、表情与语音同步;同时开放“声音商店”,允许用户上传、分享和商用自制声音包。
讯飞智作发布4.0版本,基于星火大模型升级语义理解,支持长篇幅故事、小说类文本的抑扬顿挫合成;企业版新增多账户管理和合成任务工单系统。