讯飞智作

讯飞智作是科大讯飞推出的AI虚拟人与配音平台,提供AI配音、虚拟主播与视频创作功能,音色逼真自然,助力企业高效制作有声内容与数字人视频。

访问官网
讯飞智作

特点

海量音色库

提供数百种专业音色,覆盖男女老少、播音主持、动漫角色等,满足不同场景需求。

多语种支持

支持中英日韩等多国语言及方言,精准发音,助力全球化内容创作与传播。

情感合成引擎

基于深度学习的情感建模,让语音带有喜怒哀乐,表达更加真实自然,富有感染力。

基本信息

讯飞智作
  • 出品方:科大讯飞股份有限公司
  • 英文名称:讯飞智作(iFlytek Voice Studio)
  • 首次发布:2021 年 9 月
  • 产品类型:AI 语音合成与数字人配音平台,支持文生语音、多语种合成、数字人播报
  • 核心能力:多音色选择(超 800 种)、情感语调调节、语速与停顿控制、多语种支持(中英日韩法等)、语音复刻、数字人形象驱动、实时流式合成
  • 最新模型:讯飞智作 V5.0(2025 年,情感表达自然度提升 30%,支持超长文本稳定合成)
  • 音频规格:最高 48kHz 采样率,立体声输出,支持 MP3、WAV、PCM 格式,单次合成文本长度无严格上限

所获荣誉

讯飞智作
  • 国家新一代人工智能开放创新平台:讯飞智作依托科大讯飞在语音合成领域的技术积累,入选科技部“国家新一代人工智能开放创新平台”,成为语音合成领域唯一的国家级平台。
  • 中国专利金奖:基于深度神经网络的语音合成技术获得中国专利金奖,该技术是讯飞智作的核心基础,显著提升了合成语音的自然度和表现力。
  • 世界人工智能大会SAIL奖(卓越人工智能引领者):讯飞智作在2020年世界人工智能大会上荣获SAIL奖,表彰其在人工智能语音合成技术上的突破性创新与大规模产业化应用。
  • 中国电子学会科技进步一等奖:讯飞智作的多语种语音合成系统获得中国电子学会科技进步一等奖,技术覆盖语种超过60种,支持方言、外语及个性化音色定制。
  • 安徽省科学技术一等奖:基于深度学习的端到端语音合成技术获安徽省科学技术一等奖,该技术被应用于讯飞智作平台,实现了高拟人度、低延迟的语音输出。
  • 国家重点研发计划项目支持:讯飞智作承担科技部“智能语音产品评测及认证技术研究”国家重点研发计划项目,在语音合成质量评测标准制定上起到行业引领作用。
  • 数字中国建设峰会“十佳解决方案”:讯飞智作在数字中国建设峰会上获评“十佳解决方案”,其在媒体、教育、金融等场景的语音合成应用获得广泛认可。
  • 中国信通院“可信AI”评估认证:讯飞智作通过中国信通院“可信AI”语音合成能力评估,在合成语音的稳定性、安全性和隐私保护方面达到最高等级。

发展历史

2017

科大讯飞推出“讯飞配音”App,面向普通用户提供基础语音合成服务,支持文本转音频,成为国内最早一批移动端AI配音工具。

2019

“讯飞配音”升级为“讯飞智作”品牌,正式上线PC端网页平台,新增多风格发音人、长文本合成和背景音乐叠加功能,开始服务媒体、出版等专业领域。

2020

讯飞智作2.0版本发布,引入虚拟主播“小晴”,支持基于文本驱动的数字人播报,同时开放API接口,企业用户可批量接入语音合成能力。

2021

平台新增中英文混合发音能力,支持粤语、日语、韩语等多语种合成,并推出“声音复刻”功能,用户只需录制少量语音即可生成个人专属声库。

2022

讯飞智作整合多情感合成模型,提供愤怒、悲伤、快乐等6种情绪参数调节;上线“直播配音”低延迟模式,延迟控制在300毫秒以内,适配实时直播场景。

2023

平台推出“超写实数字人”定制服务,结合面部动作捕捉,实现唇形、表情与语音同步;同时开放“声音商店”,允许用户上传、分享和商用自制声音包。

2024

讯飞智作发布4.0版本,基于星火大模型升级语义理解,支持长篇幅故事、小说类文本的抑扬顿挫合成;企业版新增多账户管理和合成任务工单系统。