使用方法

注册与登录

使用讯飞智作的第一步是访问其官方平台 peiyin.xunfei.cn。在页面右上角找到“注册”按钮,输入手机号并获取验证码即可完成账号创建。已有账号的用户直接点击“登录”,支持手机号或邮箱方式。登录后系统会引导进入工作台,所有功能入口均集中在此界面左侧导航栏中。

选择音色与基础参数

进入“在线合成”模块后,首先需要挑选合适的音色。讯飞智作提供了数百种合成声音,包括标准普通话、方言、外语以及不同年龄段和情感风格的声音。点击“试听”按钮可以快速预览效果。选定后,在右侧参数面板中调整语速(0.5~2.0倍)、音调(0~200)和音量。注意,语速与音调会直接影响自然度,建议先使用默认设置,待文本录入后再微调。

文本输入与智能预处理

在文本输入框中粘贴或直接录入需要配音的内容。平台支持最长5000字的单次合成,超出时可分批处理。输入框下方提供“智能分段”功能,系统会根据语义自动拆分长文本,避免合成时出现非自然停顿。对于含有数字、英文或特殊符号的文本,建议开启“数字读法”和“英文读法”选项,例如设置“1234”读作“一千二百三十四”或“一二三四”。此外,多音字支持手动标注:在需要纠正的字后添加拼音(如“行(xíng)”),系统会优先按标注发音。

合成预览与精细调整

点击“开始合成”按钮,几秒后即可听到初步结果。如果对某一段的节奏或重音不满意,可以在“音形调校”面板中通过拖拽波形图来调整局部语速或音调。讯飞智作还提供“停顿插入”功能,在文本中插入“{s}”代表短停、“{l}”代表长停,以控制呼吸感。对于多媒体内容(如视频旁白),可同步调整背景音乐的人声比例,避免人声被掩盖。

音频导出与项目管理

确认合成效果后,点击“下载”按钮,格式支持MP3和WAV。平台默认采样率为44100Hz,码率可选128kbps或192kbps,后者适合对音质要求较高的场景。所有合成记录会保存在“我的作品”列表中,支持重命名、分享链接或重新编辑。如果需要批量生成,可以使用“API接入”功能,在开发者文档中获取密钥后通过代码调用,实现自动化配音流程。

特定场景的实用技巧

用于短视频口播时,建议选择“新闻播报”或“甜美女生”音色,语速调至1.1~1.3倍,并开启“情感增强”模式。制作课程配音则推荐“沉稳男声”,语速保持1.0倍,同时勾选“多音字智能识别”以减少专业术语错误。若文本包含方言词汇(如粤语、四川话),可先切换到对应方言音色再输入文本,系统会自动匹配发音规则。每次修改参数后记得重新合成,平台不支持实时流式预览。所有生成的音频文件均无水印,可放心用于商用项目。