为什么别人用「喂!字幕」生成的配音那么有感情、那么自然,自己做出来的却像机器人念稿,整段毫无生气?区别不在工具,而在三件事:选对声线、写好稿件、合理运用标点。今次我们新增 4 把真人配音声,并整理由选声到出片的完整工作流,加上写稿小贴士。
认识 4 把新真人配音声
凯婷 / Sora(广东话 女声)

薯条 / Fly(广东话 男声)

小 Q / Xiao Q(普通话 女声)

震东 / Zhen Dong(普通话 男声)

想试听全部 17 把声?前往 文字转语音工作室 即时试听。
由文字到视频:完整配音工作流
只需 3 个决定,便可完成由稿件到成片。
决定 1|选择配音声音
A. 使用自己的声音(真人声音克隆)
上传 30 秒至 3 分钟的声音样本,我们为你生成专属声音模型,往后任何文字都以你自己的声线输出。最适合个人品牌、长期 YouTuber、podcaster。详情参阅 真人声音克隆完全指南 或直接 试用真人声音克隆。
B. 直接选用专业声音
今次新增的 4 把声,加上既有的 13 把,合共 17 把专业配音声,涵盖广东话、普通话、英语、日语。即选即用,无需训练。
决定 2|选择输出格式
A. 文字转语音(.mp3 音频)
纯音频输出,自己准备画面(vlog、b-roll、教学示范),将音频拖入 Premiere、Final Cut 或剪映即可。
B. 文字转视频(.mp4 视频)
我们自动为你配上字幕及视觉背景,输出可直接上传的成品视频,最适合短片、社交媒体 reel。可参考 用文字转视频讲鬼故事的真实体验。
决定 3|应用场景
- Podcast 声档
- YouTube voice-over(旁白/b-roll 配音)
- 教学视频
- 广告及品牌短片
重点:以上场景无需对嘴——配音直接 layer 在画面之上,并非 talking head 视频,因此完全胜任。
为何不自己录音?
| 自己录音 | Hey Subtitle AI 真人配音 |
|---|---|
| 忘词、撞音、喉咙哑 | 一次成功,没有 NG |
| 改稿要重录 | 改字即时重新生成 |
| 后期要剪掉「嗯」「啊」 | 不需要 |
| 需要话筒、安静环境、时间 | 一台电脑即可 |
| 录多次容易疲倦 | 零情绪消耗 |
写稿小贴士:令配音讲话有感情
真人配音并非 plug-and-play 一次成功——每把声都有自己的性格和节奏,懂得写稿才能发挥全部潜力。
标点符号是情绪开关
逗号(,)控制停顿、句号(。)给予喘息、问号(?)令尾音上扬、感叹号(!)强调语气、波浪号(~)带出娇嗲。同一句话加不同标点,读出来完全不同感觉。
适当空格控制节奏
广东话、普通话本来没有词间空格的书写习惯,但配音引擎会将空格视为轻微停顿的信号。在重点词前后加空格,可以突出重要信息。
分段触发深呼吸
长段落分行断段,配音引擎会自动加入深呼吸停顿,整段话听起来更自然。
对比示范
- 平淡版:今日天气很好我们去爬山
- 加标点版:今日天气很好,我们去爬山!
- 进阶版:今日天气~很好啊!我们……去爬山!
我们提供免费分钟额度,鼓励你多写几个版本对比,选最自然的版本作为定稿。每多尝试一次,你会更了解每把声的性格。
