你以为这是一段影片,其实只是一段文字。
关灯。戴上耳机。
「嗰种感觉,好似有人企喺你后面⋯⋯但你唔敢转头。」
十秒内,你已经开始紧张。
你看到走廊尽头有影,你听到脚步声贴近,但你明明知道——你只系喺睇一条 YouTube 片。
但其实,连「视频」都唔存在。
——呢三条《废墟探险 撞鬼合集》,全部由一段粤语文字稿生成出嚟。
这次我们邀请了香港废墟探险家 HK Urbexman,分享他最深刻的三个灵异经历。
但条件只有一个:
唔准补拍,唔准重返现场。
他只交出三段文字。
然后,我们用 Hey Subtitle——将文字变成声音、变成画面、变成一条完整视频。
结果,就是你而家见到的三集。
《一》湾仔巴士大王大宅——无头灵体
故事原文摘段
> 「嗰种感觉,好似有人企喺你后面⋯⋯但你唔敢转头。」
> 「剪片剪到呢一段嘅时候,我开始头痛,越睇越唔舒服。」
为什么这组合会令你惊
- 封面构图:昏暗走廊、尽头白色鬼影、窗光斜射、红地毯——一张图已经建立了「豪宅古典撞鬼」的氛围
- 粤语声线:「有人企喺你后面」这种句子,用普通话读就断了力;粤语声线保留语感,一句话就入心
- 节奏停顿:文字里的停顿标记,在「但你⋯⋯唔敢转头」中间制造呼吸感,纯文字读者感受不到
当画面、声音、停顿三者同步,观众不是「看到鬼」——观众是代入了主角。
《二》大屿山荒废会所——守候的狗灵
故事原文摘段
> 「佢已经死咗好耐,身体干晒,四肢伸直,个头侧向门口,好似一路都喺度等紧人返嚟。」
> 「我望住佢,心入面突然浮起一个念头——『佢其实⋯⋯仲喺度。』」
为什么这组合会令你惊
- 封面构图:破旧红地毯会所、污渍斑斑旧沙发、由狗身升起的烟气、散落烂布同花瓣——一张图就读到「这只狗还在」
- 粤语声线:「佢其实⋯⋯仲喺度」这种语气,只有粤语读出来才带那种「半哀伤半诡异」的质感
- 画面的独特感:动物灵的氛围,手机实拍根本做不出来。生成一张「介乎哀伤同惊栗之间」的氛围图,再让文字转视频把它和旁白同步
结果:观众不是怕狗,而是怕「留恋」本身。
《三》香港地底防空洞——多出来的脚步声
故事原文摘段
> 「我停,佢又停。我行快,佢都行快。」
> 「电筒照到嘅——只系一条空嘅通道。冇人。但脚步声,仲喺度。」
为什么这组合会令你惊
- 封面构图:潮湿混凝土走廊、主角拎电筒、天花板隐约有黑影手爪垂落——废墟观众一看就识读
- 粤语声线:这集的恐怖完全靠声音——「多一对嘅脚步声」。声线读到「我停,佢又停」,同步感拿捏到位就成立
- 第一人称视角:画面可以重现「电筒光照住无尽头通道」的代入感,配合旁白,观众感觉自己也在那条通道
文字转视频在这一集做了一件实拍根本做不到的事:把声音变成主角。
为什么文字转视频令文字变得如此强大
把这三集拆开看,文字转视频做对了四件事:
一、声音是灵魂
同一句话,机械普通话声线读出来是信息,粤语声线读出来是气氛。Hey Subtitle 的粤语声线保留语感——停顿、语气、节奏——这是纯文字和静态图都做不到的。
二、画面补足现场
「那个房间我不敢再进去」「那个防空洞太危险不能回去」——但观众需要视觉才会代入。你可以上传一张自己生成的氛围图做背景,没有素材也可以有画面。
三、停顿制造悬念
在「⋯⋯但系——冇人」这种关键位放一个呼吸,张力直接翻倍。纯文字读者自己读感受不到。
四、三者同步
画面、声线、停顿——三者在同一个时间轴上合奏。这是文字转视频比「配音加剪片」更强大的地方:不需要你懂剪片,文字节奏自动带动视觉节奏。
怎样做到?四步
- 贴上粤语原稿——直接用口语,不需转书面语
- 选声线——男声/女声,可用情感标记带动气氛
- 选背景——默认背景(Hey Subtitle 内建)或自定义上传(上传自己生成的氛围图,支持 JPG/PNG/HEIC/WEBP)
- 一键输出——同时产出视频同音频文件,直接上 YouTube Shorts、IG Reels、TikTok
总结
你以为「有故事但冇素材」的经历,只能用文字讲。
但文字、画面、粤语声线三者合一那一刻,观众的毛管会竖起。这不是剪片,这是重现。
三集《撞鬼合集》是示范。你的故事,可能比这更值得被重现。
立即试文字转视频 →(注册即送 15 分钟,每月再送 5 分钟)
