ブログに戻る
テキストから動画で怪談を語った実体験|Hey Subtitle 広東語 AI 検証
アップデート2026-04-18

テキストから動画で怪談を語った実体験|Hey Subtitle 広東語 AI 検証

これは動画だと思ったでしょう。実はただのテキストです。

電気を消して。ヘッドフォンをつけて。

「なんだか、背後に誰かが立っているような……でも、振り向けない。」

10秒も経たないうちに、あなたはもう緊張している。

廊下の奥に影が見え、足音が近づいてくる音が聞こえる——でもあなたは知っている、これはただの YouTube Shorts だと。

でも実は、「動画」すら存在しない。

——この3本の『廃墟探検 心霊アンソロジー』、すべて一段の広東語テキスト原稿から生成されたもの。


今回、香港の廃墟探検家 HK Urbexman を招き、最も忘れがたい3つの心霊体験を語ってもらいました。

条件はただ一つ:

再撮影禁止。現場への再訪も禁止。

彼は3段のテキストだけを渡してくれた。

そして私たちは Hey Subtitle を使い——テキストを音声に、画面に、一本の完成した動画に変えた。

その結果が、下の3エピソードです。


第1話:湾仔「バス王」豪邸——首のない霊体

物語の原文抜粋

> 「なんだか、背後に誰かが立っているような……でも、振り向けない。」

> 「この部分を編集しているとき、頭痛がしてきて、見れば見るほど気分が悪くなった。」

なぜこの組み合わせで怖くなるのか

  • カバー構図:薄暗い廊下、奥に白い幽霊の影、窓から差し込む光、赤い絨毯——1枚の画像だけで「古典的な豪邸怪談」の雰囲気が確立する
  • 広東語の声:「背後に誰かが立っている」という一文は、標準中国語で読むと迫力が弱まる;広東語の声は語感を保ち、一言で胸に刺さる
  • リズムの間:テキスト中のポーズマーカーが「でも……振り向けない」の間に呼吸感を作る——テキストを黙読する読者には感じ取れない

画面、音、間が同期したとき、視聴者は「幽霊を見ている」のではなく、主人公に没入している


第2話:ランタオ島の廃クラブ——守り続ける犬の霊

物語の原文抜粋

> 「もう長い間死んでいて、体は乾ききり、四肢は伸び、頭はドアの方を向いていた——ずっと主人を待っているかのように。」

> 「私はそれを見つめた。そして心の中に突然浮かんだ想い——『彼、まだ……ここにいる。』」

なぜこの組み合わせで怖くなるのか

  • カバー構図:古びた赤い絨毯のクラブ、シミだらけの革ソファ、犬の体から立ち上る煙、散らばった布と花びら——1枚で「この犬はまだここにいる」と読み取れる
  • 広東語の声:「彼、まだ……ここにいる」という語り口は、広東語で読んで初めて「哀しみ半分、不気味さ半分」の質感が出る
  • 画像の独特さ:動物霊の雰囲気は、スマホ実写では絶対に再現できない。「哀しみと戦慄の間」の雰囲気画像を生成し、テキストから動画がそれをナレーションと同期させる

結果、視聴者が怖いのは犬ではない。怖いのは「執着」そのもの


第3話:香港の地下防空壕——もう一組の足音

物語の原文抜粋

> 「私が止まると、それも止まる。私が速く歩くと、それも速く歩く。」

> 「懐中電灯が照らしたのは——ただの空の通路。誰もいない。でも足音は、まだ続いている。」

なぜこの組み合わせで怖くなるのか

  • カバー構図:湿ったコンクリートの通路、懐中電灯を持つ主人公、天井から垂れる黒い影の手——廃墟ファンなら一目で読み取れる
  • 広東語の声:このエピソードの恐怖は完全に音に依存する——「もう一組の足音」。「私が止まると、それも止まる」を声で同期させることが鍵
  • 一人称視点:画面は「懐中電灯の光が果てしない通路を照らす」没入感を再現できる——ナレーションと合わせ、視聴者は自分自身がその通路にいると感じる

このエピソードでテキストから動画は、実写では絶対にできないことを成し遂げた:音を主人公にすること


なぜテキストから動画はテキストをこれほど強力にするのか

3エピソードを分解すると、テキストから動画が正しくやっていることは4つ:

一、声が魂である

同じ一文でも、機械的な標準中国語 TTS で読むと情報になる;広東語の声で読むと雰囲気になる。Hey Subtitle の広東語の声は語感——間、口調、リズム——を保ち、これはテキストと静止画では届かない領域。

二、画像が現場を補う

「あの部屋にはもう入れない」「あの防空壕は危険すぎて戻れない」——しかし視聴者は視覚がないと没入できない。自分で生成した雰囲気画像を背景にアップロードすれば、素材がなくても画面が成立する。

三、間が緊張を生む

「……でも——誰もいない」のような重要な位置に呼吸を置くと、緊張感が倍増する。テキストを黙読する読者には感じ取れない。

四、三者同期

画面の切替、声の抑揚、間——3つが同じタイムライン上で合奏する。これがテキストから動画が「吹替+編集」を超える点:編集スキルがなくても、テキストのリズムが自動的に映像のリズムを引っ張る。


方法は?4ステップ

  1. 広東語原稿を貼り付け——口語のままで OK、書面語に変換する必要なし
  2. 声を選ぶ——男声/女声、感情タグで雰囲気を演出可能
  3. 背景を選ぶ——既定の背景(Hey Subtitle 内蔵)またはカスタムアップロード(自分で生成した雰囲気画像、JPG/PNG/HEIC/WEBP 対応)
  4. ワンクリック出力——動画と音声ファイルを同時に生成、YouTube Shorts・IG Reels・TikTok に直接アップロード可能

まとめ

「物語はあるが素材がない」体験は、テキストでしか語れないと思っていたでしょう。

しかしテキスト・画像・広東語の声が三位一体になった瞬間、視聴者の鳥肌が立つ。これは編集ではない、再現である。

『心霊アンソロジー』3エピソードはデモに過ぎない。あなた自身の物語は、もっと再現する価値があるかもしれない。

今すぐテキストから動画を試す →(登録時に 15 分無料、毎月さらに 5 分無料)