1本あたりの制作コスト150〜400円($1.2〜$3.0)。美容・健康系のEC企業が、ショート動画の企画から完成までを7工程のAIパイプラインで自動化し、月産100本以上の量産体制を構築した。外注費で1本あたり3万〜5万円かかっていた工程が、100分の1以下のコストで回っている。
💡 この記事の要点(30秒で)
① 状況 = 美容・健康系EC企業、外注¥3-5万/本、月10本限界、トレンド寿命48-72時間に追いつけず
② 設計 = 7工程AIパイプ(トレンド分析→台本→画像生成→TTS音声→Remotion合成→テロップ→品質)+ AI生成80%+実写20%のハイブリッド
③ 成果 = 1本¥150-400円(外注比1/100)、月100本以上、フォロワー10倍、SNS経由EC流入8.3倍、SNS経由売上3.4倍
④ 設計の肝 = 「打席数で勝負」(バズ率8% × 10倍本数)+ 品質チェックリスト+実写との混合
自動化前の状況:1本3万円、月10本が限界
この企業は、TikTokとInstagram Reelsで美容・健康ジャンルのショート動画を配信し、自社ECへの集客を行っていた。動画制作は外注。1本あたりの制作費は3万〜5万円で、月の予算内で制作できるのは10本前後だった。
10本では足りない。
ショート動画のアルゴリズムは「量と頻度」が効く。TikTokの場合、週3本以上の投稿でリーチが安定し、週7本(毎日投稿)でアルゴリズムの優遇を受けやすくなるとされている。月10本では週2-3本がやっと。競合アカウントが毎日投稿している中で、明らかに不利だった。
かといって月30本を外注すれば、制作費だけで月90万〜150万円。売上規模に対して現実的な数字ではない。
もう1つの課題は「スピード」だった。トレンドの寿命は短い。美容・健康ジャンルでは、話題の成分や製品が出てから3日以内にコンテンツを出さないと、旬を逃す。外注の場合、企画出しから納品まで最短でも5営業日。トレンドに乗ること自体が構造的に難しかった。
7工程AIパイプラインのアーキテクチャ
CRIENが設計したのは、1本のショート動画(30〜60秒)を企画から完成まで一気通貫で生成する7工程のパイプラインだ。各工程が独立したモジュールとして動き、途中で人間が介入・差し替えできる設計にしている。
工程1:トレンドリサーチ
Playwrightを使い、TikTokとInstagramのトレンドハッシュタグ、競合アカウントの直近投稿、注目の音源を自動収集する。収集データをLLMに投入し、「今週、このジャンルで伸びそうなテーマ」を5〜10件抽出する。
抽出されるのは、例えば「朝のスキンケアルーティン」「〇〇成分の正しい使い方」「やってはいけない△△」といった切り口。単にトレンドを拾うだけでなく、過去の自社投稿のパフォーマンスデータと照合し、「このアカウントで伸びやすいテーマ」に絞り込んでいる。
このリサーチ工程だけで、人間が手作業でやると1〜2時間かかる。パイプラインでは約3分で完了する。
工程2:台本生成
リサーチ結果をもとに、30〜60秒のショート動画用台本を自動生成する。台本のフォーマットは以下の通り。
• フック(冒頭3秒):視聴者の指を止める一文。「知らないと損する〇〇」「これ、9割の人が間違えてる」等
• 本題(20〜40秒):情報の核心。箇条書き3〜5ポイント
• CTA(最後5秒):フォロー誘導、プロフィールリンクへの導線
プロンプトには、ジャンル特有の制約も組み込んだ。薬機法に抵触する表現の排除、「個人の感想です」注釈の挿入タイミング、競合ブランド名の言及禁止など。これはCS自動化の案件で培ったコンプライアンスフィルタの応用だ。
工程3:画像素材生成
台本の各シーンに対応する画像を生成する。使用したのはFlux Proだ。
美容・健康ジャンルのショート動画では、実写素材が強い。だが、実写撮影は「自動化」の対象外だ。そこで、以下の使い分けルールを設定した。
• 成分解説・比較系:AIイラスト・図解を生成(Flux Pro)
• ルーティン・HowTo系:事前にストック撮影した実写素材を自動選択
• トレンド速報系:テキスト主体+シンプルな背景画像(Flux Pro)
1本あたり5〜8枚の画像が必要で、AI生成の場合は1枚あたり約$0.04〜$0.08。8枚でも$0.64以下。ここが従来の素材購入費(1本あたり数千円)と大きく差がつくポイントだ。
工程4:音声生成
ナレーション音声をTTS(Text-to-Speech)で生成する。1本30〜60秒のナレーションで、コストは約$0.10〜$0.20。
声質はジャンルに合わせて3パターン用意した。「落ち着いた解説トーン」「フレンドリーなトーン」「テンポ重視の早口トーン」。台本のテーマに応じて自動的に声質が選択される仕組みだ。
ぶっちゃけ、TTS音声のクオリティは1年前とは別物になっている。2025年前半まではTTS特有の「ロボット感」が気になったが、2026年時点のモデルは、カジュアルなショート動画であれば違和感なく使えるレベルに達している。
工程5:動画合成(Remotion)
画像素材と音声を組み合わせ、動画ファイルを生成する。ここで使用しているのがRemotionだ。
RemotionはReactベースの動画生成フレームワークで、プログラマブルに動画を組み立てられる。テンプレートをコードで定義しているため、「フックの3秒はズームイン」「本題はスライド切り替え」「CTAはフェードイン」といったモーション指定が、台本の構造から自動的に決まる。
手作業でAfter EffectsやPremiere Proを使う場合、この工程だけで1本あたり30分〜1時間かかる。パイプラインでは約2分。
工程6:テロップ自動挿入
生成された音声から自動で文字起こしし、テロップを挿入する。テロップのスタイル(フォント、色、位置、アニメーション)は、ジャンルとテーマに応じたプリセットから自動選択。
美容系なら白背景にピンクのアクセント、健康系なら緑ベース、といった具合だ。テロップの強調ワード(太字化・色変更する単語)もLLMが台本から自動抽出する。
工程7:最終合成・品質チェック
FFmpegで全素材を最終合成し、品質チェックを自動実行する。チェック項目は以下の通り。
1. 尺チェック:30〜60秒の範囲に収まっているか
2. 音量正規化:ナレーション音量が-14 LUFS前後か
3. テロップ可読性:文字サイズがスマホ表示で読めるサイズか(最小28px)
4. 解像度・アスペクト比:1080x1920(9:16)で出力されているか
5. フック判定:冒頭3秒以内に視覚的インパクトがあるか(画像の変化量で判定)
6. 薬機法チェック:テロップテキストにNGワードが含まれていないか
6項目すべてをパスした動画が「投稿可能」ステータスになる。不合格の場合は、該当工程にフィードバックが戻り、自動で再生成される。
コストの内訳:なぜ1本150〜400円で作れるのか
パイプライン全体のコストを分解する。
| 工程 | 1本あたりコスト |
|---|---|
| トレンドリサーチ | 約$0.05(LLM API) |
| 台本生成 | 約$0.08(LLM API) |
| 画像素材生成 | $0.30〜$0.65(Flux Pro 5-8枚) |
| 音声生成 | $0.10〜$0.20(TTS) |
| 動画合成(Remotion) | $0.15(レンダリング) |
| テロップ挿入 | $0.05(文字起こし+LLM) |
| 最終合成 | 約$0.02(FFmpeg処理) |
| 合計 | $1.2〜$3.0(約150〜400円) |
幅があるのは、画像生成の枚数と音声の長さによる。シンプルなテキスト主体の動画なら$1.2、画像を多用するビジュアル重視の動画で$3.0程度。
外注費3万〜5万円と比較すると、100分の1以下。月100本制作しても、API費用は月1.5万〜4万円に収まる。
Before / After:数字で見る変化
| 指標 | Before | After | 変化 |
|---|---|---|---|
| 月間制作本数 | 10本 | 100本以上 | 10倍以上 |
| 1本あたり制作コスト | 3万〜5万円 | 150〜400円 | 99%削減 |
| 月間制作費 | 30万〜50万円 | 1.5万〜4万円 | 92〜97%削減 |
| 企画〜完成のリードタイム | 5営業日 | 15〜30分 | 99%短縮 |
| 投稿頻度 | 週2〜3本 | 毎日2〜3本 | 5〜7倍 |
| 月間合計再生数 | 約50万回 | 約320万回 | 6.4倍 |
| フォロワー増加率(月間) | +800人 | +3,200人 | 4倍 |
| EC流入数(SNS経由) | 月1,200件 | 月4,800件 | 4倍 |
リードタイムの短縮は、トレンド対応という観点で特に効いた。話題の成分がSNSでバズった当日に関連動画を投稿できるようになり、トレンド初動のリーチを取れるようになった。
再生数が6.4倍になったのは、単に投稿数が増えたからだけではない。トレンドリサーチの精度が上がり、「伸びるテーマ」を選べるようになったことが大きい。100本投稿して、うち10本がバズればアカウント全体が伸びる。この「打席数を増やす」戦略は、ショート動画のアルゴリズム特性に合致している。
品質はどう担保しているか:「安かろう悪かろう」への回答
1本150〜400円と聞くと、「安っぽい動画が量産されるだけでは」と思うかもしれない。実際、初期のテスト段階ではその懸念は当たっていた。
だが、品質を上げたのは「チェックリストの厳格化」と「テンプレートの洗練」だった。
品質チェックの6項目(前述)に加え、人間による抜き取りチェックを週1回実施している。10本をランダム抽出し、以下の基準で評価する。
• 情報の正確性:事実誤認がないか
• ブランドトーンの一貫性:アカウントの世界観と合っているか
• 視聴継続率の予測:冒頭3秒のフックが十分か
週1回の人間チェックで発見された問題点は、即座にテンプレートやプロンプトに反映する。このフィードバックループにより、運用3ヶ月目には「外注動画と遜色ない」レベルに到達した。
ここが落とし穴で、パイプラインを作って終わりではない。最初の1ヶ月は品質が安定しない。2ヶ月目でテンプレートが固まり、3ヶ月目でようやく「回せる」状態になる。この助走期間を理解せずに導入すると、「AIは使えない」という結論に飛びつきがちだ。
技術顧問としての所感
この案件で痛感したのは、「動画制作のコスト構造が根本から変わる」ということだ。
従来、ショート動画の制作費の大半は人件費だった。企画者、撮影者、編集者、ディレクター。最低でも3〜4人が関わり、1本あたり数時間の工数がかかる。それが、AIパイプラインでは「テンプレート設計者」と「品質チェック担当者」の2ロールに集約される。
1本あたりの限界費用が150〜400円になると、コンテンツ戦略の考え方自体が変わる。「この動画は元が取れるか」ではなく、「100本出して、どれがバズるかをデータで見る」というアプローチが可能になる。
正直なところ、すべてのジャンルでこの手法が通用するわけではない。Vlog系やインタビュー系など、人間の存在感が価値の中心にあるコンテンツには向かない。一方で、情報提供型・解説型・比較型のショート動画は、AIパイプラインとの相性が極めて良い。
20社以上の技術顧問を務めてきた経験から言えば、「動画を外注するか内製するか」という二択の時代は終わりつつある。第三の選択肢として「AIパイプラインで量産する」が現実的なオプションになった。ただし、品質のフィードバックループを設計できるかどうかが、成否の分岐点になる。
🏢 CRIEN視点 ── 1本¥400円で月100本のショート動画を回せる仕組みは、中小企業のSNSマーケでも応用可能だ。CRIENの「光速プロダクト開発」では、こうした多段AIパイプラインを4-6週間で構築できる。同じ動画自動化の系譜は レシピ動画の自動生成事例 、AIエージェントチームの設計思想は 10体エージェントによるメディア運用 と Forward Deployed Engineer(FDE)モデル を参照。
FAQ
Q1. AI生成のショート動画は、視聴者にバレますか?
情報提供型の動画であれば、現状ではほぼ気づかれない。ただし、ナレーション音声のTTS品質には差があり、安価なモデルを使うと違和感が出る場合がある。事前にA/Bテストで視聴継続率を比較し、問題がないことを確認してから本格運用に入ることを推奨している。
Q2. TikTokやInstagramの規約上、AI生成コンテンツに問題はありませんか?
2026年5月時点では、AI生成コンテンツの投稿自体は各プラットフォームの利用規約で禁止されていない。ただし、TikTokはAIラベル表示を推奨しており、今後義務化される可能性がある。規約変更には継続的に対応する必要がある。
Q3. 実写素材との組み合わせは可能ですか?
可能。実際にこの案件でも、HowTo系動画では事前にストック撮影した実写素材を組み合わせている。パイプラインの設計上、工程3(画像素材生成)の部分を実写素材の自動選択に切り替えるだけで対応できる。
Q4. 初期構築にどのくらいの費用と期間がかかりますか?
ジャンルとテンプレート数にもよるが、パイプラインの設計・構築に約4〜6週間、費用は初期構築で100〜200万円程度が目安。月間ランニングコスト(API費用+保守)は月5〜10万円。外注費と比較して、3〜4ヶ月で投資回収できるケースが多い。
Q5. 動画の「バズ率」は外注動画と比べてどうですか?
1本あたりのバズ率(再生数1万回超の確率)は、外注動画が約15%、AI生成動画が約8%。単純な確率では外注が上回る。ただし、AI生成は10倍の本数を出せるため、月間のバズ動画の絶対数ではAI生成が大幅に上回る。「打率」より「安打数」で勝負するモデルだ。
AI活用・動画制作自動化のご相談
ショート動画のAI量産パイプラインは、ジャンルとの相性、既存素材の有無、求める品質水準によって設計が変わる。「自社でも使えるのか」「どのくらいのコストで始められるのか」。まずは現状のコンテンツ運用体制をお聞かせいただければ、最適なアーキテクチャと費用感をお伝えする。