AIを使ったASMR制作では、作品全体を一度に生成させるのではなく、企画、台本、収録、編集、検査、公開へ分けます。AIは案の比較や反復作業を支援できますが、聴き心地、演技、権利、最終公開の判断は人が担当します。
全体工程はどう分ける?
| 工程 | AIを使える作業 | 人が判断する作業 |
|---|---|---|
| 企画 | ペルソナ、場面、差別化案 | 誰に何を届けるか |
| 台本 | 構成案、言い換え、矛盾検査 | 演技、間、キャラクター |
| 収録 | テイク整理、メモ補助 | マイク位置、演技、再収録 |
| 編集 | ノイズ候補、区間検出 | 音質、距離感、定位 |
| 公開 | 説明文、告知案 | 権利、規約、最終試聴 |
企画で何を決める?
最初に「誰が、いつ、何のために聴くか」を1文で決めます。眠る前、作業中、短い休憩など、利用場面で必要なテンポや音量が変わります。
AIへ案を出させる場合も、次の条件を先に渡します。
- 想定する聴取時間
- 登場人物と関係性
- 音の中心となる行為
- 使わない表現
- 聴き終わったときの状態
案の数を増やすだけでなく、似た案をまとめ、矛盾や制作コストを比較します。
台本はどう作る?
台本には台詞だけでなく、左右位置、距離、動作、無音、環境音を記録します。
[L / 20cm] 小声で呼びかける
[中央へ移動 / 3秒]
[無音 / 2秒]
[R / 近距離] 次の台詞
AIが作った台詞は、声に出して読むと長さや不自然さが分かります。収録前に読み合わせを行い、息継ぎ、口調、同じ意味の反復を修正します。
AI音声ならSBV2をどう使う?
AI+ASMRでローカルTTSまで比較するなら、SBV2は早めに確認したい候補です。SBV2はStyle-Bert-VITS2の略称として使われることが多く、TTS、つまり文字を音声へ変換する音声合成の制作環境です。公式リポジトリでは、Bert-VITS2を元に発話スタイルを制御しやすくしたものと説明されています。低VRAM・CPU運用・API連携まで含めた判断材料は、SBV2はAI ASMR制作でどう使う?低VRAM・CPU運用・API連携の判断材料で詳しく整理しています。
ただし、SBV2を使う場合も「作品全体をAI音声へ丸投げする」より、次の使い方が現実的です。
- 台本を仮声で読ませ、長すぎる台詞や息継ぎの位置を確認する
- キャラクターの声質や話速の方向性を複数パターンで比べる
- 追加ボイス、案内音声、短い環境演出の試作に使う
- 人の収録前に、左右移動や間の設計を耳で確認する
配布モデルや周辺素材を探す入口としては、BOOTHのSBV2タグ検索を見ると早いです。モデルごとに商用利用、クレジット表記、R18利用、再配布、改変の可否が違うため、購入前に商品ページと同梱規約を確認します。ASMRでは声の近さ、息、ささやき、無音の質感が作品体験に直結するので、生成結果は必ずヘッドホンで通し確認します。
収録で何を確認する?
録音開始前に30秒以上の無音を録り、環境ノイズを確認します。マイク位置とゲインを固定し、テスト台詞を通常・小声・近距離で録ります。
バイノーラルや左右マイクでは、位置だけでなく音量差と質感差も確認します。近づけ過ぎて破裂音や摩擦音が強くなった場合は、後処理だけで直そうとせず再収録を検討します。
編集はどの順序で行う?
- テイクを整理する
- 大きなミスと不要区間を除く
- ノイズを必要最小限で処理する
- 音量と定位を整える
- 無音と間を調整する
- 全体を通して聴く
- 配布形式へ書き出す
Audacityなどの編集ソフトにはノイズ低減や音量調整がありますが、処理を強くすると声の質感が変わります。処理前ファイルを残し、短い区間で比較します。
ジャケットと説明文にAIを使う?
画像生成AIで構図や素材を作る場合は、利用規約、入力素材、人物表現、文字の誤りを確認します。重要なタイトルや価格情報は画像生成へ任せず、デザインソフトで配置すると修正しやすくなります。
説明文はAIで下書きできますが、実際の尺、収録内容、出演者、ファイル形式と一致するかを人が確認します。
公開前チェック
- 冒頭から最後まで通しで再生できる
- 左右チャンネルが意図どおり
- 急な音量変化やクリップがない
- 台本、音声、画像の利用許諾を確認した
- AI利用表示と販売先規約を確認した
- 商品説明と実ファイルが一致する
- 元データと書き出し設定を保存した
AIで短縮できた時間は、最終試聴と修正へ使います。作品の品質を決めるのは生成回数ではなく、聴き手の体験に合わせた判断です。
QUESTIONS
よくある質問
ASMR作品をAIだけで完成できますか?
素材生成は可能でも、距離感、演技、間、権利、誤り、販売先ルールの最終判断が必要です。完全自動化より工程ごとの支援として使う方が安定します。
最初にそろえる機材は何ですか?
静かな収録環境、用途に合うマイク、オーディオインターフェースまたは対応レコーダー、密閉型ヘッドホン、編集ソフトから始めます。
PRIMARY SOURCES
一次情報・出典
この記事の主要な判断は、以下の公式発表・公式文書を基準にしています。
- 01 Audacity Manual Audacity Team/確認日 2026/06/26
- 02 Image generation OpenAI/確認日 2026/06/26
- 03 AIと著作権 文化庁/確認日 2026/06/26
- 04 Style-Bert-VITS2 litagin02/確認日 2026/06/26