Wan 2.5 モデルについて
Wan 2.5 は 2025 年にリリースされた最新のマルチモーダル生成モデルで、映画クラスのAI動画と音声制作に特化しています。アリババのチームによる独立した映像・音声生成モデルで、Qwen シリーズとは別ラインです。
ネイティブ1080p HD出力と10秒のシネマ品質動画を実現し、複数話者のセリフ、シーン効果音、BGM まで同期生成します。対話的なピクセルレベルの画像編集、音源ドリブン生成、高度なカメラ(パン・ズーム・フォーカス)制御、豊かな表情描写により没入感あるストーリーテリングを可能にします。
1080p シネマ品質
ネイティブ1080p HD出力と同期した音声生成で本物の映画品質
音声と映像の完全同期
複数話者の会話、シーン効果音、BGM を映像にぴったり同期
会話型画像編集
自然言語でピクセルレベルの精密編集、効率的な制作を実現
音源ドリブン生成
音楽や音声をアップロードし、リズムとプロンプトに合わせて映像を同期生成
高度なカメラ制御
パン・ズーム・フォーカスを内蔵し、複雑なカメラワークも自在
緻密なキャラクター描写
表情・微表情・動きを精緻に描き、リアルな感情表現を実現
基本の Wan 2.5 プロンプト構成
一貫した高品質の結果を得るための基本を習得。プロ品質を引き出す効果的な構成方法を学びます。
主題を明確に定義:外見・年齢・衣装・特徴を具体的に
動きを描く動詞を使い、より魅力的な動画にする
時間帯・天候・雰囲気など環境を描写してシーンを設定
ビーチでの追いかけっこ
雨の街で踊るダンサー
アクションを制御するプロンプト
明確な動作描写でAIに意図を伝え、シンプルから複雑な動きまで自在に操る。
複雑な動作は段階に分けて記述
「次に」「その後」など時系列の接続語を活用
動きは論理的かつ物理的に成立するように記述
カフェでの一連の動作
ストリートバンドの演奏
Wan 2.5 プロンプトでカメラを操る
角度・動き・シネマティックなショットをプロンプトで指示。プロレベルの撮影表現を身につけましょう。
ロー・ハイ・アイレベルなど角度を指定して視点とムードを調整
ドリー・パン・トラッキングなど動きのキーワードでダイナミックに
クローズアップ・ワイド・ミディアムなどショット種で構図を制御
山道を追うバイクのトラッキング
森林の空撮パノラマ
美学をコントロール
シーンを詳細に描き、雰囲気を自然言語で指定することで全体の美的トーンを操作。ジャンル指定から創造的な効果まで、Wan 2.5 の芸術性を引き出します。
「ドキュメンタリー」「SF映画」「アニメ」などジャンル名を使う
「夢のよう」「ミステリアス」「壮大」「居心地よい」など雰囲気語でムードを表現
物理的に不可能な状況も大胆に記述—AIが創造性を形にします
ヨーロッパのアート系映画風のカップル
ヴィンテージな街角の音楽家
ビジュアルスタイルを操る
光・ムード・カラーグレーディングをプロンプトで細かく指定。望むビジュアルを手に入れましょう。
光の質(柔らかい・ドラマチック・自然光)を記述して雰囲気を決定
「ミステリアス」「温かい」「エネルギッシュ」などムード語で感情トーンを誘導
「シネマティック」「ビビッド」「脱彩色」などグレーディングを指定して統一感を出す
東京のサイバーパンクな雨夜
熱帯雨林の滝
Wan 2.5 プロンプトのベストプラクティス
プロ品質のAI動画を作るための必須ガイドライン
具体的かつ詳細に。曖昧なプロンプトは結果も不安定。被写体・動き・環境を明確に。
ドリーショット、ボケ、三点照明など映画用語を使うと制御性が向上。
まずはロングショットで状況を示し、次にクローズアップへ。自然な流れと物語性が生まれる。
シーケンス全体で光・色調・スタイルの一貫性を保ち、プロらしい仕上がりに。
夜明け・正午・黄昏・夜など時間帯を指定して適切な光と雰囲気を誘導。
複数の言い回しを試して最適解を探す。微妙な表現差が結果を大きく左右します。