v7以降の仕様変更で“同じプロンプトでも同じ絵柄にならない”のは仕様です。だが、回避策はあります。
「いつものプロンプトなのに、全然違う画風になった」
「キャラクターの顔が一致しない、髪型もバラバラ」
——そんな声が、Midjourneyのv7アップデート以降、特に多く聞かれるようになりました。
結論から言えば、この“スタイル一貫性が壊れる”現象は、v7での仕様変更とアルゴリズム調整によって起きているものであり、ユーザー側の操作ミスではありません。
しかし、公式ドキュメントや一部研究者の分析、海外ユーザーの経験談をもとにすれば、ある程度の再現性を取り戻す方法も存在します。本記事では、問題の背景から具体的な対処法までを、わかりやすく整理していきます。
背景:なぜ同じプロンプトでも“絵柄”が変わるようになったのか?
Midjourney v7の導入により、以下のような根本的な挙動の変化が起きました:
■ ① モデルの基礎ロジックが「写実寄り」に変化
- v7では全体的にリアル傾向の強い絵柄がデフォルト化され、“かわいらしいタッチ”や“水彩風”などが出にくくなったと感じるユーザーが多数。
- 絵柄に含まれる「曖昧さ」「ゆるさ」などがAIにとって「低精度」扱いとなり、勝手に“補正”されてしまう現象が増加。
■ ② プロンプトの解釈方法が再設計された
- 特に
--stylizeパラメータや--style reference (--sref)の処理方法が変更され、同じ数値でも異なるバイアスがかかるように。 - また、style reference画像に対しても “正確すぎる模写”ではなく“抽象的解釈”が優先されるようになった。
■ ③ デフォルト設定での“暴れ”が強くなった
--sw(style weight)や--exp(experimental stylization)の影響が強くなり、「少しの数値違い」で劇的にスタイルが変化するケースが増えた。- これにより、以前のように「汎用プロンプト+画像参照」で安定したキャラ・構図を再現することが難しくなった。
つまり、「壊れた」のではなく、システム側の基準が変わったのです。
解決策1:旧挙動に近づけるための明示的パラメータ調整
■ --sv 4 を使って旧型のstyle参照方式に切り替える
Midjourney公式のstyle referenceガイドによれば、v7では --sv 4 を追加することで、v5〜v6に近いstyle参照モデルを使用可能とされています。
例:
/imagine prompt "girl in watercolor style" --sref https://yourimage.jpg --sv 4
これにより、「突然写実的になった」「漫画タッチが再現できなくなった」といった問題がある程度回避できます。
解決策2:スタイルウェイト(--sw)を丁寧に調整する
新仕様では --sw の影響が非常に大きく、デフォルトのままでは 意図しない“上書き”が起きやすい状態です。
--sw 0:参照画像の影響をゼロに近づける(プロンプト優先)--sw 1000:参照画像の“雰囲気”が強く反映(ただし写実寄りにバイアスされやすい)- おすすめ:
--sw 150〜300あたりから試し、徐々に調整
💡なお、--sw が強すぎると、「表情の硬直」「奇妙な塗り」が発生しやすいので注意。
解決策3:--exp の使用で“創造性と忠実性”のバランスを取る
新導入された --exp(experimental stylization)は、画風のランダム性・創造性の強さを数値化するパラメータです。
--exp 0:できるだけ忠実・リアルに近づける--exp 100:かなりデフォルメや創作性が加わる- デフォルトは
--exp 50程度に相当
絵柄のズレを感じた場合、--exp 30〜--exp 60の範囲で微調整すると、プロンプトに忠実でありつつ、ランダム性を抑えた生成が可能になります。
解決策4:プロンプトの“語彙バランス”を再調整する
v7ではプロンプト内部の形容詞や装飾語の影響度が高まっており、以下のような言葉が過剰に作用するケースがあります:
ultra realistic→ 写実寄りに大きく偏るdramatic lighting→ 明暗差が極端にcinematicやepic→ パースや背景が変化しやすい
これらを使うことでスタイル一貫性が「崩壊」しているケースも多いため、控えめな語彙に置き換える/限定的に使うことが推奨されます。
💡 例:
- imagine "anime girl, ultra realistic, epic, vibrant lighting"
+ imagine "anime girl, soft lighting, pastel colors"
解決策5:キャラクター参照には “2枚以上”の画像を使う
Redditでも多く報告されている通り、1枚の顔画像だけで安定した一貫性を出すのは難しいのが現状です。
Midjourney v7はスタイル・キャラ構造を“抽象的に理解する”ようになっており、複数画像を渡すことでより「平均化された理解」が期待できます。
--cw 10 --cref https://img1.jpg https://img2.jpg
など、同一キャラの異なる角度・表情の画像を併用すると、バラつきが軽減する報告も増えています。
補足:Midjourney公式は“不安定さ”を否定していない
Midjourney公式のアップデート告知では、v7における“変化”について以下のように述べられています:
“This update significantly improves hand and body coherence, but may cause prompts to behave differently than previous versions.”
つまり、“良くなった面もあるが、旧プロンプトは同じ結果を出さない”という前提は公式も認めているのです。
また、--sv や --sw、--exp のようなパラメータは、**元の挙動を完全に復元するためのものではなく、「調整のための道具」**として提供されているに過ぎません。
まとめ:壊れたスタイル再現は、“構造が変わった”前提で再設計しよう
| 現象 | 解釈 | 対応策 |
|---|---|---|
| 同じプロンプトでも違う絵柄になる | モデル仕様の根本変更 | --sv 4 + --swで旧挙動に近づける |
| 顔が安定しない・毎回違う | キャラ解釈が抽象化された | --crefで複数画像参照+語彙調整 |
| 描写が写実に偏る | --expが強すぎる or デフォルト仕様 | --expを30〜50程度に調整 |
| プロンプトの一部で暴れがち | 語彙や装飾語の影響が強い | シンプルな構文へリライト |
🔑 大切なのは「壊れた」と悲しむより、「新しいMidjourneyに適応する構文」を覚えて再構築することです。
創作の再現性は取り戻せます。