目次>
Stable Diffusionは、AI画像生成を行う際に活用できます。世界的に見ても、急成長を遂げているオープンソースのAIプラットフォームです。リアルな画像を得意としているので、ポートレート写真のような画像を作りたい、リアルな風景画像を生成したいといった場合におすすめです。当記事では、Stable Diffusionの概要や使い方、口コミなどを紹介しているため、ぜひ参考にしてみてください。
Stable Diffusionとは?
Stable Diffusionがいったいどのようなものか知りたいと思っている人もいるでしょう。そこでまずは、Stable Diffusionの特徴や手掛けている企業について解説します。
Stable Diffusion の特徴
Stable Diffusionは、短いプロンプトを用いてAIが自動的に画像を作成してくれるものです。画像生成機能が大幅に向上しているため、ポートレートのような画像を生成した場合の違和感も少なく仕上がります。二次元のようなイラストではなく、よりリアルなビジュアルを求めたい場合におすすめです。
Stable Diffusionを活用することで、画像内を編集するインペインティングや元の画像の外側に画像を拡張するアウトペインティングといった拡張機能も使えるようになります。また、「Image-to-image」というプロンプトを使うと、元となる画像を使って新たな画像を生み出すことも可能です。
Stable Diffusion を手掛けている企業
Stable Diffusion を手掛けているのは、Stability AIという企業です。2021年にAIに関する取り組みをスタートし、14万人を超える開発者コミュニティを有し、研究のハブは世界各地に7ヶ所あります。言語やオーディオ、バイオテクノロジーなどに関するAIモデルの開発を行っています。
地域社会などと協力しながら多くのことを成し遂げようとしている企業です。新たなアイディアを生み出すための方法も模索しています。信頼してもらえるように透明性にも配慮しているため、安心してサービスを利用できるでしょう。
Stable Diffusion WebUIの推奨スペックは?
Stable Diffusion WebUIは、無料で利用できます。NMKD Stable Diffusion GUIやStable Diffusion automatic1111 WebUIなどがあります。特に人気なのは、Stable Diffusion automatic1111 WebUIなので、使っている人が多いです。
Stable Diffusion WebUIを使うには、デスクトップPCでGPUはNVDIA製の12GB以上、ディスク用要は80GB以上がおすすめです。Windowsのバージョンは64bitですが、最近は基本スペックとなっているのでよほど古いパソコンを使用しない限りは問題なく動作するでしょう。
Stable Diffusion WebUIのインストール方法
続いては、Stable Diffusion WebUIのインストール方法について解説していきます。ここでは、自分のパソコンにインストールするやり方とGoogle Colabにインストールするやり方の2つをご紹介しましょう。
自分のパソコンにインストールする
自分のパソコンにインストールする方法は以下のとおりです。
・Pythonをインストールする
・gitをインストールする
・WebUI Automatic1111をインストールする
・モデルファイルをダウンロードする
・WebUI Automatic1111を起動する
Google Colabにインストールする
Google Colabにインストールする方法は以下のとおりです。
・GoogleにログインしてColabのページへと移動する
・「ノートブックを新規作成」をクリックし、新たなノートブックを作る
・「編集」の中にある「ノートブックの設定」をクリックし、「ハードウェア アクセラレータ」を「GPU」に変更して保存する
・コマンドを入力し、リンクをクリックする
Stable Diffusion Playground
Stable Diffusion Playgroundはインストール不要、気ワードを入力するだけで画像を生成できるオンラインツールです。
例えば、「balloons in the sky」を入力すると、次の画面が生成されます。
英語に対応しているのが、日本語で「花と木と山と泉」を入力したら風景画像が生成されました。
Stable Diffusion の使い方
Stable Diffusionの使い方について詳しく知りたい人もいるでしょう。次に、Stable Diffusionを使う際の手順について解説していきます。
モデルを決める
まずは、画像のモデルファイルを決めます。モデルには様々な種類があるので、どのような画像を生成したいのかによって適したものが異なることを覚えておきましょう。
Waifu DiffusionやAnything v3、Counterfeit-V2.5、PastelMixなどは二次元が得意です。Realism Engine 1.0やCats Musical Diffusion、ChilloutMix、Stable Diffusionなどはリアル系や写真系を得意としています。
モデルの他に、VAEもインストールしておきましょう。VAEは、モデルによって必要になります。使用しないと画像がぼやけてしまったり、発色が悪くなったりしてしまう場合もあるので、インストールしておくのがおすすめです。
パラメータを設定する
画像生成するには、パラメータの設定が必要になります。パラメータの設定は「これ」といった答えがありません。モデルによっても異なるため、試行錯誤するクリエイターが多く見られます。
最初のうちはデフォルト値で生成し、徐々に自分なりのスパイスを加えるのも良いでしょう。様々なパラメータを試すことで、自分好みの画像生成ができるようになっていきます。
プロンプトとネガティブプロンプトを作る
次は、画像生成に必要となるプロンプトとネガティブプロンプトを入力していきます。
・プロンプトについて
プロンプトは、AIにどのような絵を描いてほしいのか伝えるための文章です。まるで魔法のように絵が完成するため、「呪文」と呼ばれる場合もあります。プロンプトには、品質や追加要素、背景、スタイルなどを決めるためのヒントが含まれています。
クオリティを示すmasterpiece,・best qualityなど、被写体を示すa girl・beautiful forest Landscape、衣装を示すschool costume・maid costumeなどです。oil painting watercolor chibi realistic Concept art Pencil drawingのようにスタイルを表すプロンプトもあります。
これらをすべて使う必要はありませんが、クオリティに関する呪文は最初に書くのが鉄則となっています。他の順番は特に決まっていません。
・ネガティブプロンプトについて
ネガティブプロンプトは、画像内含めてほしくない要素をAIに伝えるための呪文です。プロンプトとは逆の役割だと考えるとわかりやすいでしょう。ネガティブプロンプトを含めなくても画像の生成はできますが、理想に近い絵を生み出したいなら必須だと言えます。
bad anatomy(正確ではない体の形)やmutated hands(変形した手)、malformed_hands(奇形の手)、lowres(解像度が低い画像)、out of focus(ピントがずれている)といった呪文があります。
構図を決める
以前だと構図は運任せの要素が大きかったです。しかし、Controlnetが登場したことで、構図を決められるようになりました。Controlnetは、WebUI用の拡張機能を利用すると使えるようになります。
好きなポーズを指定できるようになったので、より画像生成の幅も広がるでしょう。理想に近い画像を生成するためにも有効なので、イメージがすでに固まっている場合はぜひ使ってみてください。
アップスケールする
画像の生成が終わったら、アップスケールします。アップスケールは、画像のサイズを大きくリスケールして、解像度を高める作業です。細かい部分の書き込みが増えるため、よりきれいな画像に仕上がります。
AIで生成した画像はどことなく不自然になってしまいがちですが、アップスケールすることで違和感のない画像を生成できます。クオリティが高い画像生成には必須だと言えるでしょう。
Stable DiffusionとMidjourneyの違いは?
「Stable Diffusion」と「Midjourney」を比較すると、「Stable Diffusion」は写実的な表現が多く、非現実的な描写も含まれることで興味深さが生まれます。一方、「Midjourney」は人物や動物の描画には得意ではありませんが、背景などの世界観表現には長けています。
また、「Stable Diffusion」は無料で自在に試しますが、「Midjourney」は無料版で制限があります。
Stable Diffusion に関する口コミ
Stable Diffusion に関する口コミを使った人の口コミには「Japanese Stable Diffusionだと日本語のテキストプロンプトに対応しているから使いやすい」、「Stable Diffusion Demoを使ってみたけど日本語も認識されていた」といった声がありました。日本語のプロンプトにも対応していれば、英語が苦手な人でも使いやすいでしょう。英語のプロンプトを使った方が細かい部分まで理想に近い画像を生成しやすいですが、使用するモデルにもよると言えます。
Stable Diffusionの代わりになる写真を漫画風にするソフト
Stable Diffusionは画像を生成できますが、個人の顔写真などを漫画風にする事ができません。そこでカメラで撮る写真を漫画風にするソフト・DVDFab写真加工AIをご紹介します。
DVDFab写真加工AIとは、DVDFab会社が運営するAIが搭載された超高性能な写真高画質化ソフトです。AIのべりすとと似たように、画像を生成できます。個人で開発したソフトではなく、DVDFab会社が開発、運営したので、安全性が高いです。
漫画化だけではなく、拡大や色付、waifu2x、ノイズ除去、ワンクリック美化など多数の機能を持っています。windowsしか対応
DVDFab写真加工AIの使い方
それでは、DVDFab写真加工AIの使い方について少し説明します。まずはDVDFab写真加工AIを公式サイトからダウンロードして、パソコンにインストールしましょう。
そして、DVDFab写真加工AIメイン画面に入ります。メイン画面には、画像に対する操作が表示されます。画像を拡大や縮小、ノイズ除去、色付けや漫画化などさまざまな機能があります。AIが搭載されている機能とは、「漫画化」機能をお試しできます。
好きな機能を選択して、真ん中の「+」をクリックして画像をロードしましょう。
すると、画像の編集とか、画像をアニメ化するとかができます。
詳細設定をチェックしたら、「処理開始」ボタンをクリックするだけで、画像の編集や生成ができます。
数秒で画像が漫画化されました。
DVDFab写真加工AIは安心安全なソフトで、気軽にご利用いただけます。
Stable Diffusionは、AI画像生成を行うために使われます。プロンプトをしっかりと盛り込めば、理想に近い画像を生成しやすくなるでしょう。基本的な使い方を知っていれば効率的な画像生成ができるので、慣れるまでは試行錯誤しながら挑戦してみるのがおすすめです。英語が苦手な場合はJapanese Stable Diffusionであれば日本語にも対応しているので、こちらも要チェックです。Stable Diffusionの安全性を疑う方には画像編集ソフト:DVDFab写真加工AIをご利用ください。