DALL•E 3(ダリ・スリー)は、ChatGPTを運営するOpenAIが開発した画像生成AIです。
2023年9月にChatGPTに搭載され、話題になりました。
しかし、DALL•E 3が画像を生成できると知っていても、具体的にどのような画像が生成できるのか、どのような使い方ができるか、詳しく知らない方は多いでしょう。
そこで本記事では、ChatGPTのDALL•E 3について、基本情報から生成できる画像の具体例、使用方法などを詳しく解説しています。
本記事を読めばDALL•E 3の全体像を把握でき、今日から高品質な画像を生成できるようになりますよ!
※記事内の画像は、すべて筆者がDALL•E 3で生成しました。
ChatGPTはGPT4でDALL•E 3を使用できる
前提として、ChatGPTのDALL•E 3は、GPT4(有料版)でのみ使用可能です。
そのため、無料版のGPT3.5ユーザーの方は、GPT4へのアップグレードが必要です(月20ドル:約3,000円)。
ChatGPTのGPT4については、以下の記事を参考にしてみてください。
【完全網羅】ChatGPTのGPT4とは?業務での使い方や機能を解説!
さて、本章ではDALL•E 3について、以下の4点を解説します。
- DALL•E 3とは
- DALL•E 3は商用利用可能
- DALL•E 3は著作権の問題をクリアしている
- DALL•E 3が画像を生成できる理由
それぞれの項目について、詳しく見ていきましょう。
DALL•E 3とは
DALL•E 3とは、テキストから画像を生成できるAIです。
ChatGPTを運営するOpenAI(オープン・エーアイ)によって開発されました。
2021年にDALL•Eが開発され、進化を重ねた結果が、現在のDALL•E 3です。
DALL•E 3では、以下のような画像を生成できます。
このようにリアルな風景画像を数十秒で生成できます。
さらに、上記のようにキャラクターチックな画像も生成できます。
イラストレータでなくても簡単に、テキストだけで画像を作れてしまうのが、DALL•E 3なのです。
DALL•E 3と他の画像生成AIの違い
DALL•E 3と他の画像生成AIの違いは「チャットで生成する画像をコントロールできる」点です。
ChatGPTでDALL•E 3を使用する場合は、1回の会話で理想の画像を作るのは難易度が高いでしょう。
しかし、ChatGPTは対話ができるAIです。その特徴を活かして、会話を複数回行うことで、理想の画像に近づけられます。
他の画像生成AIだと、複雑なプロンプトを入力したり、モデルと呼ばれるソフトウェアを適切に選択する必要があったりします。
単純なテキストだけで手軽に高品質な画像を生成できる点が、DALL•E 3の強みなのです。
DALL•E 3は商用利用可能
DALL•E 3が他の画像生成AIよりも優れている点は、商用利用が可能であることです。
商用利用できるため、イラストレーターとして画像を売ったり、会社のロゴマークとして使ったりできます。
テキスト次第であらゆる画像を生成できるため、ビジネスの幅が広がりますね。
商用利用可能な根拠については、OpenAIの利用規約に記載されているので安心してください。
参考:Can I sell images I create with DALL·E?
著作権の侵害にならないように学習している
DALL•E 3が生成する画像は、著作権違反にならないよう配慮されています。
ただしDALL•E 3は、インターネット上でさまざまな画像を学習しているため、生成する画像が著作権に抵触する可能性がゼロではないでしょう。
AIが出力した画像に関して、完全に法整備がされていないのが現実です。
ビジネスでDALL•E 3を使用する際は、法律に抵触していないが十分なチェックが必要です。
とはいえ、DALL•E 3を含む画像生成AIのビジネスはかなり広がっています。
DALL•E 3が画像を生成できる理由
DALL•E 3がテキストから画像を生成できるのは「Transformer」と呼ばれる技術のおかげです。
Transformerとは、対象を細かく分けて、要素同士の関係性を正確に把握する技術です。
例えば、画像生成において、ユーザーから入力されたテキストの理解や、テキストと生成するべき画像の関係の把握、生成中の画像の調整などに、Transformerが利用されています。
ChatGPTの文章生成にも使われている技術で、Transformerは生成AIの分野において、必要不可欠な技術なのです。
Transformerに関しては、以下の記事で詳しく解説しています。
【新時代の常識】ChatGPTの仕組みを大解剖!図解してわかりやすく解説
ChatGPTのDALL•E 3で作成できる画像例
ChatGPTのDALL•E 3を利用して、生成できる画像を見てみましょう。
DALL•E 3に興味がある方は、参考にしてください。
リアル風
リアルな人間や、可愛い柴犬など、簡単なプロンプト(テキスト入力)で再現できてしまいます。
イラスト風
イラスト風の柴犬や、鉛筆で書いたような洋風の家など、さまざまなタッチでイラストを生成できます。
アニメ風
プロンプトで「アニメ風」と入れるだけで、上記のようなテイストの画像生成も可能です。
ファンタジー風
プロンプトを工夫すれば、ファンタジー風のイラストも生成できます。
ロゴ
イメージをうまく伝えられると、自社サービスのロゴも数秒で作成できます。
次の章から、理想の画像を生成するためのコツを解説します。
ChatGPTでDALL•E 3を使用する際のコツ
ChatGPTのDALL•E 3で理想の画像を生成するためのコツは、以下の3つです。
- 会話して理想の画像に近づける
- プロンプトをChatGPTに考えてもらう
- 識別子(生成ID)を活用する
コツを理解して、理想の画像を大量生産しましょう!
会話して理想の画像に近づける
理想の画像を生成するために、複数回の会話を行いましょう。
1回のプロンプトで理想の画像を生成するのは困難です。
しかし、何度も対話することで、徐々に理想の画像に近づけられます。
微妙な色味や背景のオブジェクトなどを微調整ができるのが、ChatGPTとDALL•E 3の組み合わせの強みです。
画像を読み込ませて再現してもらう
参考画像に近い画像を生成したい場合は、ChatGPTに画像を読み込ませる方法がおすすめです。
利用方法は、ChatGPTに画像を投げて、「画像を再現して」とプロンプトを入力するだけです。
これだけで、近い画像が生成できます。
しかし、次に紹介する「プロンプトをChatGPTに考えてもらう」方法の方が、僕の体感では再現度が高いです。
プロンプトをChatGPTに考えてもらう
前述した「画像を読み込ませる方法」よりも高精度で参考画像を再現する方法として、ChatGPTにプロンプトを考えてもらう方法がおすすめです。
以下の手順で、参考画像に近い画像を生成できます。
- ChatGPTに参考画像を読み込ませる
- 次のプロンプトを入力する
「この写真をDALL•E 3で再現するためのプロンプトを考えてください。できるだけ詳細に、英語で出力してください。」 - 出力されたプロンプトを再度入力する
上記の手順を踏むことで、参考画像と似た画像が生成されます。
前述した「画像を読み込ませて再現してもらう」方法よりも、手順は多いですが再現度が高いです。
識別子(生成ID)を活用する
画像の一部分だけ変えて、他の部分は変更しない方法として、識別子(生成ID)を使用する方法を紹介します。
DALL•E 3は、一部分だけ変えるのが苦手なんです。
識別子とは、画像ごとに定められた固有のIDです(生成IDとも呼ばれます)。
以下の手順で、識別子を使用してみてください。
- DALL•E 3で画像を生成する
- 生成した画像に対して「識別子を教えて」と聞く
- 変えたい部分をプロンプトで指示して、最後に識別子をつける
例「背景の色を青に変えて。他の部分は変えないでください。識別子:〜〜〜」
識別子を利用すると、以下のように画像の一部を変更できます。
動画で確認したい方は、以下のインスタ投稿もご覧ください。
ChatGPTのDALL•E 3の使い方
ChatGPTでDALL•E 3を使う方法は非常に簡単です。
ChatGPTの有料版GPT4にして、生成したい画像の特徴をプロンプトに入力するだけです。
特別な操作なしで、ユーザーが画像を生成してほしい旨を、ChatGPTが理解してくれます。
DALL•E 3では手軽に画像生成を体験できますので、ぜひ試してみください。
ChatGPTのDALL•E 3を使う際の注意点
ChatGPTのDALL•E 3は便利なツールですが、利用には注意点があります。
本章では、DALL•E 3を使う際の注意点を2つ紹介します。
DALL•E 3を使用した責任は利用者が負う
DALL•E 3を使用して万が一損害やトラブルが発生した場合、責任は利用者が負います。
DALL•E 3にはインターネット上のさまざまな画像データが含まれています。そのため、生成する画像が著作権違反になる可能性はゼロではありません。
現行の著作権では、DALL•E 3で出力した画像が著作権で保証されるのか、正解がない状態です。
DALL•E 3を利用してビジネスを行う予定の方は、法律周りをしっかり理解しておく必要があるでしょう。
生成できない画像のタイプがある
DALL•E 3のコンテンツポリシーを確認すると、以下のジャンルは出力できないとされています。
カテゴリ | 説明 |
---|---|
憎悪 | 憎しみの象徴、否定的なステレオタイプ、特定の集団を動物や物体に例えること、またはアイデンティティに基づく憎悪を表現または促進すること。 |
嫌がらせ | 個人をあざけり、脅迫し、いじめること。 |
暴力 | 暴力行為、他者の苦しみや屈辱。 |
自傷行為 | 自殺、切り傷、摂食障害、および自己を傷つけるその他の試み。 |
性的内容 | 裸、性的行為、性的サービス、または性的な興奮を引き起こすための内容。 |
ショッキングな内容 | 体液、下品なジェスチャー、またはその他の不適切な主題で、ショックを与えたり嫌悪感を引き起こしたりする可能性があるもの。 |
違法活動 | 薬物使用、窃盗、器物破損、その他の違法行為。 |
欺瞞 | 主要な陰謀や、主要な進行中の地政学的イベントに関連する出来事。 |
政治的内容 | 政治家、投票箱、抗議行動、または政治プロセスに影響を与えるため、または選挙運動に使用される可能性のあるその他の内容。 |
公衆衛生と個人の健康 | 疾病の治療、予防、診断、または伝播、または健康障害を抱える人々。 |
スパム | 無差別な一括コンテンツ。 |
簡単にまとめると、違法行為、性的表現、暴力表現など、公序良俗に反する画像は生成できないということです。
ChatGPTは一般に展開しているサービスであるため、制限が強く設定されていることを理解しておきましょう。
ChatGPTのDALL•E 3に関するよくある質問
ChatGPTのDALL•E 3に関する質問を2つ用意しました。
気になる質問があれば、回答を参考にしてみてください。
DALL•E 3の使用料は無料ですか?
DALL•E 3をChatGPTで使用する場合は、有料版のGPT4にする必要があります(月20ドル)。
無料で使用したい場合は、Microsoft Edgeの「bing chat」という生成AIを使うとよいでしょう。bing chatでは、DALL•E 3を無料で使用できます。
bing chatの利用には、Microsoft Edge ブラウザーをインストールする必要があります。
DALL•E 3を無料で利用したい方は、こちらからブラウザをダウンロードしてみてください。
DALL•E 3は日本語でも使えますか?
日本語でも活用可能です。
日本語で簡単なプロンプトを入力しただけでも、品質の高い画像を生成してくれるのがDALL•E 3のメリットです。
ただし、複雑な形や細かい装飾を含む画像の生成は、英語のプロンプトを入力した方が再現性が高くなります。
ChatGPTのDALL•E 3を使って好きな画像を生成しよう
ChatGPTでDALL•E 3を利用できるようになって、画像生成はより一般的になりました。
DALL•E 3では、リアルな画像やイラスト風の画像、幻想的な画像まで、あらゆるテイストの画像を生成できます。
従来の画像生成AIとは異なり、テキストで会話しながら画像を生成できる点が、DALL•E 3の強みです。
商用利用が可能であるため、ビジネスで活用したいと考えている方にもおすすめです。
本記事を読んでDALL•E 3に興味をもった方は、ChatGPTをGPT4へのアップグレードして、画像生成を楽しんでみてください!
GPT4について詳しく知りたい方は、以下の記事を参考にしてみてください。
【完全網羅】ChatGPTのGPT4とは?業務での使い方や機能を解説!