クリエイターの教科書

ChatGPT, Stable Diffusion, Visual Studio, Excelなど教科書

deepfloydとは?使い方は?

deepfloydはStabilityAIの新しい画像生成AIです。

deepfloydとは?

DeepFloyd IF — DeepFloyd

Stablity Diffusion、StabilityLMなど、オープンソース型のジェネレーティブAIにとりくんでいるStabilityAIの画像生成AIサービスです。 

Stability AIが大規模言語モデルを取り入れた高性能なテキストから画像への変換モデル「DeepFloyd IF」を発表

 

同社のマルチモーダルAI リサーチラボ DeepFloydとで発表されたモデルで、画像生成のなかでテキストがしっかり反映されるのが大きな特徴です。

 

サービス自体は研究用ライセンスとして提供されます。

 

使い方は?

ハギングフェイスでデモが公開されています。

IF - a Hugging Face Space by DeepFloyd

 

プロンプト:a girl, head shot

ネガティブ:nsfw

 

1枚選んで「Upscale」を実施します。

 

ちょっと待つと完成。

 

今度は架空の「Gpt Coffe」というロゴを依頼。するとGPT Coffeeの名前が入った画像が作られます。

プロンプトは「coffie shop "gpt coffee" logo」とし、タイトル名をクォーテーションでかこっておきます。

 

アップスケールするとこんな感じ。

 

文字が再現される画像生成AIはなかったので便利ですね。

 

 

感想は?

使い方は基本的な画像生成AIと同じです。

 

ただし文字がロゴとして正しく再現されるAIという点は新しく、ロゴやポスター作りにも役立ちそうです。

 

 

ネットの評判は?

ただ元ネタがみつけやすいとも話題となっており、著作権での論争は今後ますますヒートアップしそうです。

 

 

 

 

このブログは、ネットや書籍上の情報、個人の体験や感想を中心にまとめたものです。 正確性を期していはいますが、間違い・誤訳等あるかもしれません。 当サイトの情報によって生じたいかなる損失について一切の責任を負わないものとします. あらかじめご了承ください。

プライバシーポリシー |〇利用規約 |〇問い合わせ