deepfloydはStabilityAIの新しい画像生成AIです。
deepfloydとは?
Stablity Diffusion、StabilityLMなど、オープンソース型のジェネレーティブAIにとりくんでいるStabilityAIの画像生成AIサービスです。
Stability AIが大規模言語モデルを取り入れた高性能なテキストから画像への変換モデル「DeepFloyd IF」を発表
同社のマルチモーダルAI リサーチラボ DeepFloydとで発表されたモデルで、画像生成のなかでテキストがしっかり反映されるのが大きな特徴です。
サービス自体は研究用ライセンスとして提供されます。
使い方は?
ハギングフェイスでデモが公開されています。
IF - a Hugging Face Space by DeepFloyd
プロンプト:a girl, head shot
ネガティブ:nsfw
1枚選んで「Upscale」を実施します。
ちょっと待つと完成。
今度は架空の「Gpt Coffe」というロゴを依頼。するとGPT Coffeeの名前が入った画像が作られます。
プロンプトは「coffie shop "gpt coffee" logo」とし、タイトル名をクォーテーションでかこっておきます。
アップスケールするとこんな感じ。
文字が再現される画像生成AIはなかったので便利ですね。
感想は?
使い方は基本的な画像生成AIと同じです。
ただし文字がロゴとして正しく再現されるAIという点は新しく、ロゴやポスター作りにも役立ちそうです。
ネットの評判は?
ただ元ネタがみつけやすいとも話題となっており、著作権での論争は今後ますますヒートアップしそうです。
Stability AI社が画像生成AI「DeepFloyd IF」をリリース
— 会木 (@tatatataniguthi) 2023年4月30日
学習元丸パクりのAI画像が作れると話題に
固有名詞はもちろん、ありふれたプロンプトでも出てしまう模様
誰でも気軽に著作権ロンダリング出来る時代へ pic.twitter.com/h3JlBEdJnZ
DeepFloyd IFが学習元画像ほぼそのまま再現してるのを見て、「ああ...StableDiffusionは性能低くて再現すらできなかっただけなのか...?」になってる
— ZOI (@ZOI_dayo) 2023年4月29日
DeepFloyd IFで元画像まんまのが出る奴見てなんか笑っちゃった。
— すらまん (@slimers_next) 2023年4月29日
Deepfloyd IFの元画像との類似性やべーな(笑)
— hogeSing (@hogeSing_meta) 2023年4月29日