イメージモデル
FLUX
FLUX.1 開発版
FLUX.1 dev は、Black Forest Labs が 2024 年に非商用用途向けに公開した 120 億パラメータのオープンウェイトテキスト→画像モデルです。FLUX.1 Pro からのガイダンス蒸留で訓練され、最先端の出力品質とクローズドソースの代替と匹敵するプロンプト追従性能を提供します。0.1〜2.0 メガピクセルの解像度をサポートし、効率的な 25–50 ステップ生成で優れた視覚品質とプロンプト遵守を実現します。非商用ライセンスで公開され、HuggingFace にウェイトが公開されているため、研究者や開発者が科学的革新を推進し、アーティストが高度なクリエイティブワークフローを活用できるようにします。
公式サイト: https://bfl.ai/
FLUX Pro
FLUX.1 Pro(FLUX 1.1 Pro)は、Black Forest Labs のフラッグシップの専有テキスト→画像モデルで、卓越したプロンプト追従性、視覚品質、出力の多様性で最先端の性能を提供します。2024 年 10 月にリリースされ、前モデルに比べて生成速度が 6 倍高速化され、ネイティブで 2K 解像度生成をサポートします。卓越したフォトリアリズム、精緻なディテール描写、Artificial Analysis イメージアリーナでの最高の Elo スコアを有し、商品写真からブランドキャンペーンまで商用用途に最適です。BFL API とパートナー(Replicate、fal.ai、Together.ai)を通じて独占的に提供され、Ultra モード(4MP 解像度)および Raw モード(ハイパーリアリスティックなスナップ写真スタイル)を備えたプロダクション対応のワークフローを提供します。
公式サイト: https://bfl.ai/models/flux-pro
FLUX.1 Krea
FLUX.1 Krea [dev] は、Krea AI と協働で開発された Black Forest Labs の「オピニオン化」された 120 億パラメータのテキスト→画像モデルで、2025 年 7 月にリリースされました。過度に彩度の高い「AI 風」見た目を克服するよう特別に訓練され、卓越したフォトリアリズムと特徴的な美学、多様な出力を実現します。従来のオープンモデルを上回り、ヒューマンプレファレンス評価で FLUX 1.1 Pro に匹敵する結果を示し、過度に平滑化されたテクスチャを避けつつ現実的な画像生成に優れます。FLUX.1 dev の非商用ライセンスで公開され、HuggingFace にウェイトがあるため、下流のファインチューニングの柔軟なベースモデルとして機能し、基盤モデル研究所とアプリケーションチームの協業の成功例を示します。
公式サイト: https://bfl.ai/blog/flux-1-krea-dev
FLUX.2 開発版
FLUX.2 dev は、Black Forest Labs が 2025 年 11 月にリリースした 320 億パラメータのオープンウェイトモデルで、生成と編集を単一アーキテクチャで統合します。Mistral-3 24B のビジョン・ランゲージモデルを用いた潜在フロー整合に基づき、複数参照(最大 10 画像)対応、4MP 出力、強化されたタイポグラフィおよび優れたプロンプト遵守を備えた最先端の性能を提供します。フォトリアリズム、世界知識、空間論理の大幅な改善を特徴とし、キャラクター整合のキャンペーンや複雑なテキスト描画を可能にします。FLUX.2 dev の非商用ライセンスで HuggingFace にウェイトが公開されており、多くの VRAM を必要としますが、消費者ハードウェア向けの量子化版が Hugging Face Diffusers を通じて提供されています。
公式サイト: https://bfl.ai/blog/flux-2
FLUX.2 Pro
FLUX.2 Pro は、Black Forest Labs が 2025 年 11 月にリリースしたプロダクション向けの専有モデルで、最高速度で最先端の品質を提供します。320B パラメータの潜在フロー整合アーキテクチャに基づき、卓越したフォトリアリズム、複数参照対応(最大 10 画像)、4MP 出力、および信頼性の高いタイポグラフィ生成を提供します。強化された世界知識、正確なオブジェクト配置、複雑なシーンにおける一貫した照明により、キャラクター整合のキャンペーン、製品配置、ブランド忠実なレンダリングに優れます。BFL API およびパートナー(Replicate、fal.ai、Cloudflare)を通じて利用可能で、速度と視覚忠実度の妥協を許さない商用プロダクションワークフローに最適な品質とコストのバランスを提供します。
公式サイト: https://bfl.ai/models/flux-2
FLUX.2 Flex
FLUX.2 Flex は、Black Forest Labs が 2025 年 11 月にリリースした専門的な専有モデルで、生成パラメータに対する最大限の精度と細粒度の制御を提供します。調整可能なステップ数(6–50 ステップ)とガイダンススケールにより、開発者はタイポグラフィの正確性、画像の細部、品質、遅延のバランスを特定のユースケースに合わせて完全に制御できます。複雑なテキスト描画、UI モックアップ、インフォグラフィック、小さなディテールの維持に優れ、パラメータ設定に応じて速度と精度をトレードオフします。FLUX.2 Pro と同じ 320 億パラメータのアーキテクチャ上に構築され、生成特性と視覚品質に対して厳密な制御を求めるアプリケーション向けに前例のない柔軟性でプロダクション対応の結果を提供します。
公式サイト: https://bfl.ai/models/flux-2
Seedream
Seedream 4.5
Seedream 4.5 は、ByteDance がモデルスケーリングを通じて包括的な改善を達成した最新の AI 画像生成モデルで、2025 年にリリースされました。被写体の正確な認識、参照ディテールの厳密な保持、プロフェッショナル向けのタイポグラフィ描画に優れ、マルチ画像編集で卓越しています。最大 4K 出力と 14 枚の参照画像融合をサポートし、映画的なリアリズム、キャラクターの一貫性、および改善された空間論理を提供します。デザイナー級の構図能力と小さな文字の明瞭なレンダリングを備え、LM Arena リーダーボードで 10 位にランクされています。BytePlus API とパートナーを通じて利用可能で、E コマース、マーケティング、ブランドビジュアル向けのプロダクション対応結果を提供します。
公式サイト: https://seed.bytedance.com/en/seedream4_5
Seedream 4.0
Seedream 4.0 は、生成と編集を統合した新世代の画像生成モデルで、2025 年にリリースされました。120 億パラメータを有し、知識ベースの生成、複雑な推論、参照の一貫性などの複雑なマルチモーダルタスクに柔軟に対応します。複数参照画像でのバッチ処理と最大 4K 出力をサポートし、前世代より高速な推論速度を実現します。Artificial Analysis などのベンチマークでのプロンプト遵守、整合性、美学に優れ、Seedream 4.0 は単一文コマンドで高品質な画像生成と精密な編集を可能にします。映画、広告、デザインのプロ向けワークフローに最適です。
公式サイト: https://seed.bytedance.com/en/seedream4_0
Seedream 3.0
Seedream 3.0 は、ByteDance の前世代 AI 画像モデルで、テキスト→画像生成と基本的な編集機能における基礎的な能力を提供します。Seedream 4.x シリーズほど高度ではないものの、マルチモーダル理解、プロンプト追従、アーティスティックなスタイル描写などのコア技術を確立しました。Seedream 4.0 の前身として、ByteDance のビジュアル生成能力を示し、以降のモデル改善のためのアーキテクチャ基盤の発展に寄与しました。現在は新しいバージョンに置き換えられているものの、Seedream 3.0 は同社の画像生成技術と商用応用の進化に貢献しました。
公式サイト: https://seed.bytedance.com/
Dreamina
Dreamina 3.1
Dreamina 3.1 は、CapCut のクリエイティブチームが開発した ByteDance の高度な 4MP テキスト→画像モデルで、2025 年にリリースされました。美的品質の向上、精密なスタイル多様性、豊かな画像ディテールに注力しており、プロフェッショナルなシネマ品質、微妙なライティング、雰囲気の深み、多様な写真スタイル(水中、ポートレート、ペット写真など)で優れた性能を発揮します。グラフィックデザインやポスター用途に最適化された商用アプリケーションに対応し、強力なテキスト描画能力とフォービズムやバロックなどの芸術運動にわたる正確なスタイル制御を提供します。CapCut の Dreamina プラットフォームで利用可能で、1 日 225 無料トークンを提供し、ソーシャルメディア、マーケティング、クリエイティブプロジェクト向けの高解像度画像生成を可能にします。
公式サイト: https://dreamina.capcut.com/
Grok
Grok 2
Grok 2 は xAI が 2024 年 8 月にリリースした旗艦 AI モデルで、Aurora の自己回帰型 Mixture-of-Experts ネットワークを通じて高度な推論、コーディング能力、画像生成を備えます。インターネット上の数十億の例に基づいて構築され、Aurora はフォトリアリズム、精密なテキスト指示の遵守、ユーザー提供画像の編集に対するマルチモーダル入力サポートに優れます。X プラットフォーム(旧 Twitter)で Premium および Premium+ ユーザー向けに提供され、実体生成、芸術的テキスト、ミーム作成、リアルな肖像、著名人描写で最先端の性能を示します。Grok-1.5 より精度、指示遵守、多言語能力が向上しており、ウェブ検索統合、引用、リアルタイム情報アクセス、および xAI のエンタープライズプラットフォームを通じた開発者向け API アクセスを提供します。
Reve
Reve Create(Reve Image 1.0)
Reve Image 1.0 は、パロアルト拠点のスタートアップが 2025 年 3 月にリリースした先進的なテキスト→画像モデル(コードネーム「Halfmoon」)で、プロンプト遵守、美学、タイポグラフィに優れます。コンテキスト対応のプロンプト解釈器と 5000 万フォントサンプルで訓練された独自のタイポグラフィエンジンを備えたハイブリッド拡散アーキテクチャに基づき、優れたテキスト描画と複数キャラクターの一貫性を実現します。ネイティブ 2048x2048 解像度をサポートし、オプションで 4K アップスケーリングと自然言語による画像編集に対応、登録不要で無制限の無料生成を提供します。アップスケールテストで 92% のディテール精度、複数キャラクタープロンプトで 89% の一貫性を達成し、ドラッグ&ドロップ編集インターフェースと AI 駆動の作成ツールを組み合わせてプロフェッショナル品質の結果を提供します。
公式サイト: https://app.reve.com/
Ideogram
Ideogram 3.0 Turbo
Ideogram 3.0 Turbo は、2025 年 3 月のフラッグシップモデルの中で最速かつ最もコスト効率の高いバリアントで、迅速な反復と大量タスク向けに最適化されています。Ideogram 3.0 ファミリーの一部である Turbo は、驚異的なリアリズム、創造的デザイン、一貫したスタイルを提供し、画像とプロンプトの整合性、フォトリアリズム、およびテキスト描画品質で大きな進歩を遂げています。最大 3 つの参照画像を用いるスタイル参照機能、43 億以上のプリセットからのランダムスタイル探索、各種アスペクト比をサポートし、プロ品質のロゴ、プロモーションポスター、商品写真、グラフィックデザインに適しています。ヒューマン評価で常に他のテキスト→画像モデルを上回る最高の ELO 評価を獲得しており、プロのクリエイターが迅速にアイデアを生み出し大規模にグラフィックをカスタマイズできるようにします。
公式サイト: https://ideogram.ai/features/3.0
Ideogram 3.0 Quality
Ideogram 3.0 Quality(別名 Ideogram V3 Quality)は、2025 年 3 月のフラッグシップモデル群の中で最高忠実度を提供するバリアントで、プロフェッショナルなクリエイティブ作業における最大の精度とディテールを実現します。Turbo と同じ革新的基盤に基づき、Quality モードは繊維、水滴、動物の毛などの複雑な要素に対して優れた明瞭さを備えたフォトリアリズムを提供し、フォトリアルおよび抽象スタイルの両方で優れたパフォーマンスを発揮します。柔軟なアスペクト比と 2K までの解像度をサポートし、複雑なテキスト構成に対応する画期的なタイポグラフィ機能を備えているため、グリーティングカード、ポスター、コミック、ランディングページのコンセプト、マーケティング資料などのプロのデザイン作業を可能にします。微妙なライティング、精密な色表現、実物に近い環境ディテールを特徴とする洗練された空間構成により、生成画像と実物の境界を曖昧にします。
Imagen
Imagen 4
Imagen 4 は、Google DeepMind が Google I/O 2025(5 月 20 日)で発表した最先端のテキスト→画像モデルで、Imagen 3 に比べてテキスト描画が大幅に改善され、最大 2K 解像度と強化されたプロンプト遵守を備えます。Gemini によって生成された合成キャプションを用いた潜在拡散アーキテクチャに基づき、一般用途向けの標準 Imagen 4、10 倍速の生成を実現する Imagen 4 Fast、最高精度の Imagen 4 Ultra の 3 バリアントを提供します。フォトリアリズムから印象派まで多様な芸術スタイルに優れ、照明精度、微細なディテール描写、クリーンなタイポグラフィ、複雑な複数キャラクターシーンの空間論理を提供します。Gemini API、Google AI Studio、Vertex AI を通じて利用可能で、すべての出力には AI 生成コンテンツ識別のための不可視の SynthID ウォーターマークが含まれます。
公式サイト: https://deepmind.google/models/imagen/
Imagen 4 Ultra
Imagen 4 Ultra は、Imagen 4 ファミリーの中で 2025 年 5 月にリリースされた最高精度バリアントで、最大のディテールと複雑なテキストプロンプトへの厳密な遵守を目的としています。最高忠実度を要求するプロのクリエイティブワークフロー向けに設計され、フォトリアリスティックなレンダリング、微妙なライティング、細部の正確さ、およびグリーティングカード、ポスター、コミック向けの洗練されたテキスト描画で優れた結果を提供します。2K までの解像度と強化されたプロンプト整合能力をサポートし、複雑な複数キャラクター構図、精緻な空間論理、クリーンでアーティファクトのない出力に強みを持ちます。Gemini API、Google AI Studio、Vertex AI を通じて利用可能で、すべての出力には責任ある AI の透明性と追跡性のための不可視の SynthID ウォーターマークが含まれます。
Luma
Luma Photon
Luma Photon は、Luma Labs が 2024 年 12 月にリリースした画期的なテキスト→画像モデルで、ユニバーサルトランスフォーマーアーキテクチャを採用し、極めて高品質な 1080p/2MP 画像を高効率で生成します。特別に設計された美学により一般的な「AI らしさ」を排除することを目指し、フォトリアリズム、高い自然言語理解(大きなコンテキストウィンドウを使用)、マルチターンの反復編集ワークフローに優れます。単一参照画像からのキャラクター一貫性、スタイル転送のためのマルチ画像参照システム、創造性とプロンプト忠実度に関するブラインド評価で競合を上回る性能を発揮し、デザイナー、映画制作者、建築家が広範なアイデア空間を探求できるようにします。Luma API と Dream Machine サービス、およびより高速な Photon Flash バリアントで利用可能です。
公式サイト: https://lumalabs.ai/photon
Recraft
Recraft 3.0
Recraft V3(コードネーム「Red Panda」)は、2024 年に公開された Hugging Face の業界をリードするベンチマークで #1 にランクされたテキスト→画像モデルで、ELO 評価 1172 を獲得し Midjourney、OpenAI、その他主要競合を上回りました。プロのデザイナー向けに革新的で、ラスターとベクター(SVG)の両方の画像生成をサポートし、任意のサイズと長さのテキスト描画能力を備えています。ブランドの一貫性を保つための精密なスタイル制御(再学習不要)、高度なインペインティング/アウトペインティング、ドラッグ&ドロップによるテキスト配置、優れた解剖学的精度を特徴とし、プロフェッショナル品質のフォトリアリスティックな画像を提供します。デスクトップアプリ、モバイル(iOS/Android)、API 経由で提供され、デザインワークフローにシームレスに統合できます。
公式サイト: https://www.recraft.ai/
Qwen
Qwen Image
Qwen Image(Qwen-Image-2512)は、Alibaba Cloud が 2024 年 12 月にリリースした完全オープンソースの 200 億パラメータ MMDiT 画像生成モデルで、GenEval、DPG、OneIG-Bench を含む 9 つの公開ベンチマークで首位を獲得しました。Apache 2.0 ライセンスで商用利用が無料で許可されており、中国語および英語の商用グレードのテキスト描画に優れ、複雑な複数行レイアウト、段落レベルの意味解析、細かな視覚ディテールをサポートします。DFloat11 量子化と CPU オフロードにより単一の RTX 3090 GPU 上でのデプロイに最適化され、セマンティック整合性と視覚的リアリズムを維持しつつ精密な画像編集で優れた性能を発揮します。Qwen Chat、Hugging Face、ModelScope、Alibaba Cloud Model Studio を通じて利用可能で、インフォグラフィック、ポスター、多言語の企業ドキュメントなどテキスト重視の構造化ビジュアル生成に適しています。
公式サイト: https://qwen.ai/
SeeEdit
SeeEdit 3.0
SeeEdit 3.0(SeedEdit 3.0)は、ByteDance が 2025 年 6 月にリリースした最先端の生成画像編集モデルで、実/合成画像編集タスクにおいて 56.1% の有用性率を達成し、SeedEdit 1.6(38.4%)、GPT-4o(37.1%)、Gemini 2.0(30.3%)を大きく上回りました。強化されたメタ情報埋め込みパイプラインと共同拡散-報酬学習により構築され、指示遵守と画像内容の保持に優れ、特に身元/知的財産の保持において優れた性能を発揮します。1K 以上の高解像度画像を処理し、バックグラウンド差し替え、オブジェクト除去、照明変更、テキスト編集、キャラクター一貫性に優れたプロ級の編集を 10–15 秒で実行します。中英二言語プロンプトをサポートし、画像一貫性スコアで 4.07/5 を達成しており、写真家、プロダクトチーム、クリエイティブ専門家向けに精密な制御を最適化しています。
公式サイト: https://seed.bytedance.com/
Nano Banana
Nano Banana
Nano Banana(Gemini 2.5 Flash Image)は、Google DeepMind が 2025 年 8 月にリリースした高速で対話的な画像生成・編集モデルで、複数のプロンプトにわたる卓越したキャラクター一貫性により世界で最高評価の画像編集モデルにランクされています。迅速なマルチターンのクリエイティブワークフロー向けに設計され、完全なキャラクター外観維持や背景ぼかし、オブジェクト除去、ポーズ変更、写真の着色化など自然言語コマンドによるターゲット変換を可能にします。シームレスなマルチ画像合成とブランド資産の一貫性を保つビジュアルテンプレート適合をサポートし、複雑な視覚的推論を可能にする Gemini の深いセマンティック理解を活用します。Gemini アプリで可視/不可視の SynthID ウォーターマーク付きで提供され、カジュアルなクリエイターが簡単なテキストプロンプトでアイデアをプロフェッショナルなビジュアルに変換できます。
公式サイト: https://gemini.google/overview/image-generation/
Nano Banana Pro
Nano Banana Pro(Gemini 3 Pro Image)は、Google DeepMind が 2025 年 11 月にリリースした最先端のプロフェッショナル向け画像生成・編集モデルで、スタジオ品質の結果を得るために強化された推論能力と実世界の知識を備えた Gemini 3 Pro 上に構築されています。エンタープライズ向けのプロダクションワークフローを想定し、多言語で判読可能なテキスト生成、高度な構図のため最大 14 入力参照画像のサポート、1K/2K/4K 出力と高度なクリエイティブコントロールを提供します。「思考モード」による複雑なプロンプト推論、事実確認のための Google 検索根拠付け、最大 5 人の人物に対する優れたキャラクター一貫性を備え、モックアップ、ポスター、インフォグラフィック、マーケティング素材向けのプロフェッショナルなビジュアルを提供します。Vertex AI、Google Workspace(Slides、Vids)、Gemini Enterprise で利用可能で、Adobe Firefly、Photoshop、Canva、Figma に統合されています。
GPT Image
GPT Image 1.5
GPT Image 1.5 は、OpenAI が 2025 年 12 月にリリースした最新のプロダクション向け画像生成・編集モデルで、テキストと画像を統一ニューラルネットワークで処理するネイティブなマルチモーダルアーキテクチャを備え、優れた編集精度を実現します。内部コードネーム「Hazel」で開発され、DALL·E 3 より最大 4 倍高速な生成、強化された指示遵守、マルチターン編集における顔と身元の堅牢な保持、鮮明な文字描画と一貫したレイアウトを提供します。テキスト→画像生成とターゲットを絞った画像編集ワークフローの双方をサポートし、インフォグラフィック、UI モックアップ、コミック、マーケティング資料などの複雑な構造的ビジュアルに優れ、構図、照明、キャラクター一貫性を維持します。ChatGPT、OpenAI API、Microsoft Foundry を通じて利用可能で、品質と待ち時間のトレードオフを柔軟に設定でき、文脈的に正確なコンテンツのための組み込みの世界知識を備えます。
Reve
Reve Edit
Reve Edit は、Reve AI の画像編集専用モデルで、LMArena の画像編集タスクでトップ 3 にランクされており、奥行き、遠近、三次元物体関係を理解する空間知性を備えてシームレスな編集を実現します。構図の保存を必要とするプロ向けワークフロー向けに設計され、自然言語による編集とドラッグ&ドロップインターフェースを組み合わせて、未編集領域に影響を与えずにターゲット変換を行います。商品写真のバリエーション、写真修復、現実的な天候/照明調整を伴う風景編集、単一ソース画像からの創造的反復に優れ、テクスチャや素材表現、視覚的一貫性を編集全体で維持します。10 人の研究チームにより開発され、プロンプト遵守と美的品質で急速に進化しており、複数画像合成とスタイル参照機能を備えて一貫したブランド資産の作成を可能にします。
公式サイト: https://app.reve.com/
Flux Kontext
Flux Kontext Max
FLUX.1 Kontext [max] は、Black Forest Labs が 2025 年 5 月にリリースした高性能のインコンテクスト画像生成・編集モデルで、卓越したプロンプト遵守と高度なタイポグラフィ処理を提供します。生成フロー整合アーキテクチャを用いる革命的な Kontext スイートの一部で、テキスト→画像生成と即時のテキストベース編集を統合し、キャラクター一貫性、局所編集、スタイル参照機能を実現します。テキストと画像の両入力をサポートし、1MP 解像度で 3–5 秒の推論速度を達成することで、マルチターンの洗練された反復ワークフローを可能にし、シーンや環境全体で固有の視覚要素を保持します。KontextBench のテキスト編集およびキャラクター保持ランキングで上位に達し、GPT-Image のような競合モデルより 8 倍高速に動作します。BFL Playground と API パートナー経由でプロのクリエイティブ制作にアクセス可能です。
公式サイト: https://bfl.ai/models/flux-kontext
Flux Kontext Pro
FLUX.1 Kontext [pro] は、Black Forest Labs が 2025 年 5 月にリリースしたフラッグシップの反復編集モデルで、生成と洗練を組み合わせた高速なマルチターンワークフロー向けに構築されています。プロのクリエイティブ制作向けに設計され、テキストと参照画像を入力として処理し、局所的なターゲット編集や複雑なシーン変換を行いながら反復を通じてキャラクターやスタイルの一貫性を維持します。テキスト編集とキャラクター保持のベンチマークでトップパフォーマンスを達成し、3–5 秒の推論速度で競合モデルより 8 倍高速に動作します。キャラクター一貫性、局所編集、スタイル参照機能を統一アーキテクチャでサポートし、KreaAI、OpenArt、Replicate、BFL Playground などのパートナーを通じてプロダクションワークフローで利用できます。
公式サイト: https://bfl.ai/models/flux-kontext
Flux Kontext Dev
FLUX.1 Kontext [dev] は、Black Forest Labs が 2025 年 5 月に非商用ライセンスで公開したオープンウェイト版で、研究および安全性テスト向けに提供されています。Pro および Max バリアントと同じ生成フロー整合アーキテクチャに基づき、開発者にノードベースのパイプライン(例:ComfyUI)への実験と統合のためのカスタマイズ可能な基盤を提供します。テキストとビジュアルの両入力によるインコンテクスト画像生成、キャラクター一貫性および編集機能をサポートし、Hugging Face、GitHub、および Replicate、FAL、TogetherAI などのインフラパートナーを通じて入手可能です。商用利用はライセンスにより可能で、コンプライアンスのための使用状況追跡が組み込まれています。
Qwen-Image-Edit
Qwen Image Edit
Qwen-Image-Edit(Qwen-Image-Edit-2511)は、Alibaba が 2025 年 11 月にリリースしたオープンソースの 200 億パラメータ画像編集モデルで、Qwen-Image を基盤としたデュアルパイプラインアーキテクチャ上に構築されています。意味制御のための Qwen2.5-VL と視覚外観のための VAE を組み合わせ、正確な中英二言語テキスト編集と意味/外観の二重編集モードをサポートします。グループ写真における複数人の一貫性、身元保持のあるポートレート編集、スタイル転送、オブジェクト回転、フォントやレイアウトを維持したテキスト修正に優れており、Apache 2.0 ライセンスで利用可能です。Qwen Chat、Hugging Face、ModelScope、Alibaba Cloud Model Studio を通じてプロのデザインおよびクリエイティブワークフローで利用できます。
公式サイト: https://qwen.ai/
Upscaler
Crisp Upscaler
Recraft の Crisp Upscale は、プロ印刷およびウェブ用途向けに設計された高速で精度重視の AI アップスケーラーです。元のコンテンツを改変することなく最大 4096x4096 ピクセルまで解像度を向上させ、シャープネスと明瞭さを維持します。迅速なターンアラウンドが必要なデザイナー、マーケター、販売者向けに構築され、数秒で画像を処理し最小限の計算コストで動作します。イラスト、ロゴ、商品写真、デジタル資産の高品質出力準備に最適です。Recraft のウェブプラットフォームで無料提供され、Replicate や Kie.ai などのパートナーを通じた API 統合でも利用可能です。
公式サイト: https://www.recraft.ai/image-upscaler
Creative Upscaler
Recraft の Creative Upscale は、解像度を上げつつ複雑なディテール、テクスチャ、顔の特徴を洗練する高度な AI アップスケーラーです。ピクセルを厳密に保存する標準的なアップスケーリングとは異なり、細部を改善して失われた情報を回復することで深みを賢く付加します。256px から 16MP まで処理可能で、ポートレート強化、商品写真の改良、芸術的画像の改善に優れます。結果の処理は Crisp Upscale より時間を要しますが、プロのクリエイティブ作業に対してより優れた品質を提供します。Recraft プラットフォームおよび Replicate、fal.ai などの API パートナーを通じてプロダクションパイプラインに統合できます。
公式サイト: https://www.recraft.ai/image-upscaler
Topaz Image Upscaler
Topaz Gigapixel AI は、Topaz Labs による業界をリードするプロフェッショナル向け画像アップスケーラーで、2019 年から商用提供されています。博士号取得研究者によって訓練された深層学習モデルを活用し、最大 600%(6 倍)まで画像を拡大でき、異なる画像タイプ向けに 9 種類の専門 AI モデルを備えています。ポートレート、風景、建築、圧縮画像をサポートし、ノイズやアーティファクトを低減しながらディテールを保持します。スタンドアロンのデスクトップアプリ(Windows/Mac)、iOS モバイルアプリ、Photoshop や Lightroom を含む主要編集ソフト向けプラグインとして利用可能です。プリント、修復、トリミングワークフローにおいてプロの写真家、ファインアーティスト、商業スタジオ、クリエイティブチームに広く採用されています。
最終更新