Article

技術記事

生成AI解説

【Dify解説】Dify v1.12.0正式版リリース ─ サマリーインデックスとエージェントマルチモーダル対応の全貌

【Dify解説】Dify v1.12.0正式版リリース ─ サマリーインデックスとエージェントマルチモーダル対応の全貌
運営会社
サステックス株式会社

サステックス株式会社

元Microsoftエンジニアが立ち上げたAI・システム開発に特化したテクノロジーカンパニー。
機械学習や生成AIを活用したPoC開発や業務効率化、プロダクト構築を支援。

会社概要を見る →

サステックスのエンジニア、鈴木です。

2026年2月3日、オープンソースのAIノーコードアプリ開発プラットフォーム「Dify」の最新バージョン v1.12.0 の正式版がリリースされました。今回の目玉は、AIによる要約ベクトルで検索精度を飛躍的に向上させる「サマリーインデックス」 と、エージェントアプリでのマルチモーダル入力対応 です。

前回のアップデートに関しては、こちらの記事も参考にしてください。

DifyはChatGPTやClaudeなどのLLM(大規模言語モデル)を用いたAIアプリをプログラミング不要で構築できるノーコードツールで、社内チャットボットやFAQシステム、データベース連携型のAIアプリなどをエンジニアでなくても簡単に作成できます。

本記事では、Dify 1.12.0 の新機能とアップデート内容を初心者にもわかりやすく徹底解説し、前バージョンから何が変わったのか整理します。

はじめに ─ Difyとその進化の流れ

DifyはChatGPTやClaudeなど複数のLLMをノーコードで活用できるオープンソースのAI開発プラットフォームです。2025年後半から急速にプラットフォームとしての完成度が高まっており、v1.9.0でナレッジパイプラインとキュー駆動型グラフエンジン、v1.10.0でイベント駆動型ワークフロー、v1.11.0でマルチモーダルナレッジベースと、リリースのたびに大幅な機能強化が続いてきました。

この流れを受け、2026年初頭に登場したv1.12.0は 「ナレッジ検索精度の飛躍的向上」と「マルチモーダルAIの活用拡大」 をテーマとした重要なアップデートです。

Dify v1.12.0 アップデートの概要

v1.12.0では大きく以下のカテゴリに分けてアップデートが行われています。

  1. サマリーインデックス ─ AIによる要約を活用した高精度なナレッジ検索
  2. エージェントアプリのマルチモーダル対応 ─ 画像やファイルを入力として扱えるように
  3. ワークフロー機能の強化 ─ コンテキストの登録・読み取り、OpenTelemetry対応
  4. その他の改善 ─ Qdrant全文検索、プラグイン管理、テンプレートプレビュー、セキュリティ修正

以下で各機能を詳しく解説します。

サマリーインデックス ─ AI要約で検索精度を飛躍させる新機能

機能概要

今回の最大の目玉です。サマリーインデックスは、ナレッジベースの各ドキュメントチャンクに対してAIが要約を自動生成し、その要約ベクトルを追加の検索レイヤーとして活用する機能です。

従来のベクトル検索では、ドキュメントチャンクの生テキストをそのままエンベディングしていたため、長い文書や複雑なコンテンツでは意味の微妙なニュアンスやコンテキストが取りこぼされることがありました。特に重要な情報が複数のチャンクに分散している場合、ユーザーのクエリに最適なチャンクを見つけ出すのが困難でした。

サマリーインデックスは、チャンクごとにAIが簡潔かつ意味的に豊かな要約を生成し、その要約をベクトル化して検索に活用することでこの課題を解決します。

下記はナレッジベースのドキュメント処理画面です。High Qualityインデックスモードを選択し、エンベディングモデルとリランクモデルを設定することで、サマリーインデックスの恩恵を最大限に受けられます。

ナレッジベースのドキュメント処理設定画面。High Qualityモード、エンベディングモデル、検索設定が表示されている

主な機能と改良点

AI駆動の自動要約生成

設定したLLMモデルを使い、ドキュメントチャンクごとに簡潔な要約を自動生成します。要約はチャンクの核心的な情報をコンパクトに凝縮するため、元のテキストよりも検索でヒットしやすくなります。

マルチモーダル対応

Vision対応のLLM(GPT-4V、Claude 3など)を使用する場合、テキストだけでなくチャンクに含まれる画像も考慮した要約を生成できます。v1.11.0で導入されたマルチモーダルナレッジベースとの組み合わせで、より豊かなコンテキスト理解が実現します。

要約プロンプトのカスタマイズ

デフォルトの要約プロンプトが用意されていますが、業界やドメインに特化した要約スタイルにカスタマイズすることも可能です。例えば、法律文書向けに「契約条件と義務事項を中心に要約する」といった指示を設定できます。

非同期処理

要約の生成は非同期で実行されるため、ドキュメントのインデクシング処理がブロックされることはありません。バックグラウンドで順次要約が生成され、完了次第検索に反映されます。

要約の手動編集

AI生成の要約を手動で編集・修正することも可能です。自動生成された要約がドメイン特有の用語を正しく反映していない場合などに、人間が微調整できる仕組みです。

チャンキングモードとの互換性

Generalモード(通常のチャンク分割)とParent-Childモード(親子階層分割)の両方に対応しており、階層的なドキュメント構造でも適切に要約が生成されます。

使ってみた感想と活用例

実際にサマリーインデックスを有効にしてテストしてみたところ、特に長文のドキュメントや専門的なコンテンツでの検索精度が顕著に向上しました。 例えば、社内の技術仕様書をナレッジベースに登録した場合、従来はユーザーの質問と仕様書内の記述が表現的に一致しないとヒットしにくかったのですが、AI要約によって意味的に近い内容が見つかりやすくなっています。

要約生成にLLMのAPI呼び出しが必要になるためコスト面は考慮が必要ですが、検索精度の向上によりユーザー体験が改善される効果を考えれば、十分にペイする投資だと感じます。 特にカスタマーサポートやFAQシステムなど、検索精度がビジネス価値に直結するユースケースでは積極的に活用したい機能です。

なお、v1.12.0ではナレッジベースにアップロードしたファイルのダウンロード機能も追加されています。ドキュメント一覧からの個別ダウンロード、複数ファイルの一括ZIPダウンロードに対応しています。

ナレッジベースのドキュメント一覧。アクションメニューにDownloadオプションが追加されている

複数ドキュメントを選択して一括ダウンロード。下部のツールバーにDownloadボタンが表示されている

エージェントアプリのマルチモーダル対応

機能概要

エージェントアプリが画像やファイルなどのマルチモーダル入力をネイティブにサポートするようになりました。

これまでのエージェントアプリはテキスト入力のみを受け付けていましたが、v1.12.0からはユーザーが画像をアップロードしてエージェントに分析を依頼するなど、よりリッチなインタラクションが可能になります。

活用シーン

  • 画像解析: ユーザーがスクリーンショットをアップロードし、エージェントがエラー内容を分析して解決策を提案
  • ドキュメント処理: 請求書や契約書の画像をエージェントに渡して情報抽出
  • マルチモーダルRAG: v1.11.0のマルチモーダルナレッジベースと組み合わせて、画像を含む知識ベースからの検索と回答生成

エージェントの活用範囲が大幅に広がる機能追加であり、実務でのAIアプリの可能性がさらに拡張されます。

下記はv1.11.0のマルチモーダルナレッジベースと組み合わせたワークフローの例です。LLMノードでVISIONを有効にすることで、ナレッジベースから検索された画像情報もLLMに渡して回答を生成できます。v1.12.0のエージェントアプリでも、同様のマルチモーダル処理がネイティブに利用可能になりました。

ワークフローのLLMノード設定。VISIONトグルが有効になり、画像入力が参照されている

ワークフロー機能の強化

コンテキストの登録・読み取り

ワークフロー内でコンテキスト(状態情報)を登録し、後続のノードで読み取る機能が追加されました。ノード間でのデータ共有がより柔軟になり、複雑なワークフローの設計が容易になります。

例えば、最初のノードで取得したユーザー情報をコンテキストとして登録しておき、後続の分岐先ノードでその情報を参照して処理を変えるといった使い方が可能です。

シングル実行のOpenTelemetry対応

ワークフローのシングル実行(個別ノードのテスト実行)でもOpenTelemetryによるトレーシングが利用できるようになりました。開発・デバッグ時のパフォーマンス分析がより詳細に行えます。

Qdrant全文検索

Qdrantベクターデータベースでの全文検索(フルテキスト検索)機能 が実装され、複数キーワードでの検索にも対応しています。ベクトル類似検索とキーワード検索を組み合わせたハイブリッド検索が可能になり、ナレッジベースの検索精度がさらに向上します。

テンプレートプレビュー機能

アプリテンプレートからアプリを作成する際に、事前にテンプレートの詳細なプレビュー が確認できるようになりました。ワークフロー型のテンプレートではグラフの構造が、チャットボット型のテンプレートではアプリの設定がプレビューで表示されます。テンプレート選択時の判断がしやすくなります。

プラグインアンインストール時のAPIキー管理

プラグインをアンインストールする際に、APIキーを削除するか保持するか選択できるオプション が追加されました。プラグインを一時的に無効化したい場合にAPIキーを保持しておけるため、再インストール時の設定の手間が省けます。

セキュリティ修正

v1.12.0では複数のセキュリティ関連の修正が含まれています。

SQLインジェクション対策

ログストア機能における潜在的なSQLインジェクション脆弱性、シリアライゼーション問題が修正され、初期化処理も最適化されています。

SSRF脆弱性の修正

WordExtractorのURLダウンロード機能におけるSSRF(Server-Side Request Forgery)脆弱性が修正されました。

依存ライブラリのセキュリティアップデート

tanstack devtoolsのseroval RCE脆弱性対策、pdfminer.sixauthlibwerkzeugaiohttppycryptodome など複数のライブラリがセキュリティアップデートされています。

その他のバグ修正

ワークフロー・グラフエンジン

  • 単一のイテレーションノードやループノードが実行できない問題の修正
  • NextStepでターゲットノードが存在しない場合のクラッシュ修正
  • ToolInvokeMessage のUnion型パースの問題修正

API・バックエンド

  • /console/api ルートのCORSリソースパターンの修正
  • IRISハイブリッド検索がゼロ結果を返す問題の修正
  • 課金アカウント削除の不具合修正
  • vdb-migrateコマンドでの親子セグメントマイグレーション修正

フロントエンド

  • 「全チャンクを展開」ボタンが動作しない問題の修正
  • フローティング要素の縦スクロール対応
  • 画像アップロード時のNone URLバリデーションエラー修正

設定変更

v1.12.0で追加された環境変数を紹介します。

環境変数説明デフォルト値
SANDBOX_EXPIRED_RECORDS_CLEAN_TASK_LOCK_TTLサンドボックス期限切れレコードクリーンアップタスクのロックTTL90000
SMTP_LOCAL_HOSTNAMESMTP HELO/EHLOで使用するローカルホスト名のオーバーライド-
PLUGIN_MODEL_SCHEMA_CACHE_TTLプラグインモデルスキーマのキャッシュTTL3600
ENABLE_TRIAL_APPトライアルアプリの有効化false
ENABLE_EXPLORE_BANNERエクスプローラバナーの有効化false

アップグレード時の注意点

Docker Compose環境でのアップグレード手順は以下の通りです。

  1. カスタマイズしたdocker-compose YAMLファイルをバックアップ
  2. mainブランチから最新コードを取得
  3. docker compose down でサービスを停止
  4. ボリュームデータをバックアップ
  5. docker compose up -d でサービスを再起動

ソースコードからのデプロイの場合は、git checkout 1.12.0 でコードを取得後、APIディレクトリで uv sync による依存関係更新と uv run flask db upgrade によるDBマイグレーションを実行してください。

まとめ

Dify v1.12.0は、サマリーインデックスによるナレッジ検索精度の飛躍的向上という大きな機能追加により、RAGアプリの実用性をさらに高めるアップデートでした。AIが生成する要約をベクトル検索の追加レイヤーとして活用することで、従来のベクトル検索だけでは見つけにくかった情報にもリーチできるようになります。

加えて、エージェントアプリのマルチモーダル対応により、テキストだけでなく画像やファイルを入力としたAIアプリの構築が容易になりました。ワークフローのコンテキスト機能やQdrant全文検索、プラグイン管理の改善など、プラットフォームとしての完成度も着実に高まっています。

v1.11.0のマルチモーダルナレッジベースと今回のサマリーインデックス、エージェントマルチモーダル対応を組み合わせることで、テキスト・画像・要約の三層構造による高精度なRAGシステムの構築 が現実的になりました。企業でのAI活用を推進している方には、ぜひ試していただきたいアップデートです。今後もDifyのアップデート情報を追いかけていきますので、お楽しみに。

この記事の監修者
鈴木

鈴木

北海道大学情報科学研究院卒業。
フリーランスとして大手の開発プロジェクトを経験。
サステックスではバックエンドエンジニアの専門家として活動。愛猫家。

関連記事

【Dify解説】Dify v1.11.0正式版リリース ─ マルチモーダルナレッジベースとZenモードの全貌
生成AI解説

【Dify解説】Dify v1.11.0正式版リリース ─ マルチモーダルナレッジベースとZenモードの全貌

【Dify解説】Dify v1.10.0-rc1リリース ─ イベント駆動型ワークフローを可能にする新トリガー機能の全貌
生成AI解説

【Dify解説】Dify v1.10.0-rc1リリース ─ イベント駆動型ワークフローを可能にする新トリガー機能の全貌

【Dify解説】Dify v1.9.0正式版リリース ─ ナレッジパイプラインと新エンジンの全貌
生成AI解説

【Dify解説】Dify v1.9.0正式版リリース ─ ナレッジパイプラインと新エンジンの全貌

Nano Banana(Gemini 2.5 Flash Image)とは何か?Nano Bananaの使い方とよくある活用事例
生成AI解説

Nano Banana(Gemini 2.5 Flash Image)とは何か?Nano Bananaの使い方とよくある活用事例

【Dify】Dify 2.0.0-betaリリース! ナレッジパイプラインと新エンジンで何が変わった?
生成AI解説

【Dify】Dify 2.0.0-betaリリース! ナレッジパイプラインと新エンジンで何が変わった?

【Dify】Dify上で外部検索を実現する方法4選|Dify公式プラグイン・Tavily・Google API・独自APIの徹底比較
生成AI解説

【Dify】Dify上で外部検索を実現する方法4選|Dify公式プラグイン・Tavily・Google API・独自APIの徹底比較

【Dify】Dify v1.8.0 アップデート解説:新機能と改善点まとめ
生成AI解説

【Dify】Dify v1.8.0 アップデート解説:新機能と改善点まとめ

生成AI導入コンサルティング:成功のポイントと失敗しない進め方
生成AI解説

生成AI導入コンサルティング:成功のポイントと失敗しない進め方

記事一覧へ戻る
簡単1分で入力完了
お問い合わせはこちら