概要
Jinbaベクトル検索は、ベクトル埋め込みを使用してナレッジベースの意味検索機能を提供します。このツールはOpenAIのtext-embedding-3-largeを使用してクエリをベクトル化し、類似度スコアに基づいてナレッジベースから関連データを取得し、強力なRAG(Retrieval-Augmented Generation)機能を提供します。主要機能
- 意味検索: 完全一致だけでなく、概念的に類似したコンテンツを検索
- ナレッジベース統合: アップロードされたドキュメントとファイル全体を検索
- 類似度スコア: 類似度の閾値によって結果をフィルタリング
- 設定可能な結果: 返される結果の数を制御
- RAGサポート: 質問応答と情報取得ワークフローの構築に最適
認証
このツールは、ナレッジベースにアクセスするためにJinba APIトークンが必要です。 必要な設定:- token: Jinba APIトークン(シークレットとして保存)
入力パラメータ
- query (必須): 意味検索のための検索クエリ
- knowledgeBaseId (必須): 検索するナレッジベースのID
- topK (任意): 返すトップ結果の数(1-50、デフォルト: 3)
- threshold (任意): 結果をフィルタリングする類似度の閾値(0-1、デフォルト: 0.3)
出力構造
以下の情報を含む検索結果の配列を返します:- chunk: ID、ファイルID、コンテンツ、メタデータを含むコンテンツチャンク
- score: 類似度スコア(0-1、高いほど類似)
- file: ファイル名とコンテンツタイプを含むファイル情報
- query: 元の検索クエリ
- totalResults: 見つかった結果の総数
例: ドキュメント Q&A システム
例: リサーチアシスタント
例: コンテンツ推薦
ベストプラクティス
クエリ最適化
- 自然言語を使用: 人間に尋ねるような自然な文でクエリを作成
- 具体的に: より具体的なクエリの方が良い結果が得られることが多い
- コンテキストを含める: 関連するキーワードとコンテキスト語を追加
閾値の選択
- 0.7-1.0: 非常に高い類似度、完全または準完全一致
- 0.4-0.7: 高い類似度、密接に関連するコンテンツ
- 0.2-0.4: 中程度の類似度、潜在的に関連するコンテンツ
- 0.0-0.2: 低い類似度、間接的に関連するコンテンツを含む可能性
パフォーマンスのコツ
- topKを制限: 必要以上に多くの結果を取得しない
- 閾値を調整: 高い閾値 = より少ない、より関連性の高い結果
- メタデータを活用: 追加のフィルタリングにチャンクメタデータを活用
ナレッジベースの設定
ベクトル検索を使用する前に、ナレッジベースに関連ドキュメントが含まれていることを確認してください:- ドキュメントのアップロード: PDF、テキストファイル、その他のサポートされる形式を追加
- 処理: ドキュメントのチャンク化とベクトル化の時間を確保
- クエリのテスト: データを理解するためにシンプルなクエリから開始
- 反復: 結果に基づいてクエリと閾値を調整
使用事例
- カスタマーサポート: ユーザーの質問に関連する文書を検索
- 研究アシスタント: 関連する研究論文や文書を発見
- コンテンツ発見: 類似の記事やリソースを推薦
- FAQ自動化: 一般的な質問に自動回答
- ドキュメント分析: 大きなドキュメントセットから特定情報を検索
- ナレッジマネジメント: 組織知識への迅速なアクセス
- 法的研究: 契約書や法的文書の検索
- 製品情報: 技術仕様やマニュアルの検索