概要

ファイル対応GeminiはGoogleのGemini AIを使用して、PDF、画像、音声、映像ファイルなど様々なファイル形式に基づいてテキストを分析・生成できます。このマルチモーダルAI機能により、包括的なドキュメント分析とコンテンツ生成が可能になります。

主な機能

  • GEMINI_INVOKE_WITH_FILE
    • AIでPDFドキュメントの分析
    • 画像の処理と情報抽出
    • 音声・映像ファイルの処理
    • ファイルコンテンツに基づく構造化レスポンス生成
    • 複数ファイル形式のサポート

認証

APIキーをお持ちでない場合でも、Jinba APIクレジットを使用してGeminiツールを実行できます。独自のAPIキーを使用したい場合は、公式Geminiウェブサイトから取得できます。 注意: APIキーは機密情報として扱い、公開リポジトリにコミットしないでください。

例: ドキュメント分析

- id: analyze_document
  name: analyze_document
  tool: GEMINI_INVOKE_WITH_FILE
  config:
    - name: version
      value: gemini-1.5-flash
    - name: token
      value: "{{secrets.GEMINI_API_KEY}}"
  input:
    - name: prompt
      value: |
        このドキュメントを分析し、以下の情報を抽出してください:
        1. 主要なトピックとテーマ
        2. 重要なデータポイントと統計
        3. 実行可能な洞察
        4. 結論の概要
    - name: file_url
      value: "{{steps.input_file.result.file_url}}"

使用例

  • ドキュメントレビュー: 契約書、報告書、提案書の分析
  • コンテンツ抽出: 研究論文からの重要情報抽出
  • データ分析: 画像内のチャート・グラフの処理
  • メディア処理: 動画・音声コンテンツの分析
  • コンプライアンスチェック: 特定基準でのドキュメント審査