ファイル抽出ツールは、Base64 形式でエンコードされたファイルから情報を抽出する機能を提供します。画像やドキュメントからテキストや関連データを抽出したい場合に特に便利です。
主な機能
PDF_EXTRACT_TEXT
: PDF ファイルからテキストを抽出
DOCX_EXTRACT_TEXT
: DOCX ファイルからテキストを抽出
EXCEL_EXTRACT_TEXT
: Excel ファイルから構造化データを抽出
例:Base64 ファイルからデータを抽出する
- id: extract_pdf
tool: PDF_EXTRACT_TEXT
config:
[]
input:
- name: pdf_base64
value: "{{secrets.PDF_FILE_BASE64}}"
- id: extract_docx
tool: DOCX_EXTRACT_TEXT
config:
[]
input:
- name: docx_base64
value: "{{secrets.DOCX_FILE_BASE64}}"
- id: extract_pdf
tool: PDF_EXTRACT_TEXT
config:
[]
input:
- name: pdf_base64
value: "{{secrets.PDF_FILE_BASE64}}"