Ahogrammer

Deep Dive Into NLP, ML and Cloud

2025-05-01から1ヶ月間の記事一覧

ゼロショットで画像を分類し、種類ごとにLLMでテキスト化・構造化する

RAGで使われる検索システムでは、テキストデータを対象とすることが多いですが、実際の文書には画像として重要な情報が含まれることも多くあります。これを踏まえ、LLMを用いて画像をテキスト化し検索できるようにする試みがありますが、人物写真や背景画像…