「GPT-4」を上回る性能で、グラフィカルな文書を読解するLLM技術

NTTは2024年4月12日、大規模言語モデル(LLM)の活用により、文書に含まれる図表やグラフなども含めて理解し、自然言語での指示に従って読解/応答する「視覚読解技術」を実現したと発表した。
情報元サイト:「EE Times Japan」
[ オリジナルサイトで見る ]

関連記事一覧

  • コメント ( 0 )

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。