NTTが大規模言語モデルに文書を視覚情報から理解する「視覚読解技術」を確立 NTT版LLM 生成AI「tsuzumi」に採用

シェア 0 ツイート 0 はてブ 0 NTTは、大規模言語モデル(LLM)によって文書を視覚情報も含めて理解する視覚読解技術を実現した。 実験において、文書画像を提示しながら、あらゆる質問への回答を行う人工知能(AI)の […]
The post NTTが大規模言語モデルに文書を視覚情報から理解する「視覚読解技術」を確立 NTT版LLM 生成AI「tsuzumi」に採用 first appeared on ロボスタ.
情報元サイト:「ロボスタ」
[ オリジナルサイトで見る ]

関連記事一覧

  • コメント ( 0 )

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。