本サイトの記事や画像は、AIが公的資料や複数の報道を基に事実関係を整理・再構成し制作したものです。[続きを表示]特定の報道内容や表現を再利用・要約することを目的としたものではありません。ただし、誤りや不確定な情報が含まれる可能性がありますので、参考の一助としてご覧いただき、実際の判断は公的資料や各出典元の原文をご確認ください。[私たちの取り組み]
NTTは2026年5月19日、NTT版LLM「tsuzumi 2」について、図表を含む日本語ビジネス文書の読解能力を高めるアップデートを発表した。文書を画像として処理し、表やグラフ、チャートが示す関係性を扱えるようにした点が中心で、数値処理を含む実務向けの論理的思考能力も強化した。
図表入り文書を画像として読む新機能
今回のアップデートは、テキスト抽出だけでは拾いにくい図表の意味を扱うため、文書画像として入力された資料を処理する。表やグラフの配置、矢印、区分、数値の対応関係などを読み取り、図表が文書内で果たす役割まで把握しやすくする狙いがある。
NTTの評価では、図表付きの日本語ビジネス文書理解を重視した開発により、同サイズ帯のモデルと比べて世界トップレベルの性能を実現したという。発表タイトルでも「世界トップレベルの図表入り日本語ビジネス文書処理性能を1GPU環境で実現」と打ち出している。
想定する用途には、帳票から必要事項を抽出する作業や、原因判断フロー図の理解が含まれる。請求書、申請書、報告書、業務マニュアルのような文書では、重要な情報が文章だけでなく表や図の中に埋め込まれていることが多い。NTTは軽量モデルを強みとしており、機微情報を外部に出しにくいオンプレミス環境やプライベートクラウドでの利用とも親和性が高い。
既存基盤tsuzumi 2の機能更新
tsuzumi 2は2025年10月20日に提供が始まった、NTTの次世代日本語LLMである。企業や自治体の複雑な文書理解、専門知識を扱う業務への需要を踏まえて開発され、1GPUで推論できる特徴を継承している。大規模な計算資源を前提にしないため、電力消費や運用コストを抑えやすい点も訴求してきた。
図表理解の強化は、突然追加された機能ではなく、NTTが進めてきた視覚読解技術の延長線上にある。NTTは2024年4月、LLMが文書画像に含まれる図表などの視覚情報をテキストと融合して理解する技術を発表しており、その成果はtsuzumiのアダプタ技術として採用・導入されている。
アップデートしたtsuzumi 2は、NTTグループ各社を通じて順次サービス提供する予定だ。具体的な提供開始時期、提供会社、対象サービス名、価格、利用条件などの詳細は示していない。
参考・出典
- NTT版LLM tsuzumi 2アップデート ~世界トップレベルの図表入り日本語ビジネス文書処理性能を1GPU環境で実現~ | ニュースリリース | NTT
- LLMによる視覚読解技術を確立~グラフィカルな文書を理解する「tsuzumi」実現に向けて~ | ニュースリリース | NTT
- NTT’s Next-Generation LLM “tsuzumi 2” Now Available ~Supporting Japan’s corporate digital transformation with a high-performance, high-security, low-cost purely domestic LLM~ | Press Release | NTT
