本サイトの記事や画像は、AIが公的資料や複数の報道を基に事実関係を整理・再構成し制作したものです。[続きを表示]特定の報道内容や表現を再利用・要約することを目的としたものではありません。ただし、誤りや不確定な情報が含まれる可能性がありますので、参考の一助としてご覧いただき、実際の判断は公的資料や各出典元の原文をご確認ください。[私たちの取り組み]
長時間にわたる作業をAIに任せる流れが加速する。米AI新興のアンソロピックは米西海岸時間2月5日(日本時間6日)、改良型モデル「Claude Opus 4.6」を発表した。昨年11月の「Opus 4.5」からの更新で、複雑な業務をより安定して回せる点を前面に出す。
Opus 4.6投入 長時間タスクと信頼性
同社の案内ページでは、Opus 4.6を「最も高性能なモデル」と位置づけ、コーディング、エージェント機能、企業の業務フローでの精度と再現性を高めたとしている。提供はClaudeの有料プラン(Pro/Max/Team/Enterprise)に加え、開発者向けAPIでも始めた。
大きな変更点の一つが、最大100万トークンの長文コンテキスト対応(ベータ)だ。TechCrunchによると、大規模なコードベースや多数の資料を前提にした作業で、途中で破綻しにくい設計を狙う。価格は入力100万トークン当たり5ドル、出力は25ドルからとしている。
エージェントチーム 業務ツール連携
新機能として「Agent Teams(エージェントチーム)」も打ち出した。TechCrunchによると、1体のAIが順番に処理するのではなく、複数のエージェントに仕事を分け、並行して進める考え方だ。長い開発タスクを「手戻り少なく進める」用途を強く意識している。
ITmediaは、計画力や自律的な遂行能力の伸びを特徴に挙げ、知識労働の価値を測る指標「GDPval-AA」で競合モデルを上回る水準を示したと伝えた。The Vergeも、文書・表計算・資料作成などの実務で修正回数が減り、金融分析を含む用途の広がりを狙う動きだと報じている。
モデルの性能競争は「賢さ」から「長く、崩れず、仕事が終わるか」へ軸が移った。長文コンテキストと複数エージェントは、AIを単発の回答機械ではなく、作業工程そのものに組み込むための土台である。企業側には、品質管理と責任分界をどう設計するかが問われている。
