AI-ASSISTED EDITORIAL MEDIA
1件の記事 / ページ 1 / 1
長期運用されたAIエージェントは、より高性能なモデルへ切り替えるだけでは性能が向上しないどころか、むしろ低下する可能性があることを示す研究が公開された。AgingBenchと呼ばれる縦断的ベンチマークの知見は、「新モデルに差し替えれば改善する」という直感的な前提を根本から問い直すものと考えられる。