はじめに
1ヶ月ほど前、AIエージェントとモデルの組み合わせを定量評価する「ts-bench」がlaisoさんによって公開された。
https://x.com/laiso/status/1961823485346603067
試しにローカルLLMで評価したところ、opencode + gpt-oss:120bの組み合わせがかなり良いスコアをたたきだすことに気づいた。
主にローカルLLMを用いたベンチ結果を知りたい方は、下記を参照されたい。
https://x.com/gosrum/status/1962869784271630467
https://x.com/huchkw/stat…
Source link
Views: 0