タイトルの通り、0.50のアップデートで料金周りの変更があったのでメモ程度にまとめます。
なお、著者はCursor Pro($20/月)を利用しているので、以降はそれが前提で話を進めます。
関連
公式リリースノートです。0.50では料金以外もたくさんの変更が行われました。
日本語でまとめてある記事があったのでこちらもオススメです。
前回まで
0.49以前のバージョンについてです。
Proプランでは500リクエスト分与えられ、指定されたモデルを利用すると消費される仕組みです。
代表的なモデルは下記です。
- Claude 3.5 Sonnet
- Claude 3.7 Sonnet
- Gemini 2.5 Pro
- GPT-4.1
- GPT-4o
- o4-mini
ただし、Claude 3.7 Sonnetのthinkingモデルのみ特殊で、1回で2リクエスト消費される仕様だったようです。
なお、以下のモデルは性能は劣りますが無制限で利用することができます。
500リクエストを超過した場合は、利用料に応じて課金されます。
1リクエストにつき$0.04の追加課金なので、Proの基本料金(500リクエスト/$20)と単価は同じです。
ちなみにこの超過分の上限値は設定画面で制御できます。
一部の高級モデルではProのリクエストは消費されずに、使用したら使用した分お金がかかる従量課金形式になっていました。
例えば1回の質問の料金は以下のようになっていました。
モデル名 | 料金 |
---|---|
o1 | $0.40 |
o1-mini | $0.10 |
o3 | $0.30 |
gpt-4.5-preview | $2.00 |
claude-3-7-sonnet-max | $0.05 |
gemini-2-5-pro-exp-max | $0.05 |
ver. 0.50での変更
Proプランでは500リクエスト分与えられるのは変わりませんが、バージョン0.50では、基本的には全てのモデルで質問した回数に基づいて課金されるようになります。
つまり、一部を除きどのモデルを利用しても1質問は1リクエストとして消費されます。
例外は以下です。
モデル名 | 例外 |
---|---|
claude-3.7-sonnet-thinking-max | 2リクエスト消費 |
gpt-4o-miniの廉価モデル | 消費なし |
o3 | MAXモードのみ利用可 |
今までの形態とあまり変わりはないですね。モデル毎の価格差がなくなったのでスッキリしました。
このリクエスト消費形式を通常モードと呼ぶようです。
MAXモード
質問単位でなく、使用したトークン数に応じてリクエスト数が計算される方式です。
公式の説明によると、複雑な推論、難しいバグ、エージェントタスクに最適な方法とのことです。
どれくらいのリクエストに換算されるかですが、以下のような計算になるようです。
サイレント値上げ…?
私は普段から少しむずかしそうなタスクにはo3を使うようにしていたので、MAXモードでしか使えなくなったのは少し痛手です。
実際どれくらい差が出るのか調べてみましょう。
まずは前のバージョンまでのo3の1度の質問に対する費用をリクエスト換算すると、
o3は一回$0.3で、通常は$0.04/リクエストのため、7.5リクエスト 相当になります。
ver. 0.50では、上記の図から1M入力トークンで300リクエスト相当になるので、7.5リクエストは25k入力トークンになります。
出力トークンを考慮すると20k入力トークンが妥当でしょうか。
つまり、これ以下のトークン数であれば、今回のMAXモードのほうが安いことになります。
参考程度に、以下のサイトで1200行のTypeScriptのコードを読み込ませたらちょうど10kトークンほどでした。
大量のファイルを気軽に読み込ませたら大変なことになりそうです。
Views: 2