どうも、MAXモード実装日にお試ししたら、1プロンプトで170リクエストが飛んだGOEMONです。

https://twitter.com/Goemon_Tokyo/status/1921829153113882904

Cursorの料金体系が変更されて、MAXモードが搭載されてから定額で使える分と従量課金がイマイチわからない or MAXモードでいくらかかるのかわからない方も多いと思います。そのための解説記事。

1.基本は1チャット = 1リクエストの定額

まず大前提、20ドル/月のProプランに加入していれば、毎月 500リクエストまで定額内で実行できます。

gemini-2.5-proやClaude 3.7 Sonnetなどのプレミアムモデルは基本的に1回のメッセージを送ってAIモデルから応答が返ってくると1リクエストが消費されます。

20ドルで500リクエストなので、1リクエスト = 0.04ドル です。

これが基本です。これは誰でも理解できるシンプルな設計で、5月のプラン設計変更でわかりやすくなりました。

2.モデルによって1メッセージあたりのリクエストコストが違う

1リクエストが0.04ドルでなので20ドル/月支払えば、500リクエスト使える。ということがわかりました。

ただ、1メッセージ = 1リクエスト ではないのが少し厄介。

Cursorにはリクエストコストというのが設定されています。

例えば、DeepSeek V3、Cursor Smallのような性能の低いAIモデルの場合は 1メッセージ = 0リクエストで無料です。期間限定かもしれませんが、今なら Gemini 2.5 Flashも0リクエスト消費です。いくら使っても定額内の500リクエストが消費されることはありません。

一方で、Claude 3.7 SonnetやGemini 2.5 Proといったモデルよりさらにハイコストなモデルや推論モード(Thinkingモード)を利用する場合には1メッセージで2リクエスト、2.5リクエストが消費されます。

例、
・Claude 3.7 Sonnet:1リクエスト / メッセージ
・Claude 3.7 Sonnet thinking(脳みそマーク付ける):2リクエスト / メッセージ
・o1 Mini:2.5リクエスト/ メッセージ
・o1:10リクエスト/ メッセージ
といった具合です。

この1メッセージあたりのリクエスト消費数がリクエストコストですね。

これはCursorの公式ドキュメントに記載があるので、最新版を常にチェックするといいです。

単純な1メッセージで1リクエスト、月500回まで使えるというわけでなく、良いモデルやThinkingモードを使う場合には月500回より少なくなることもあるわけです。もちろん、無料モデルや安価なモデルを使えば月500回以上使うことも可能です。

3.MAXモードは計算がさらに複雑な1Mトークンベース

さて、おそらくこの記事にたどり着いている方の大半が気になっているのが、このMAXモードの計算。

これはドキュメント通りに言えば「トークン量に応じて計算された価格と使用したAIモデルのAPI料金に20%のマージンを乗せた額」となるのですが、まぁわかりにくい。

ユーザーとして認識しておくべきなのは、MAXモードを使うと最終的には使用トークン量に応じて、MAXモードのリクエストコスト換算されてリクエスト消費量が決まる、ということです。

どういうことか日本語でわかりやすく分解すると、
一. AIモデルごとに100万トークンあたりのリクエストコストが設定されている
二. MAXモードでプロンプトを実行し、実際に使われたトークン数が確定する
三. 使ったトークン数とリクエストコストから、消費リクエストが計算されて確定する
という流れです。

まだわかりにくいですね。

4.CursorのMAXモードの実際のリクエスト消費の計算

実際の計算例を入れるとわかりやすいです。

例えば、Claude 4 SonnetでMAXモードを使った場合を想定して計算してみます。

Claude 4 SonnetのMAXモードリクエストコストは100万トークンあたり、
Input:90 リクエスト / 100万トークン
Output:450 リクエスト / 100万トークン
に設定されています。

CursorでClaude 4 Sonnet MAXモードを選択し、機能開発をお願いしたとします。

この結果、InputとOutputで消費したトークン数が
Input:8万トークン
Output:10万トークン
だとすると、下記のような計算が走ります。

消費リクエスト数=(Inputトークン数 / 100万)​× Inputリクエストコスト 90 + (Outputトークン数 / 100万)​× Outputリクエストコスト 450

見やすくすると、

これに先程の消費トークン数を代入して、

消費リクエスト=52.5リクエスト

となりました。

これがClaude 4 SonnetのMAXモードで
Input:8万トークン
Output:10万トークン
を使った際のリクエスト消費量です。

そして!この 52.5リクエストが月額20ドルで払っている 500リクエストから差し引かれます。

普通に使っていれば500回ぐらいのメッセージができるはずが、MAXモードを使うと一発で50とか100といった単位のリクエストが走るのは、こういう計算があるからなのです。

5.MAXモードは追加課金しないと使えない、は嘘

TwitterでMAXモードは追加課金しないと使えないといった誤った情報を拡散している方を散見しますが、それは嘘です。普通にProプランの500リクエスト内で使えます。

もし、500リクエストを超過する場合にはその分は追加課金が必要です。

そのため、MAXモードは従量課金をONにはしないといけません。これは500リクエストがフルに余っている状態でもONにしないといけない仕様です。

なぜなら、計算式から分かる通り、一発で100や200のリクエストが飛ぶので、従量課金をONにしてある程度予算を設定してないとタスクの途中で上限に達して停止してしまい、中途半端に無駄な金が飛びかねないからでしょう。

例えば月初なら500リクエスト残っているのでいいですが、契約更新の1週間前の残り50リクエスト状態でMAXモードを走らせたら、本来150リクエストかかるタスクが中途半端に50リクエスト段階で止まってしまい、何も完成してないコードが途中で止まるという、無駄なリクエスト消費になってしまいます。

それを懸念して従量課金ONである程度予算は設定してね、ということなんだと理解しています。

とりあえず試してみたい方は従量課金ONにして予算を10ドルなどに設定し、契約更新してリセットがかかり500リクエスト残ってる段階などで試すといいと思います。

6.従量課金分の料金計算

さて、Proプランの月20ドルを支払って500リクエストが定額内で使えるわけですが、その超過分の従量課金がいくらになるのか、ここまで読んでいればすんなりと理解できるかと思います。

追加の従量課金は
1 リクエスト = 0.04ドル
で課金されます。

最初にお伝えしたとおり、月20ドル = 500リクエスト → 1リクエスト = 0.04ドル ですので、定額分の500リクエストを越えると、同じ単価で追加の課金が必要になります。

それなら最初からProプランなんて言わずに 1リクエスト 0.04ドルの全部従量課金プランでいいじゃん。って思う気もしますが、Cursor側にも色々あるのでしょう。笑

そして繰り返しになりますが、1リクエストというのはモデルやモードごとにリクエストコストが違うので、必ずしも1回の応答で1リクエストにはならず、プレミアムモデルのThinkingモードやMAXモードを使うと1応答で2リクエスト、50リクエストなどが発生するため、しっかりと使うモデルのリクエストコストを公式ドキュメントで確認しましょう。

7.Cursorで500リクエスト使い切る人はClaudeのMaxプランでClaude Codeがオススメ

ただ、個人的にはCursorのMAXモードはコスパが悪いので、500リクエストを超えるぐらいCursorを使っている人なら、ClaudeのMAXプランを契約してClaude Codeぶんまわしをススメます。

Claude 4 Sonnet / Opusが出てからClaude CodeとCursorを併用し始めましたが、Claude Codeの方がめちゃくちゃアウトプットの質がいいし、実質使い放題です。

CursorでClaude 4 Sonnetを指定して使いまくっている方は、Claude Codeオススメします。

下記の記事にCursorのMAXモードとClaude CodeのMaxプランについても説明を書いておいたので、興味ある方はどうぞ↓

Categorized in: