Google は Gemini の有料プラン (Google AI Pro / Ultra) において、最大 100 万トークンのコンテキストウィンドウを利用できるとしていますが、この数値が Gemini アプリのチャット内での会話に適用されていないことが複数のユーザーから報告されています。
最大 100 万トークンは、テキスト換算で約 1,500 ページ、コード換算で約 3 万行に相当するとされていますが、ユーザーの報告が事実であれば、実際には数 % しか利用されていないことになります。
公称と実際が大きく異なる
数か月前から Reddit などでも同様の問題が多数報告されていますが、この問題を報告している X ユーザーは、最初のプロンプトで大容量のファイルを読み込ませることは可能であるものの、その後の会話を通じたコンテキスト (KV キャッシュ) は約 1.6 万トークン、大体 25 〜 30 メッセージで頭打ちになるとしています。
この制限に達すると、最初に与えた指示やコードブロック、制約条件を Gemini が同じセッション内で忘れてしまう現象が発生します。


そのため、Gemini のサーバーは 100 万トークン規模のデータを受け取ること自体はできるものの、チャットとして会話を続けながらその全体を参照し続けることはできないことが示されています。


AI Studio では正規の動作を確認
一方で、一部のユーザーから Google AI Studio では正規のコンテキストウィンドウが機能していると報告されています。
AI Studio は開発者向けの実験・プロトタイピング環境であり、一般ユーザーが使う Gemini アプリとは別物です。
Google の開発者向けドキュメントには入出力トークンの仕様が記載されており、入力は最大 100 万トークン、出力はおよそ 6.5 万トークンとされていますが、出力の数値が一般の Gemini チャットにも適用されるかどうかは明記されていません。
まとめ
Google はモデルの仕様としての 100 万トークンと、チャットで実際に機能するコンテキストウィンドウを区別した説明を行っておらず、有料プランに加入したユーザーには誤解を招く表記となっています。
この点について明確になるまでは、同一チャット内で継続するのではなく、独立したチャットに分けて実行するか、Google AI Studio を利用することをおすすめします。
- 関連記事:








