2026年4月23日、OpenAIはGPT-5.5を公開した。単なる世代更新ではなく、コーディング、調査、文書作成、ツール利用をまたいだ「実務処理の完遂力」を前面に出したのが特徴だ。注目点は、ベンチマークの数字だけではなく、曖昧な指示でもタスクを早く理解し、必要なツールを選び、検証しながら最後までやり切る設計思想にある。一方で、APIは記事執筆時点で近日提供にとどまり、料金もGPT-5.4より上がる。期待だけでなく、制約や注意点も含めて見ていきたい。
導入
結論から言うと、GPT-5.5は「ただ賢くなったモデル」ではなく、「仕事の流れを途中で止めにくいモデル」として位置づけると理解しやすい。OpenAIの公式発表では、複雑な目標の理解、ツールの使い分け、自己確認、長いタスクの完遂が強調されている。つまり、単発のQ&Aより、調査、資料作成、コーディング、表計算、複数ステップの作業といった“実務寄り”の使い方が主戦場だ。
日本時間の2026年4月24日時点では、ChatGPTとCodexで段階的に提供が始まっており、APIは「very soon(近日提供)」と案内されている。すでにAPIで使えるGPT-5.4と比べると、導入のしやすさではまだ差があるが、性能面ではGPT-5.4を全体的に押し上げる設計になっている。
何が発表されたのか
OpenAIは2026年4月23日に、通常版のGPT-5.5と、より高精度寄りのGPT-5.5 Proを発表した。ChatGPTではGPT-5.5 ThinkingがPlus、Pro、Business、Enterprise向けに展開され、GPT-5.5 ProはPro、Business、Enterpriseで利用できる構成だ。CodexではGPT-5.5がPlus、Pro、Business、Enterprise、Edu、Go向けに提供される。
仕様面で見逃せないのはコンテキスト長だ。OpenAIによると、CodexでのGPT-5.5は400Kコンテキストに対応し、Fast modeでは通常の1.5倍の速度でトークンを生成する一方、コストは2.5倍になる。API向けには1Mコンテキストの提供予定が示されており、価格はgpt-5.5が入力5ドル/100万トークン、出力30ドル/100万トークン、gpt-5.5-proが入力30ドル/100万トークン、出力180ドル/100万トークンと案内されている。
- ChatGPT:GPT-5.5 ThinkingはPlus以上、GPT-5.5 ProはPro以上
- Codex:GoやEduも含めて広く展開
- API:記事執筆時点では近日提供
- CodexのGPT-5.5:400Kコンテキスト
- APIのgpt-5.5:1Mコンテキスト予定
また、Codexのモデル文書では、GPT-5.5はChatGPTアカウントでサインインしたCodexで利用でき、少なくとも現時点ではAPIキー認証のCodex経由では使えないと説明されている。この点は、開発チームがすぐに既存フローへ組み込みたい場合の制約になりうる。
背景
GPT-5.5を理解するには、2026年3月5日に公開されたGPT-5.4との連続性を見る必要がある。GPT-5.4は「professional work」を掲げ、コンピュータ操作、ウェブ調査、文書・表計算・プレゼン作成といった業務タスクへの適性を前面に出したモデルだった。1Mコンテキストやネイティブなcomputer use能力も、GPT-5.4の重要な特徴だった。
そのうえでGPT-5.5は、性能の伸びそのものより、「少ない指示で意図をつかみ、適切なツールを使い、確認しながら完了まで持っていく」方向へさらに舵を切っている。OpenAIのGPT-5.5 System Cardでも、GPT-5.5は従来モデルより早くタスクを理解し、少ないガイダンスで動き、ツールをよりうまく使い、自己チェックしながら作業を進めるモデルだと説明されている。
つまり背景には、生成AIの競争軸が「一問一答の頭の良さ」から「長い仕事をどこまで現実的にやり切れるか」へ移っていることがある。GPT-5.5は、その流れの中で出てきた“実務完遂型”のアップデートとして捉えると分かりやすい。
この技術で何ができるようになるのか
GPT-5.5の進歩は、単に回答の品質が上がることではない。今までのモデルでは、複数のステップが絡む仕事ほど、ユーザーが細かく順番を指定し、途中で軌道修正し、出力を点検する必要があった。GPT-5.5はそこを縮める方向に進んでいる。
1. 曖昧な依頼でも、最初の理解が早くなる
たとえば「この競合製品を調べて、比較表と要約を作って」といった雑な依頼でも、必要なサブタスクを分解し、検索、整理、比較、文章化までの流れを組み立てやすくなる。従来よりプロンプト設計の手間が下がる可能性がある。
2. ツールをまたいだ仕事がしやすくなる
OpenAIはGPT-5.5を、コード、ウェブ調査、文書、表計算、情報分析を横断して使う前提で打ち出している。これは「検索だけ強い」「コードだけ強い」ではなく、途中で必要なツールを呼び出して作業をつなぐ能力を重視しているということだ。実務では、調査して、表にして、要点を文書化し、必要ならコードで処理する、という流れが多い。その一連の作業で人手の介在を少し減らせる可能性がある。
3. 長いコーディング作業での粘り強さが増す
OpenAIの評価では、GPT-5.5はTerminal-Bench 2.0や内部のExpert-SWEでGPT-5.4を上回っている。ここで重要なのは、アルゴリズムの正解率だけでなく、環境を触りながら直し続けるような実務コーディングで改善が見られる点だ。コード生成よりも、修正、検証、再実行の往復で差が出やすい。
4. 文書・オフィス系タスクの品質が底上げされる
OfficeQA Proのようなオフィス系評価でもGPT-5.5はGPT-5.4を上回っている。これは派手ではないが実務では重要だ。会議メモの整理、提案書の下書き、情報の抜き出し、表や箇条書きへの再構成といった“地味だが時間を奪う作業”で効いてくる可能性が高い。
要するに、GPT-5.5で新しくできるようになることは、ゼロから未知の作業を突然こなせるようになることより、「これまで人が細かく付き添っていた長めのタスク」を、より少ない手直しで進められるようになる点にある。
既存競合との比較
比較では、OpenAI自身が公式発表内で並べているGPT-5.4、Claude Opus 4.7、Gemini 3.1 Proを基準に見るのが分かりやすい。ただし、以下の数値はOpenAIが提示した評価表に基づくもので、第三者が同条件で全面検証した比較表ではない。特に公開評価の一部にはメモリ化の指摘が付記されているため、数字だけで優劣を断定するのは危険だ。
| 比較対象 | 性能面の見え方 | 向いている用途 | 導入しやすさ・制限 | 注意点 |
|---|---|---|---|---|
| GPT-5.5 | GPT-5.4比で、SWE-Bench Pro、Terminal-Bench 2.0、GDPval、BrowseComp、OfficeQA Proなどを全体的に改善 | 調査、資料作成、長めのコーディング、複数ツールをまたぐ仕事 | ChatGPT/Codexでは展開開始。APIは記事執筆時点で未提供 | GPT-5.4より単価は高い。すぐAPI投入したい現場には待ち時間がある |
| GPT-5.4 | 依然として高水準。APIがすでに使え、価格もGPT-5.5より低い | 本番導入を急ぐ開発、コストを見ながら業務自動化したいケース | ChatGPT、Codex、APIで使いやすい | 最先端性能では5.5に一歩譲る場面が増えそう |
| Claude Opus 4.7 | OpenAIの表ではSWE-Bench ProとFinanceAgentで強い数値を示す一方、BrowseCompやOfficeQA ProではGPT-5.5が上回る | コードや特定の専門タスク重視で比較検討したいケース | 本記事ではOpenAI側が提示した比較表を参照 | ベンダー間比較は評価条件の違いを必ず確認したい |
| Gemini 3.1 Pro | OpenAIの表ではBrowseCompで高い数値を示す一方、OfficeQA Proでは大きく差がある | 検索・調査系ワークフローを重視する比較対象として有力 | 本記事ではOpenAI側の公開比較に限定して整理 | 一部ベンチマークは未掲載で、横並び比較しにくい |
数値をいくつか挙げると、OpenAIの表ではSWE-Bench ProがGPT-5.5で58.6%、GPT-5.4で57.7%、Claude Opus 4.7で64.3%、Gemini 3.1 Proで54.2%となっている。BrowseCompはGPT-5.5が84.4%、GPT-5.4が82.7%、Claude Opus 4.7が79.3%、Gemini 3.1 Proが85.9%だ。OfficeQA ProではGPT-5.5が54.1%、GPT-5.4が53.2%、Claude Opus 4.7が43.6%、Gemini 3.1 Proが18.1%となっている。
この比較から言えるのは、GPT-5.5は“万能に近いバランス型”としてかなり強いが、すべての指標で常に1位というわけではない、ということだ。用途別に見ると、すぐ本番でAPI運用したいならGPT-5.4、ChatGPTやCodexで長い実務を安定して進めたいならGPT-5.5、他社モデルを含めた最適化をするならベンチごとの得意不得意を見比べる、という考え方が妥当だろう。
懸念点・注意点
第一に、APIがまだ使えない。OpenAIは「API deployments require different safeguards」と説明しており、安全性とセキュリティ要件を満たしたうえでの提供を進めている段階だ。つまり、ChatGPTやCodexで触れる人と、プロダクトへ直接組み込みたい開発者では、体験できるタイミングがずれる。
第二に、価格が上がる。API pricingでは、gpt-5.4が入力2.50ドル/100万トークン、出力15ドル/100万トークンなのに対し、gpt-5.5は入力5ドル、出力30ドルとなっている。OpenAIはトークン効率の向上を理由に実コストは単純比較できないとしているが、少なくとも単価は上がる。
第三に、ベンチマークの読み方だ。GPT-5.5の公開評価は魅力的だが、競合比較の多くはOpenAIが実施・公表したものだ。さらにSWE-Bench Proについては、公開ページ内でメモリ化の可能性に関する注記がある。実運用の価値は、社内の業務データや実際のワークフローで試して初めて見えてくる。
第四に、安全性は強化された一方で、完全に解決済みとは言い切れない。OpenAIはGPT-5.5について、これまでで最も強い safeguard を導入したと説明し、Preparedness Frameworkや高度なサイバー・生物分野のred teamingを実施したとしている。同時に、GPT-5.5 Bio Bug Bountyも開始しており、これは高度能力の安全性検証が継続中であることを示している。企業導入では、モデルが強くなったからこそ、権限設計、監査ログ、確認フローの見直しが必要になる。
第五に、利用可能プランの差だ。GPT-5.5 Thinkingは無料プランでは使えず、少なくともChatGPTではPlus以上が前提となる。チーム全体へ広げる場合は、ライセンス単価だけでなく、誰がどのプランでどこまで使うかを事前に決めておきたい。
よくある質問
GPT-5.5は無料で使えますか
記事執筆時点では、ChatGPTでのGPT-5.5 ThinkingはPlus、Pro、Business、Enterprise向けで、無料プラン向けではない。Codex側ではGoやEduにも展開されるが、無料で全面利用できる構成ではない。
GPT-5.5とGPT-5.5 Proの違いは何ですか
OpenAIはGPT-5.5 Proを、より難しい質問や高精度作業向けの上位設定として案内している。通常のGPT-5.5より精度重視だが、料金も高く、ChatGPTでも利用できるプランが限られる。
APIではいつ使えますか
OpenAIは「very soon」と案内しているが、この記事の執筆時点では具体的な一般提供日までは公表していない。すぐにAPIで必要なら、現時点ではGPT-5.4を使うほうが現実的だ。
GPT-5.4から今すぐ乗り換えるべきですか
ChatGPTやCodex中心で、調査やコーディングなど複数ステップの仕事を多くこなすなら、GPT-5.5を試す価値は高い。一方、APIで本番運用している、あるいはコスト管理を優先したいなら、すぐ全面移行せずGPT-5.4と並行評価するほうが安全だ。
ClaudeやGeminiより常に優れていますか
そうは言い切れない。OpenAIの比較表でも、指標によってはClaude Opus 4.7やGemini 3.1 Proが強い項目がある。モデル選定では、総合点よりも、自社で重視するタスクに近い評価と実地検証を優先したい。
まとめ
GPT-5.5は、GPT-5.4の延長線上にある改良版ではあるが、狙いはかなり明確だ。回答の賢さを見せることより、実際の仕事を途中で止めずに進めることに重心が置かれている。だからこそ、注目すべき読者は「最高スコアのモデルを知りたい人」だけではなく、「調査、資料、コード、分析をひと続きで扱う人」だ。
現時点では、ChatGPTやCodexで先に体験し、APIは続報待ちという見方が妥当だろう。導入判断では、GPT-5.5の改善幅だけでなく、料金差、プラン差、運用上の安全策、既存のGPT-5.4や競合モデルとの住み分けまで含めて見る必要がある。2026年春の生成AI競争を見るうえで、GPT-5.5は「より賢いモデル」ではなく「より仕事を終わらせるモデル」として捉えると、本質がつかみやすい。


コメント