OpenAIのCodex CLIに追加された「/goal」は、AIコーディング支援を単発の相談相手から、完了条件に向けて継続的に動くエージェントへ近づける機能です。ただし、現時点では公式ドキュメント上の説明が十分とは言い切れず、不具合報告も見られます。本記事では、/goalで何ができるのか、/planやClaude Code、GitHub Copilot系エージェントと何が違うのか、実務で導入するならどこを確認すべきかを整理します。
Codex /goalとは何か:結論から言うと「完了条件に向けて継続する」ための機能
Codex /goalは、OpenAIのCodex CLIで長時間のコーディングタスクを扱いやすくするための新しいワークフローです。CodexのGitHubリリースノートでは、2026年4月30日の0.128.0で「persisted /goal workflows」が追加されたと説明されています。具体的には、app-server API、モデルツール、runtime continuation、TUI上のcreate、pause、resume、clear操作が含まれます。
一言でいえば、/goalは「この目的を達成するまで作業を続けてほしい」という状態をCodexに保持させる仕組みです。従来のチャット型AIでは、ユーザーが毎回「続けて」「次はテストを直して」「まだ終わっていない」と促す必要がありました。/goalは、その継続指示を明示的なライフサイクルとして扱う点に特徴があります。
ただし、現時点で注意すべきなのは、/goalが「すべてを自動で安全に終わらせる魔法のコマンド」ではないことです。OpenAIの公式slash-commandページでは、/plan、/status、/resumeなどの説明は確認できますが、確認時点では/goalの項目は掲載されていません。GitHub Issueでも、/goalの発見性やドキュメント整備を求める声が出ています。
何が発表されたのか:Codex 0.128.0で/goalワークフローが追加
OpenAIのCodex CLIは、ローカルPC上で動作する軽量なコーディングエージェントです。GitHubのREADMEでは、npmまたはHomebrewでインストールでき、ターミナルからcodexを実行して利用する形が案内されています。ローカルの作業ディレクトリでコードを読み、編集し、コマンドを実行する開発支援ツールと考えると分かりやすいでしょう。
0.128.0のリリースノートでは、/goalについて「永続化されたワークフロー」「runtime continuation」「TUI controls for create, pause, resume, and clear」といった表現が使われています。つまり、単にプロンプトの書き方が変わったのではなく、Codex側にゴール状態を保持し、停止・再開・解除できる操作体系が入ったことを意味します。
基本形は、次のような利用イメージです。
/goal 認証まわりのバグを修正し、関連テストが通る状態にしてください/goal READMEの手順と実装の差分を調査し、必要なドキュメント修正を行ってください/goal GitHub Issue #123の要件を満たす実装を行い、lintとテストを通してください
関連Issueでは、ローカルのcodex-cli 0.128.0に/goal <objective>、/goal pause、/goal resume、/goal clearに相当する文字列が含まれていると報告されています。ただし、これはIssue上の観測情報であり、利用環境やバージョンによって挙動が異なる可能性があります。実際に使う場合は、手元のcodex --versionやCLI内のヘルプ表示を確認してください。
なぜ注目されているのか:AIコーディング支援の焦点が「補完」から「完了」へ移っている
AIコーディング支援は、当初はコード補完や関数単位の生成が中心でした。その後、IDE内でファイルを編集し、テストを実行し、エラーを見て修正するエージェント型の使い方が広がっています。Codex /goalが注目される理由は、この流れの中で「作業をどこまで継続させるか」を明示的に扱おうとしている点にあります。
OpenAIのCodexベストプラクティスでは、プロンプトにGoal、Context、Constraints、Done whenを含めることが推奨されています。これは、AIに「何を作るか」だけでなく「どの条件を満たせば完了なのか」を渡すことが重要だという考え方です。/goalは、このGoalとDone whenの考え方を、CLIの操作体系に近づけたものと見ることができます。
特に実務では、「テストが通るまで」「CIの失敗原因を特定して修正するまで」「仕様との差分をなくすまで」といった終わりの条件が重要です。単にコードを生成するだけなら短いプロンプトで足りますが、実際の開発では、依存関係、既存設計、レビュー指摘、テスト、ドキュメント更新までを含む連続作業になります。
OpenAIの「長時間タスク」についての解説でも、長く走る作業では仕様、計画、制約、現在状態をファイルとして残す「durable project memory」が重要だと説明されています。/goalは、こうした長時間タスクの課題をCLI側で扱いやすくする方向の機能と捉えると理解しやすいです。
Codex /goalで何ができるようになるのか
/goalによって可能になるのは、AIに「次の1ターン」ではなく「達成すべき目的」を持たせる使い方です。これにより、短い相談の積み重ねでは扱いにくかった長時間タスクを、より一貫した流れで進めやすくなります。
従来できなかったこと:途中で目的が薄れる問題への対処
従来のチャット型AIコーディングでは、会話が長くなるほど目的がぼやけやすくなります。ユーザーが「続けて」と言っても、AIが何を完了条件と見なすかは曖昧になりがちです。/goalは、少なくとも設計上は、スレッド内に達成目標を保持し、Codexがその目標に向けて継続するための状態を持つ点が進歩です。
実務で使いやすいユースケース
/goalが向いているのは、数分で終わる単発作業よりも、調査、実装、検証、修正を繰り返すタスクです。たとえば、既存の認証機能を新仕様に合わせる、テスト失敗の原因を追って修正する、大きなリファクタリングの一部を安全に進める、ドキュメントと実装の不一致を洗い出して直す、といった作業が候補になります。
逆に、単純な関数の生成、短いSQLの作成、1ファイルだけの軽微な修正であれば、通常のプロンプトや/planで十分な場合があります。/goalは、タスクが長く、途中で検証や修正が必要で、完了条件を言語化できるときに価値が出やすい機能です。
Done whenを明確にすると強くなる
/goalを実務で使うなら、目的だけでなく完了条件を入れるべきです。たとえば「ログイン不具合を直して」ではなく、「ログイン不具合を再現するテストを追加し、既存テストと追加テストが通る状態まで修正してください」と書いたほうが、Codexは何をもって終わりとするか判断しやすくなります。
さらに、変更してよい範囲、触ってはいけないファイル、パフォーマンスやセキュリティ上の制約、レビュー時に見たい差分も指定すると、実務での事故を減らせます。/goalは自律性を高める機能だからこそ、最初に境界線を明確にすることが重要です。
既存競合との比較:/goal、/plan、Claude Code、GitHub Copilotの違い
/goalの価値を理解するには、単に「新しいslash command」として見るより、既存のAIコーディング支援との位置づけで考えるほうが実務的です。ここでは、Codexの/plan、AnthropicのClaude Code、GitHub Copilot cloud agentと比較します。
| 比較対象 | 主な役割 | 強み | 注意点 | 向いているケース |
|---|---|---|---|---|
| Codex /goal | 目標を設定し、完了に向けて継続する | ローカル環境で長時間タスクを進めやすい。pause、resume、clearのライフサイクルを持つ | 公式ドキュメントの整備が追いついておらず、バージョン差や不具合報告に注意が必要 | テスト修正、リファクタリング、仕様差分の解消など、完了条件がある作業 |
| Codex /plan | 実装前に計画を立てる | 曖昧な作業を分解し、実装前に方針を確認できる | 計画作成が中心であり、完了まで継続する専用ライフサイクルではない | 難しい変更の前に方針を固めたいとき |
| Claude Code | コードベースを読み、編集し、コマンドを実行するエージェント型コーディング支援 | ターミナル、IDE、デスクトップ、ブラウザなど複数の利用面を持ち、MCP連携も強い | 長時間タスクでは計画、コスト、途中停止、巻き戻しなどの運用設計が重要 | 対話しながら実装、調査、修正を進めたいとき |
| GitHub Copilot cloud agent | GitHub上でIssueやチャットから作業を委任し、ブランチやPRを作る | GitHubワークフローに統合され、IssueからPRまでつなげやすい | クラウド上の実行環境が前提で、ローカル環境固有の検証とは相性が変わる | Issue起点で作業を任せ、PRレビューに接続したいとき |
/goalと/planの違い
/planは、実装前に調査し、方針を整理するための機能です。OpenAIの公式slash-commandページでも、/planは「実装作業の前に実行計画を提案させる」用途として説明されています。一方、/goalは「計画を立てる」ことよりも、「設定した目的に向かって作業を続ける」ことに重心があります。
実務では、いきなり/goalで走らせるより、まず/planで作業分解とリスクを洗い出し、そのうえで/goalに完了条件を渡す使い方が現実的です。たとえば「まず/planで移行手順を整理し、承認後に/goalでテストが通るまで実装する」という流れです。
Claude Codeとの違い
Claude Codeは、Anthropicが提供するエージェント型コーディングツールです。公式ドキュメントでは、コードベースを読み取り、ファイルを編集し、コマンドを実行し、開発ツールと統合すると説明されています。Codex /goalとの違いは、/goalがCodex CLI内の「ゴール継続ライフサイクル」として追加された点です。
Claude Codeにも計画、探索、サブエージェント、MCP連携など、長い開発作業に役立つ機能があります。したがって、どちらが一方的に優れているというより、ローカルCLIで完了条件に向けて継続させたいならCodex /goal、既存のClaude Code運用やMCP連携を重視するならClaude Code、という使い分けになります。
GitHub Copilot cloud agentとの違い
GitHub Copilot cloud agentは、GitHub上でリポジトリを調査し、実装計画を作り、ブランチ上でコード変更を行い、必要に応じてPRにつなげる仕組みです。GitHub IssueにCopilotを割り当てる使い方とも相性がよく、チームのGitHubワークフローに組み込みやすいのが強みです。
一方、Codex /goalはローカルCLIの作業感に近く、手元の開発環境、ローカルテスト、未コミットの差分を見ながら進めやすい点が特徴です。PR作成までのクラウド委任を重視するならGitHub Copilot cloud agent、ローカルで細かく監督しながら長時間タスクを進めたいならCodex /goalが候補になります。
懸念点・注意点:現時点では「試験導入」から始めるべき
/goalは魅力的な機能ですが、実務で使うなら慎重な扱いが必要です。特に、確認時点では公式slash-commandドキュメントに/goalが掲載されておらず、GitHub Issue上では「/goalが認識されない」「thread/goal/get failed in TUI」といった報告もあります。
ドキュメントと実装の差分
0.128.0のリリースノートでは/goalの追加が明記されていますが、公式slash-commandページでは未掲載でした。これは、機能が存在しないという意味ではなく、公開ドキュメントと実装の整備タイミングに差がある可能性を示しています。記事執筆時点では、利用前にリリースノート、Issue、手元のCLIヘルプを照合するのが安全です。
バージョン差・環境差による不具合
GitHub Issueでは、0.128.0で/goalに関するエラーやTUI上の失敗が報告されています。Issueは個別環境の報告であり、すべてのユーザーに同じ問題が起きるとは限りません。ただし、新機能である以上、本番リポジトリでいきなり長時間実行するのではなく、検証用ブランチや小さなタスクから試すべきです。
自律実行による変更範囲の広がり
/goalは完了に向けて継続する性質を持つため、指示が曖昧だと変更範囲が広がる可能性があります。たとえば「管理画面を改善して」とだけ指示すると、UI、状態管理、API、テスト、ドキュメントにまたがる大きな変更になるかもしれません。実務では、対象ディレクトリ、触ってよいファイル、禁止事項、完了条件を明示する必要があります。
コストと時間の管理
長時間タスクは、モデル利用量や実行時間が増えやすい領域です。OpenAIの長時間タスク解説でも、進捗ログや評価指標を残す重要性が強調されています。/goalを使う場合も、何時間も放置するのではなく、途中で差分、テスト結果、ログ、失敗ループの有無を確認する運用が必要です。
導入メリットを得やすい人・組織
/goalの導入メリットを得やすいのは、「AIに任せたい作業」が明確で、かつ「完了条件を検証できる」人や組織です。単にAIツールが好きな人よりも、テスト、CI、レビュー、バックアップ、ブランチ運用が整っているチームのほうが、リスクを抑えながら価値を引き出せます。
向いている人・組織
まず向いているのは、テストが整備されたプロジェクトを持つ開発者です。/goalに「このテストが通るまで」「このE2Eシナリオが成功するまで」と渡せるため、Codexが完了を判断しやすくなります。反対に、検証方法が人間の目視だけに依存している場合、AIが「終わった」と判断しても品質を担保しにくくなります。
次に、リファクタリングや技術的負債の解消を小分けに進めたいチームにも向いています。大規模な設計変更を丸投げするのではなく、「このモジュールの型エラーをなくす」「この古いAPI呼び出しを新しい形式に置き換え、既存テストを通す」といった単位に分割できるなら、/goalは作業の継続性を高められます。
また、ドキュメントと実装の同期に課題がある組織にも有効です。README、API仕様、設定例、テストコードを横断して確認させ、「仕様と実装の差分を列挙し、最小限の修正を行う」といったタスクは、AIエージェントの得意領域に近いです。
現時点では向いていない人・組織
一方で、プロダクションコードを直接編集する運用しかなく、ブランチ、レビュー、テスト、差分確認の体制が弱い組織には向きません。/goalは継続的に変更を進めるため、間違った方向に進んだときの巻き戻し手段がないとリスクが高くなります。
また、仕様が曖昧なまま「いい感じに作って」と依頼する使い方にも向きません。/goalは目的が明確であるほど効果を発揮します。要件定義がまだ固まっていない段階では、まず/planや通常の対話で要件を整理し、完了条件を作ってから使うほうが安全です。
セキュリティや法令遵守が厳しい環境でも、いきなり導入すべきではありません。機密ファイルへのアクセス権、外部コマンド実行、ログの扱い、APIキーや.envファイルの保護などを確認したうえで、権限を絞った検証環境から始める必要があります。
実務導入を判断する際のポイント
Codex /goalを導入するかどうかは、「便利そうだから使う」ではなく、タスクの性質、検証方法、権限管理、失敗時の復旧手段を見て判断すべきです。以下の観点を確認すると、試験導入に向くかどうかを判断しやすくなります。
まず確認したい前提条件
第一に、対象タスクに明確な完了条件があるかを確認します。「テストが通る」「lintが通る」「特定のIssue要件を満たす」「ドキュメントと実装例が一致する」など、Codexが検証しやすい条件があるほど向いています。
第二に、作業範囲を限定できるかを確認します。対象ディレクトリ、変更してよいファイル、触ってはいけない設定、利用してよいコマンドを指定できるなら、/goalの暴走リスクを下げられます。逆に、範囲が広すぎるタスクは、まず人間が分割すべきです。
第三に、Gitのブランチ運用とバックアップがあるかを確認します。/goalに限らず、AIエージェントにファイル編集を任せる場合、差分確認、コミット単位の分離、巻き戻し可能性は必須です。
導入判断で見るべきポイント
精度については、単にコードが動くかだけでなく、既存設計に沿っているか、不要な抽象化を増やしていないかを見ます。/goalは長く動くほど変更量が増えるため、レビューしやすい粒度にタスクを絞ることが重要です。
再現性も重要です。同じ種類のタスクを複数回試し、成功率、修正量、レビュー指摘数を記録します。1回うまくいっただけでは導入判断には不十分です。小さなIssueを5〜10件ほど試し、人間が行う場合との所要時間と手戻りを比較すると判断しやすくなります。
コストは、利用プランやモデル、タスク時間によって変わります。長時間タスクでは、途中で失敗ループに入るとコストだけが増える可能性があります。一定時間ごとに進捗確認を入れる、ログを出させる、成果物を小さく区切るといった運用が必要です。
既存システムとの接続性では、ローカルテスト、Docker、DB、外部API、Issue管理ツールとの関係を確認します。Codexが検証に必要なコマンドを実行できない環境では、/goalの価値は下がります。
データの取り扱いでは、機密情報、顧客データ、APIキー、社内設定ファイルをCodexの作業対象に含めてよいかを確認します。ローカルで動くCLIであっても、モデル利用やログの扱いを組織のポリシーに合わせる必要があります。
試験導入から本格導入までの進め方
最初は、失敗しても影響が少ないタスクを選びます。たとえば、ドキュメント更新、テスト追加、型エラー修正、小さなリファクタリングが候補です。いきなり決済、認証、権限管理、データ削除などの重要領域を任せるべきではありません。
試験導入では、/goalの指示テンプレートを作ると効果を測りやすくなります。テンプレートには、目的、背景、対象範囲、制約、完了条件、実行してよいコマンド、最後に報告してほしい内容を入れます。OpenAIのベストプラクティスにあるGoal、Context、Constraints、Done whenの考え方をそのまま反映するとよいでしょう。
本格導入を検討する段階では、チームでレビュー観点をそろえる必要があります。AIが作った差分は、動作確認だけでなく、設計意図、保守性、セキュリティ、パフォーマンスの観点で確認します。特に/goalは長時間作業を前提にしやすいため、最終成果だけでなく途中の判断もログとして残す運用が望ましいです。
導入を急がなくてよいケース
導入を急がなくてよいのは、テストが少なく、仕様もドキュメント化されていないプロジェクトです。この状態で/goalを使うと、AIが正しさを検証できず、見た目だけ整った不正確な変更を作る可能性があります。まずテスト、README、開発手順、Issueテンプレートを整えるほうが先です。
また、短時間の補助だけで十分なチームも、無理に/goalを使う必要はありません。補完、短いバグ修正、レビュー支援が主用途なら、通常のCodex、Claude Code、GitHub Copilotの既存機能で足りる場合があります。/goalは、長時間タスクを明確に任せたいときに検討すべき機能です。
よくある質問
Codex /goalは誰でもすぐ使えますか?
利用可否はCodex CLIのバージョンや環境に依存します。0.128.0のリリースノートでは/goalの追加が確認できますが、公式slash-commandページでは確認時点で未掲載でした。GitHub Issueにも認識されない、TUIで失敗するなどの報告があります。まずcodex --versionを確認し、CLI内のヘルプやリリースノートを見たうえで、小さな検証タスクから試すのが安全です。
/goalと/planはどう使い分ければよいですか?
/planは実装前に方針を立てる機能、/goalは設定した目的に向けて作業を継続する機能と考えると分かりやすいです。実務では、曖昧な作業をいきなり/goalに渡すのではなく、まず/planで作業範囲、リスク、検証方法を整理し、その後に/goalで「この条件を満たすまで進める」と指示する流れが現実的です。
Codex /goalはClaude Codeより優れていますか?
一概には言えません。Codex /goalは、Codex CLI内でゴールを保持し、完了に向けて継続する点が特徴です。一方、Claude Codeはターミナル、IDE、デスクトップ、ブラウザなど複数の利用面を持ち、MCP連携やサブエージェントなどの広がりがあります。既存ワークフロー、利用モデル、チームのレビュー体制に合わせて選ぶべきです。
本番コードを/goalに任せても大丈夫ですか?
いきなり本番コードで大きな変更を任せるのはおすすめしません。ブランチを切り、変更範囲を限定し、テストやlintを完了条件に入れ、差分を人間がレビューする前提で使うべきです。特に認証、決済、個人情報、データ削除、権限管理などの領域では、AIの変更をそのまま信頼せず、セキュリティ観点のレビューを必ず行う必要があります。
/goalに向いているタスクの例は何ですか?
テストが通るまでのバグ修正、型エラーの段階的解消、古いAPI呼び出しの置き換え、READMEと実装の差分修正、小規模なリファクタリングなどが向いています。重要なのは、完了条件を明確に書けることです。「良い感じに改善して」ではなく、「このテストを追加し、既存テストと合わせて通る状態にする」のように具体化すると効果を出しやすくなります。
/goalを使う前に準備すべきことはありますか?
まずGitで巻き戻せる状態にし、作業ブランチを切ります。次に、実行してよいコマンド、触ってよいディレクトリ、完了条件、禁止事項を明記します。テストやlintがある場合は、最後に実行して結果を報告させるよう指示します。組織利用では、機密ファイルやAPIキーの扱い、ログ保存、権限設定も事前に確認しておくべきです。
Codex /goalは放置しておけば最後まで完成させてくれますか?
放置前提で使うのは危険です。/goalは継続的な作業を助ける機能ですが、要件の誤解、テスト不足、失敗ループ、変更範囲の拡大は起こり得ます。一定の節目で進捗、差分、テスト結果を確認し、必要ならpauseやclearを使う運用が重要です。人間のレビューと組み合わせて初めて、実務で使いやすくなります。
まとめ:Codex /goalは「任せる範囲」を設計できる人ほど価値を出せる
Codex /goalは、AIコーディング支援を「1回の回答」から「完了条件に向けた継続作業」へ近づける重要な機能です。0.128.0のリリースノートでは、永続化された/goalワークフロー、runtime continuation、TUIのcreate、pause、resume、clearが追加されたと説明されています。
一方で、現時点では公式slash-commandページに/goalの説明が十分に掲載されておらず、Issue上では不具合報告も見られます。そのため、実務導入では「新しい便利機能」として飛びつくより、検証用ブランチ、小さなタスク、明確な完了条件、途中レビューを前提に使うのが現実的です。
/goalが特に向いているのは、テストやlintで完了を確認できる長時間タスクです。Claude CodeやGitHub Copilot cloud agentとも競合しますが、ローカルCLIで完了条件に向けて継続させたい場合、Codex /goalは有力な選択肢になります。今後は、公式ドキュメントの整備、安定性の改善、実務事例の蓄積が注目点です。
参考ソース
- OpenAI Codex GitHub Repository
- OpenAI Codex Releases
- OpenAI Developers: Slash commands in Codex CLI
- OpenAI Developers: Codex Best practices
- OpenAI Developers: Run long horizon tasks with Codex
- OpenAI Developers: Iterate on difficult problems
- GitHub Issue: Document the /goal CLI command and Goals lifecycle
- GitHub Issue: /goal slash command does not work in 0.128.0
- GitHub Issue: thread/goal/get failed in TUI
- Anthropic Docs: Claude Code overview
- GitHub Docs: About GitHub Copilot cloud agent


コメント