AIエージェント型IDEにAWSも参入、狙うはVibe Codingで「ウオーターフォール開発」
という記事を読んだ。
AWS Kiro は、Amazon が開発した AIエージェント型IDE 。
仕様書(spec)をAIが生成し、それを元にコード・テスト・ドキュメントを自動同期するとのこと。
プレビュー版は無料で提供中(利用制限あり)で、仕様駆動開発+AI自動化で、チームや個人開発の品質管理を支援するのが特徴らしい。
ChatGPTでコードを書くには、前提を記憶するためのメモリーが不足していて、推論が暴走しがちなんだけど、それと比べてKiroはどうなのか、ChatGPTに聞いてみた。
---
KiroとChatGPTを比較すると、確かに「メモリー」と「推論の安定性」で設計思想に違いがあります。
✅ ChatGPTの弱点
1. メモリー不足
セッションごとのコンテキスト長に制限があり、大規模なコードベースや長い仕様を完全に保持できない。
会話を跨ぐと情報がリセットされやすく、「前提が抜ける」問題が起きやすい。
2. 推論の暴走
曖昧な仕様を埋めようとして勝手に推測する。
過剰に「もっともらしい」コードを生成し、動作保証がない。
3. コードベースとの同期が弱い
実際のリポジトリやCI/CDと連動せず、会話の中だけで生成。
履歴・依存関係・バグ情報の参照が限定的。
✅ Kiroの設計(ChatGPTとの違い)
1. メモリーの強化
プロジェクト全体の仕様・コード・テストをAIが継続的に保持し、「spec」という中心ドキュメントで同期。
コンテキストは単なる会話ではなく、リポジトリと直結した「状態」として管理。
2. 推論の制御
AIが勝手に仕様を埋めるのではなく、まずspecを生成してからコードを作る二段階構造。
曖昧な部分は「未確定」としてフラグを立て、人間に確認を促す設計。
3. コードと仕様の常時同期
GitリポジトリやCI/CDと統合し、AIエージェントが実際のコードベースと動的にやり取り。
テストやレビューをフックで自動実行し、暴走を抑制。
✅ それでも残る限界
・仕様の曖昧さ問題は解決しない
Kiroも曖昧な仕様から完璧なコードは作れない。人間が要件を明確にしない限り、ChatGPTと同じ誤りを生む。
・モデルの性質は同じ
ベースはLLMなので、「もっともらしさ」の罠は完全には消えない。
過去のトラブル事例や現場固有のナレッジを注入しなければ、再発防止も限定的。
✅ 結論
ChatGPT:セッション依存の一時的メモリー、推論が暴走しやすい。
Kiro:プロジェクト全体を「状態」として保持し、spec-drivenで推論を制御する。
💡 要するに:
KiroはChatGPTより「メモリー管理」と「暴走防止」の仕組みが強化されており、実プロジェクト向き。
ただし、元仕様が曖昧なら結局は同じ問題に突き当たる。
KiroはAI IDEの進化版だが、万能ではなく、人間が仕様を明確にする責任は残る。
---
M5StackのUIFlowでMicroPythonのコード作成に適しているのは?も、Cursorも含めて聞いてみた。
---
UIFlow(M5Stack)+MicroPythonのコードを作成する目的なら、Cursor・ChatGPT・Kiroで向き不向きがはっきり分かれます。
✅ 各ツールの適性
ChatGPT
強み:
UIFlowのAPIやM5Stackのハード制御に関する知識を文章で引き出しやすい。
MicroPython特有の制約(メモリ、ライブラリの互換性など)を説明させるのに向く。
弱み:
プロジェクト全体のファイル構成を維持しにくい。
曖昧な仕様では推測でコードを書き、間違いが出やすい。
👉 短いサンプルコードや実験的スケッチには向く。
Cursor
強み:
エディタと連動してMicroPythonファイルを直接編集し、補完や修正ができる。
UIFlowで生成したスケッチを取り込み、リファクタリングや機能追加を行うのに便利。
リポジトリ全体を見ながらコード整合性を維持できる。
弱み:
UIFlowやM5Stack専用の知識はChatGPTほど多くない。
プロンプトなしで完全にゼロから書かせると精度は低下。
👉 UIFlowで作ったコードを整理・保守したい場合に向く。
Kiro
強み:
複数ファイルや設定を持つM5Stackプロジェクトを「spec+コード+テスト」で管理。
長期プロジェクトでコード・ドキュメントの同期を維持したい場合に有効。
弱み:
UIFlowやM5Stackに特化した知識はまだ少なく、仕様を自分で明確に書く必要がある。
単発のスケッチや小規模実験ではオーバースペック。
👉 大規模なM5Stackプロジェクトで、仕様書とコードを長期的に同期させたい場合に適する。
✅ 結論
試作や実験的スケッチ → ChatGPT
UIFlow生成コードの整理・拡張 → Cursor
長期プロジェクト+仕様とコードの一貫性維持 → Kiro
💡 UIFlow+MicroPythonの単発開発ならCursorが現実的で、ChatGPTを併用するとAPI理解や修正理由の解説が補強されます。
もしあなたの目的が「UIFlowで生成したスケッチをMicroPythonに書き換えて整理する」なら、Cursor+ChatGPTの併用が最も効率的です。
現状、UIFlow+MicroPythonに関しては ChatGPTが最も柔軟 なのは間違いありません。特にM5StackやUIFlowのAPI解説、ハード制御の例を出す部分では強いです。
---
簡単なGASなら、ChatGPTが良いかも聞いてみた。
---
はい、簡単なGAS(Google Apps Script)であればChatGPTが最適です。
✅ ChatGPTが向いている理由
1. API知識が豊富
Google Sheets, Gmail, Calendar, Drive などのGAS APIに関するサンプルを即生成できる。
トリガー設定や権限スコープの説明もセットで出せる。
2. 単発スクリプトに強い
「スプレッドシートからメール送信」や「Driveのファイル一覧取得」など、1ファイルで完結する処理なら精度が高い。
テストや実行もブラウザ上でできるため、環境依存の問題が少ない。
3. 自然言語からコード化が簡単
「スプレッドシートのA列を読み込んでメール送る」と書くだけで動くコードを出せる。
✅ 逆にChatGPTだけでは不向きな場合
複数ファイルに分かれた大規模GASプロジェクト
複雑な業務フローを仕様化して長期保守するケース
この場合はCursorやKiroでプロジェクト全体の管理が必要になります。
✅ 結論
簡単なGAS:ChatGPTが最善。
複雑なGAS:Cursor(コード整理) or Kiro(仕様とテスト管理)との併用が有効。
💡 要するに:
スプレッドシート連携や単発自動化ならChatGPTで十分。
チーム開発や長期運用を想定した大規模スクリプトだけ、他ツールを検討する価値があります。
---
自分が作る電子工作的な用途において、当面は、暴走しがちなChatGPTが最適なようだ。
が、ClaudeやCursorを実際に試してみたら、明らかにChatGPTよりも性能が良かった。
0 件のコメント:
コメントを投稿