- an operating System with AI.
ChatGPTを用いて、ユーザーの自然言語指示を受けて自動的に操作を行うOSを作成する。
- Python
- ChatGPTのAPI
- Debian
-
自然言語入力:
- ユーザーがターミナル上で「〇〇したい」(例:「gitをインストールして」)と入力する。
-
コマンド生成と確認:
- 入力された指示をChatGPT APIを用いて解析し、対応するコマンドを生成する。
- 例:「$ sudo apt install -y git」
- 実行前にユーザーに確認を求める。
- 例:「実行しますか? YES / NO」
-
自動実行:
- ユーザーが「YES」と回答した場合、自動的にコマンドを実行する。
- 実行結果をユーザーに表示する。
-
エラー処理:
- コマンド実行中にエラーが発生した場合、エラーメッセージを取得し、ChatGPT APIを用いて解決方法を提案・実行する。
-
スクリーンショット解析:
- ユーザーがターミナルに指示を入力すると、スクリーンショットを取得。
- 画像解析を行い、座標指定を通じて自動操作を行う。
-
高度な自動化操作:
- 画像解析による自動クリックやキーボード入力を含む高度な自動化操作を実現する。
- ユーザーが自然言語で指示を入力。
- 例:「gitをインストールして」「Pythonをアップデートして」
- ChatGPT APIを用いて指示を解析。
- 適切なコマンドを生成。
- 実行前に確認メッセージを表示。
- 例:「$ sudo apt install -y git (改行) 実行しますか? YES / NO」
- ユーザーの確認を受けてコマンドを実行。
- 実行結果を表示。
- 成功メッセージ
- エラーメッセージ
- コマンド実行中のエラーを検出。
- エラーメッセージを取得し、ChatGPT APIで解決策を提案。
- 自動的にエラーを解決するためのコマンドを実行。
- 指示に基づくスクリーンショットを取得。
- 画像解析を行い、指定座標に対して自動操作を実行。
-
プロトタイプ開発
- 基本機能(自然言語入力、コマンド生成、確認、実行、エラー処理)の実装。
- シンプルなコマンド操作を対象とする。
-
ユーザーテスト
- プロトタイプを用いたユーザーテストを実施。
- フィードバックに基づく改善。
-
高度な機能追加
- スクリーンショット解析機能の実装。
- 画像解析を通じた自動化操作の実装。
-
最終テストとリリース
- 全機能の最終テスト。
- 安定版のリリース。