Auto-GPT で ChatGPT プロンプトを強化する

Auto-GPT で ChatGPT プロンプトを強化する

AIツールの機能は急速に進化しており、Google、Microsoft、OpenAIをはじめとする多くの企業が競争で優位に立つために競い合っています。まるで毎週のように新しい技術やアプリが登場し、AIが私たちにできることのハードルは絶えず引き上げられているかのようです。

Auto-GPTは、その最新の証拠です。ChatGPTの力を活用して、タスクやプロジェクトを自動で引き受け、ユーザーが毎回指示することなく、複数のステップをこなす自律型AIアシスタントを構築します。つまり、ユーザーが後続の返答やアイデアを考え出すことなく、多くの面倒な作業を自動で行ってくれるのです。

デスクトップウェブブラウザ上の AutoGPT プラグインのスクリーンショット

Auto-GPT はコンピューター上でローカルに実行できます。

自動GPT(David Nield経由)

ChatGPTでできることをすべて考えてみてください。そして、それを独自のフィードバックを提供し、独自の判断を下すシステムに組み込むことを想像してみてください。例えばコーディングを考えてみましょう。ChatGPTは仕様に基づいてコードブロックを出力できますが、Auto-GPTはソフトウェアプロジェクト全体を管理できます。

Auto-GPTにiOSとAndroidの違いを調査するよう依頼したところ、調査はサブタスクに分割され、ユーザーインターフェース、利用可能なアプリ、セキュリティとプライバシー機能などについて調査しました。これらのサブタスクは個別に実行・分析され、エージェントは調査結果を各カテゴリごとにテキストファイルに保存することで、後で簡単に参照できるようにしました。

Auto-GPTのもう一つの活用方法は、ウェブサイト作成者やポッドキャストリサーチャーなど、特定の役割を指定することです。そうすることで、Auto-GPTはそれに応じた動作を行い、進捗状況を常に通知してくれます。このソフトウェアにはある程度の学習が必要ですが、その機能を試してみる価値は十分にあります。

Auto-GPTはWebから最新の情報にアクセスでき、過去の行動を記憶できます。ツールのコードは無料で公開されていますが、OpenAI APIへのアクセスには料金がかかります。大規模言語モデルの最新バージョンであるChatGPT-4を入手するには、有料のOpenAIアカウントが必要です(アカウントがない場合、ChatGPT-3.5が利用できなくなります)。

デスクトップウェブブラウザ上の AutoGPT プラグインのスクリーンショット

Auto-GPT は OpenAI の ChatGPT を活用しています。

自動GPT(David Nield経由)

Auto-GPTはほとんどの時間、単独で動作しているため、軌道から外れる可能性が高くなります。ChatGPTは依然として不正確な情報や間違いを生じる可能性があることは承知しており、Auto-GPTでは、すべての段階で動作を常に確認しているわけではないため、これらの問題がさらに悪化する可能性があります。真に重要または影響のある事柄にAuto-GPTを信頼できる段階にはまだ程遠いのです。

しかし、AI技術の現在と近い将来における可能性を示す開発中の実験として、これは試してみる価値のある魅力的なツールであり、常に進化を続けています。他のユーザーがピザの注文からマーケティングキャンペーンの実施まで、様々なことに挑戦している様子をオンラインでチェックしてみてください。

Auto-GPT または AgentGPT のインストールと使用

GitHubプロジェクトをコンピューターにインストールする方法がわかっている場合は、Auto-GPTをダウンロードしてください。詳細な手順が必要な場合は、様々なOSやツール(DockerやPythonなど)を使ったインストール方法が多数あります。ここではWindowsでPythonを使ったインストール方法のみを取り上げますが、他の方法が必要な場合は、オンラインで多くのヘルプ情報が得られます。例えば、Auto-GPTの公式ドキュメントをご覧ください。

WindowsでPythonを使う場合、まずGitとPythonの両方をPCにインストールする必要があります。セットアップ中に「python.exeをPATHに追加する」オプションを必ず有効にしてください。手順は簡単ですが、何か問題が発生した場合は、Pythonのウェブサイトに豊富なサポートドキュメントがありますので、そちらを参照してください。

デスクトップウェブブラウザ上の AutoGPT プラグインのスクリーンショット

Auto-GPT は、動作中に何を実行しているかを通知します。

自動GPT(David Nield経由)

次に、GitHubからAuto-GPTをダウンロードする必要があります。最新リリースへのリンクをたどり、そこに表示されるzipファイルをダウンロードしてください。アーカイブを解凍したら、.env.templateというファイルを複製し、名前を.envに変更してテキストエディタで開きます。「OPENAI_API_KEY=your-openai-api-key」という行を探し、「your-openai-api-key」をOpenAIアカウントの実際のAPIキーに置き換えてください。

APIキーはこちらから取得できます。ChatGPTでは無料のAPI呼び出しは数回のみですので、お支払い方法の設定をお勧めします。最新の料金はこちらのページでご確認いただけます(執筆時点では、処理される情報1,000トークンまたはビットあたり数セントです)。お支払い方法を設定する際に、AutoGPTの費用が許容範囲を超えないように、支払い限度額を設定することもできます。

.env ファイルを保存して閉じたら、フォルダを右クリックして「ターミナルで開く」を選択することで Auto-GPT を起動できます。「pip install -r requirements.txt」と入力してEnter キーを押すと必要なライブラリがインストールされます。インストールが完了したら、「python -m autogpt」と入力して  Enter キーを押すと、Auto-GPT が起動します。これで、Auto-GPT を匿名で動作させることができます。必要な動作を指示するだけで、Auto-GPT が動作を開始します。

ボットの思考は画面に表示され、Auto-GPTが実行するプロセスの各アクションの確認を求められます。複数のアクションを連続して承認したい場合は、「yx」と入力してください。xは、ボットが承認なしで実行してもよいアクションの数です(これらのChatGPTリクエストには少額の費用がかかることをご承知おきください)。タスクが完了する前に終了する必要がある場合は、Ctrl+Cを使用してください。

デスクトップウェブブラウザ上の AutoGPT プラグインのスクリーンショット

AgentGPT は、Web 上で利用できる AI アシスタントです。

自動GPT(David Nield経由)

もしこれが面倒に思えて、もっとシンプルに試してみたいというなら、AgentGPT は Auto-GPT をベースにした類似のプロジェクトで、ブラウザで動作し、インストールも不要です。Auto-GPT ほど高度ではありませんが、初心者にもわかりやすく、自律型 AI エージェントで何ができるのかを知る手がかりになります。

Auto-GPTと同様に、AgentGPTを正しく動作させるには、ChatGPTのAPIキーを取得する必要があります(こちらも使用量に応じて課金されます)。このAPIキーは、左側の「設定」からツールに入力できます。画面上の入力欄にエージェントの名前と目標を入力し、「エージェントをデプロイ」を選択して起動します。タスクが生成され、完了すると、右側に表示されます。