Cloud BOT Operator

ブラウザを自動操作するAIエージェント

無料から使える『Cloud BOT Operator』

Cloud BOT Operatorは、自然言語での指示に基づいてAIエージェントがブラウザ操作を実行する機能です。OpenAIをはじめとする最新のAIモデルを活用し、複雑な判断を含む操作にも対応します。従来の定型業務自動化を超えた、柔軟で高精度な業務効率化を実現します。

現在、プレビュー版を無料でご提供中です。
プレビュー版は実験的機能としてご提供しており、無料でご利用いただけます。多くのフィードバックを元に改善を進めています。
※受付後、ご利用可能になるまでにお時間をいただく場合があります。

機能概要

Cloud BOT Operatorでは、自然言語での指示をAIに伝える「Operatorタスク」を作成し、AIエージェントが仮想ブラウザを自律的に操作します。ページ構成の変更や複雑なUIにも柔軟に対応し、完了後は従来のRPAタスクに引き継ぐことが可能です。

Operator機能の使い方はこちら

利用可能なAIモデル

Cloud BOT Operatorでは、用途やコストに応じて以下のAIモデルを選択できます。これらは大きく2つのカテゴリに分類されます。

構造認識モデル

HTML構造を解析し、ユーザーのプロンプトに従ってAIがブラウザ操作を行います。高速かつ効率的な操作が可能です。

モデル名 特徴
構造認識 - ECO 低コストで高速、シンプルな操作に適したモデル(gemini-2.0-flashを採用)
構造認識 - Smart 高性能かつ高速、柔軟かつ安定性の高いモデル(gpt-4.1を採用)

視覚認識モデル

ページを画像として視覚的に認識し、ユーザーの指示に基づいてAIが操作を行います。構造認識モデルに比べ精度は高いですが、処理速度はやや低下します。

モデル名 特徴
視覚認識 視覚認識による操作が可能な高性能モデル(computer-use-previewを採用)

Cloud BOT Operatorの活用例

予測できないポップアップを自動処理

ニュースや広告など不定期に表示されるポップアップを検知し閉じることで、RPAのスムーズな動作をサポートします。


目視確認が必要な操作への対応

画毎月並び順が変動する項目のクリック操作や目的の画像を選択するようなシーンにおいて、AIによる判断を含めた自動操作を実現できます。


複数Webサイトの操作を統一的に管理

異なるWebサイトに対する共通した検索やデータ抽出操作を自然言語で簡単に指示し、一元的な自動化を実現します。

プレビュー版利用に関する注意事項

  • プレビュー版は実験的機能の為、一部非対応の機能や動作が不安定になる場合がございます。
  • 正式版のリリースに向け、随時機能改善を実施してまいります。
  • AIはユーザーの意図とは異なる操作を行う可能性があるため、十分ご注意の上ご利用ください。
  • OpenAI社およびGoogle社のAIモデルを利用しており、処理に必要な一部データが各社に送信される場合があります。送信されたデータは、セキュリティや品質向上のため一時的に保管されることがあり、OpenAI社では最大30日間保存されます。Google社も同様の方針に基づき、一定期間データを保持する場合があります。
  • Cloud BOT Operator対応版のCloud BOT Agentは後日提供予定です。提供開始までの間は、クラウドブラウザをご利用ください。

多様なBOT機能とOperator機能を組み合わせて活用

Cloud BOT Agent

Cloud BOT Agentと組み合わせることで、IP制限のある外部サービスや、社内ネットワーク内のWebシステムに対しても、安全かつ柔軟にAIエージェントによる自動操作を実現できます。
Cloud BOT Agentに関してはこちら

certificate

クラウドBOTはクライアント証明書が必要なセキュアなWebシステムにも対応しており、Operatorの自動操作も同様にクライアント証明書により保護できます。
クライアント証明書の設定に関してはこちら

trigger

クラウドBOTが備えるスケジュールトリガーやメール受信トリガーなど、多様なトリガーからCloud BOT Operatorを呼び出すことで、幅広い業務シーンに柔軟に対応できます。
トリガーに関してはこちら

Cloud BOT Operatorの仕組み

通常タスク(RPAタスク)の操作

記録されたタスク手順に忠実にBOTが仮想ブラウザを自動操作します。

Operatorタスクの操作

Operatorタスクが開始されると、Operator(AIエージェント)が仮想ブラウザの操作をリアルタイムで引き継ぎ、プロンプトの指示に応じて自律的に操作を行います。操作完了後は再びBOTに制御が戻され、後続タスクが自動的に実行されます。

現在、プレビュー版を無料でご提供中です。
プレビュー版は実験的機能としてご提供しており、無料でご利用いただけます。多くのフィードバックを元に改善を進めています。
※受付後、ご利用可能になるまでにお時間をいただく場合があります。