Gemini 3.5 Flashに画面操作機能「Computer Use」を統合
登録日:2026-06-29
更新日:2026-07-01
AI
Gemini 3.5 FlashでAIがコンピュータ画面を認識し、クリックやキーボード入力などの操作を生成する「Computer Use」を組み込みツールとして利用できるようになった。
Webサイトでの反復的なデータ入力やフォーム入力、Webアプリケーションやユーザーフローの自動テスト、複数サイトをまたいだ調査などの用途が挙げられる。
画面内に隠された悪意ある指示や、取り消しにくい操作をどう扱うかが課題になる。
重大な判断、機密データ、深刻な誤りを修正しにくい操作を伴う用途では、利用可否を慎重に判断する必要がある。
claudeで作成したものをGeminiでフォームなどのテストができるようになるかもしれない。
- 【参照】thanks
-
https://ledge.ai/articles/google_gemini_3_5_flash_computer_use_integration