IT業界の技術をメモ・情報公開できる

Gemini 3.5 Flashに画面操作機能「Computer Use」を統合

登録日:2026-06-29    更新日:2026-07-01
AI
Gemini 3.5 FlashでAIがコンピュータ画面を認識し、クリックやキーボード入力などの操作を生成する「Computer Use」を組み込みツールとして利用できるようになった。
Webサイトでの反復的なデータ入力やフォーム入力、Webアプリケーションやユーザーフローの自動テスト、複数サイトをまたいだ調査などの用途が挙げられる。
画面内に隠された悪意ある指示や、取り消しにくい操作をどう扱うかが課題になる。
重大な判断、機密データ、深刻な誤りを修正しにくい操作を伴う用途では、利用可否を慎重に判断する必要がある。

claudeで作成したものをGeminiでフォームなどのテストができるようになるかもしれない。
【参照】thanks
https://ledge.ai/articles/google_gemini_3_5_flash_computer_use_integration

一覧に戻る