https://github.com/browser-use/workflow-use
Browser Useから新しいブラウザ操作系エージェントが登場しました
めちゃくちゃ魅力的だったので紹介します。
従来のブラウザ操作系エージェント
browser-useに限らず、従来のブラウザ操作系エージェントはユーザーからの自然言語な指令をもとにブラウザを操作します。
AIエージェントは画面キャプチャ + DOMの取得 → キャプチャを解析 → クリックすべき要素を推論 → playwrightで操作をループしてタスクを行います。
現在僕もよく使っているのですが、何点か課題があります。
Views: 0