クイックスタート
コアワークフロー
すべてのブラウザ自動化は以下のパターンに従います:
# 1. 移動
agent-browser open example.com
# 2. スナップショットを取得して要素参照を取得
agent-browser snapshot -i
# 出力:
# @e1 [heading] "Example Domain"
# @e2 [link] "詳細情報..."
# 3. 参照を使用して操作
agent-browser click @e2
# 4. ページ変更後に再スナップショット
agent-browser snapshot -i一般的なコマンド
agent-browser open example.com
agent-browser snapshot -i # 参照付きのインタラクティブ要素を取得
agent-browser click @e2 # 参照でクリック
agent-browser fill @e3 "[email protected]" # 参照で入力フィールドに記入
agent-browser get text @e1 # テキストコンテンツを取得
agent-browser screenshot # テンポラリディレクトリに保存
agent-browser screenshot page.png # 特定のパスに保存
agent-browser close伝統的なセレクタ
CSSセレクタとセマンティックロケータもサポートされています:
agent-browser click "#submit"
agent-browser fill "#email" "[email protected]"
agent-browser find role button click --name "Submit"ヘッドモード
デバッグ用にブラウザウィンドウを表示:
agent-browser open example.com --headed内容待ち
agent-browser wait @e1 # 要素の表示を待つ
agent-browser wait --load networkidle # ネットワークがアイドル状態になるまで待つ
agent-browser wait --url "**/dashboard" # URLパターンを待つ
agent-browser wait 2000 # ミリ秒単位で待つコマンドチェーン
単一のシェルコール内で && を使ってコマンドを連結できます。ブラウザはバックグラウンドデーモンによって保持されるため、チェーンは安全かつ効率的です:
# 1回の呼び出しで開く、待つ、スナップショットを取得
agent-browser open example.com && agent-browser wait --load networkidle && agent-browser snapshot -i
# 複数の操作をつなげる
agent-browser fill @e1 "[email protected]" && agent-browser fill @e2 "pass" && agent-browser click @e3
# 移動してキャプチャ
agent-browser open example.com && agent-browser wait --load networkidle && agent-browser screenshot page.png中間出力を必要としない場合に && を使用してください。出力を解析する必要がある場合は(例:操作前にスナップショットから参照を発見する場合)、コマンドを別々に実行してください。
JSON出力
スクリプトでのプログラム的解析用:
agent-browser snapshot --json
agent-browser get text @e1 --json注:デフォルトのテキスト出力はよりコンパクトであり、AIエージェント向けに推奨されます。