クイックスタート

コアワークフロー

すべてのブラウザ自動化は以下のパターンに従います:

# 1. 移動
agent-browser open example.com

# 2. スナップショットを取得して要素参照を取得
agent-browser snapshot -i
# 出力:
# @e1 [heading] "Example Domain"
# @e2 [link] "詳細情報..."

# 3. 参照を使用して操作
agent-browser click @e2

# 4. ページ変更後に再スナップショット
agent-browser snapshot -i

一般的なコマンド

agent-browser open example.com
agent-browser snapshot -i                # 参照付きのインタラクティブ要素を取得
agent-browser click @e2                  # 参照でクリック
agent-browser fill @e3 "[email protected]" # 参照で入力フィールドに記入
agent-browser get text @e1               # テキストコンテンツを取得
agent-browser screenshot                 # テンポラリディレクトリに保存
agent-browser screenshot page.png        # 特定のパスに保存
agent-browser close

伝統的なセレクタ

CSSセレクタとセマンティックロケータもサポートされています:

agent-browser click "#submit"
agent-browser fill "#email" "[email protected]"
agent-browser find role button click --name "Submit"

ヘッドモード

デバッグ用にブラウザウィンドウを表示:

agent-browser open example.com --headed

内容待ち

agent-browser wait @e1                   # 要素の表示を待つ
agent-browser wait --load networkidle    # ネットワークがアイドル状態になるまで待つ
agent-browser wait --url "**/dashboard"  # URLパターンを待つ
agent-browser wait 2000                  # ミリ秒単位で待つ

コマンドチェーン

単一のシェルコール内で && を使ってコマンドを連結できます。ブラウザはバックグラウンドデーモンによって保持されるため、チェーンは安全かつ効率的です:

# 1回の呼び出しで開く、待つ、スナップショットを取得
agent-browser open example.com && agent-browser wait --load networkidle && agent-browser snapshot -i

# 複数の操作をつなげる
agent-browser fill @e1 "[email protected]" && agent-browser fill @e2 "pass" && agent-browser click @e3

# 移動してキャプチャ
agent-browser open example.com && agent-browser wait --load networkidle && agent-browser screenshot page.png

中間出力を必要としない場合に && を使用してください。出力を解析する必要がある場合は(例:操作前にスナップショットから参照を発見する場合)、コマンドを別々に実行してください。

JSON出力

スクリプトでのプログラム的解析用:

agent-browser snapshot --json
agent-browser get text @e1 --json

注:デフォルトのテキスト出力はよりコンパクトであり、AIエージェント向けに推奨されます。