Spaces:

fengmiguoji
/

browseruse

Runtime error

App Files Files Community

browseruse / webui.py

fengmiguoji

Upload 9 files

1885161 verified 11 months ago

raw

history blame contribute delete

35.9 kB

	# -- coding: utf-8 --
	# @Time : 2025/1/1
	# @Author : wenshao
	# @Email : wenshaoguo1026@gmail.com
	# @Project : browser-use-webui
	# @FileName: webui.py

	import pdb
	import logging

	from dotenv import load_dotenv

	load_dotenv()
	import os
	import glob
	import asyncio
	import argparse
	import os

	logger = logging.getLogger(__name__)

	import gradio as gr

	from browser_use.agent.service import Agent
	from playwright.async_api import async_playwright
	from browser_use.browser.browser import Browser, BrowserConfig
	from browser_use.browser.context import (
	BrowserContextConfig,
	BrowserContextWindowSize,
	)
	from playwright.async_api import async_playwright
	from src.utils.agent_state import AgentState

	from src.utils import utils
	from src.agent.custom_agent import CustomAgent
	from src.browser.custom_browser import CustomBrowser
	from src.agent.custom_prompts import CustomSystemPrompt
	from src.browser.config import BrowserPersistenceConfig
	from src.browser.custom_context import BrowserContextConfig, CustomBrowserContext
	from src.controller.custom_controller import CustomController
	from gradio.themes import Citrus, Default, Glass, Monochrome, Ocean, Origin, Soft, Base
	from src.utils.utils import update_model_dropdown, get_latest_files, capture_screenshot

	from dotenv import load_dotenv
	load_dotenv()

	# Global variables for persistence
	_global_browser = None
	_global_browser_context = None

	# Create the global agent state instance
	_global_agent_state = AgentState()

	async def stop_agent():
	"""Request the agent to stop and update UI with enhanced feedback"""
	global _global_agent_state, _global_browser_context, _global_browser

	try:
	# Request stop
	_global_agent_state.request_stop()

	# Update UI immediately
	message = "Stop requested - the agent will halt at the next safe point"
	logger.info(f"🛑 {message}")

	# Return UI updates
	return (
	message, # errors_output
	gr.update(value="Stopping...", interactive=False), # stop_button
	gr.update(interactive=False), # run_button
	)
	except Exception as e:
	error_msg = f"Error during stop: {str(e)}"
	logger.error(error_msg)
	return (
	error_msg,
	gr.update(value="Stop", interactive=True),
	gr.update(interactive=True)
	)

	async def run_browser_agent(
	agent_type,
	llm_provider,
	llm_model_name,
	llm_temperature,
	llm_base_url,
	llm_api_key,
	use_own_browser,
	keep_browser_open,
	headless,
	disable_security,
	window_w,
	window_h,
	save_recording_path,
	save_agent_history_path,
	save_trace_path,
	enable_recording,
	task,
	add_infos,
	max_steps,
	use_vision,
	max_actions_per_step,
	tool_call_in_content
	):
	global _global_agent_state
	_global_agent_state.clear_stop() # Clear any previous stop requests

	try:
	# Disable recording if the checkbox is unchecked
	if not enable_recording:
	save_recording_path = None

	# Ensure the recording directory exists if recording is enabled
	if save_recording_path:
	os.makedirs(save_recording_path, exist_ok=True)

	# Get the list of existing videos before the agent runs
	existing_videos = set()
	if save_recording_path:
	existing_videos = set(
	glob.glob(os.path.join(save_recording_path, "*.[mM][pP]4"))
	+ glob.glob(os.path.join(save_recording_path, "*.[wW][eE][bB][mM]"))
	)

	# Run the agent
	llm = utils.get_llm_model(
	provider=llm_provider,
	model_name=llm_model_name,
	temperature=llm_temperature,
	base_url=llm_base_url,
	api_key=llm_api_key,
	)
	if agent_type == "org":
	final_result, errors, model_actions, model_thoughts, trace_file, history_file = await run_org_agent(
	llm=llm,
	use_own_browser=use_own_browser,
	keep_browser_open=keep_browser_open,
	headless=headless,
	disable_security=disable_security,
	window_w=window_w,
	window_h=window_h,
	save_recording_path=save_recording_path,
	save_agent_history_path=save_agent_history_path,
	save_trace_path=save_trace_path,
	task=task,
	max_steps=max_steps,
	use_vision=use_vision,
	max_actions_per_step=max_actions_per_step,
	tool_call_in_content=tool_call_in_content
	)
	elif agent_type == "custom":
	final_result, errors, model_actions, model_thoughts, trace_file, history_file = await run_custom_agent(
	llm=llm,
	use_own_browser=use_own_browser,
	keep_browser_open=keep_browser_open,
	headless=headless,
	disable_security=disable_security,
	window_w=window_w,
	window_h=window_h,
	save_recording_path=save_recording_path,
	save_agent_history_path=save_agent_history_path,
	save_trace_path=save_trace_path,
	task=task,
	add_infos=add_infos,
	max_steps=max_steps,
	use_vision=use_vision,
	max_actions_per_step=max_actions_per_step,
	tool_call_in_content=tool_call_in_content
	)
	else:
	raise ValueError(f"Invalid agent type: {agent_type}")

	# Get the list of videos after the agent runs (if recording is enabled)
	latest_video = None
	if save_recording_path:
	new_videos = set(
	glob.glob(os.path.join(save_recording_path, "*.[mM][pP]4"))
	+ glob.glob(os.path.join(save_recording_path, "*.[wW][eE][bB][mM]"))
	)
	if new_videos - existing_videos:
	latest_video = list(new_videos - existing_videos)[0] # Get the first new video

	return (
	final_result,
	errors,
	model_actions,
	model_thoughts,
	latest_video,
	trace_file,
	history_file,
	gr.update(value="Stop", interactive=True), # Re-enable stop button
	gr.update(interactive=True) # Re-enable run button
	)

	except Exception as e:
	import traceback
	traceback.print_exc()
	errors = str(e) + "\n" + traceback.format_exc()
	return (
	'', # final_result
	errors, # errors
	'', # model_actions
	'', # model_thoughts
	None, # latest_video
	None, # history_file
	None, # trace_file
	gr.update(value="Stop", interactive=True), # Re-enable stop button
	gr.update(interactive=True) # Re-enable run button
	)


	async def run_org_agent(
	llm,
	use_own_browser,
	keep_browser_open,
	headless,
	disable_security,
	window_w,
	window_h,
	save_recording_path,
	save_agent_history_path,
	save_trace_path,
	task,
	max_steps,
	use_vision,
	max_actions_per_step,
	tool_call_in_content
	):
	try:
	global _global_browser, _global_browser_context, _global_agent_state

	# Clear any previous stop request
	_global_agent_state.clear_stop()

	if use_own_browser:
	chrome_path = os.getenv("CHROME_PATH", None)
	if chrome_path == "":
	chrome_path = None
	else:
	chrome_path = None

	if _global_browser is None:
	_global_browser = Browser(
	config=BrowserConfig(
	headless=headless,
	disable_security=disable_security,
	chrome_instance_path=chrome_path,
	extra_chromium_args=[f"--window-size={window_w},{window_h}"],
	)
	)

	if _global_browser_context is None:
	_global_browser_context = await _global_browser.new_context(
	config=BrowserContextConfig(
	trace_path=save_trace_path if save_trace_path else None,
	save_recording_path=save_recording_path if save_recording_path else None,
	no_viewport=False,
	browser_window_size=BrowserContextWindowSize(
	width=window_w, height=window_h
	),
	)
	)

	agent = Agent(
	task=task,
	llm=llm,
	use_vision=use_vision,
	browser=_global_browser,
	browser_context=_global_browser_context,
	max_actions_per_step=max_actions_per_step,
	tool_call_in_content=tool_call_in_content
	)
	history = await agent.run(max_steps=max_steps)

	history_file = os.path.join(save_agent_history_path, f"{agent.agent_id}.json")
	agent.save_history(history_file)

	final_result = history.final_result()
	errors = history.errors()
	model_actions = history.model_actions()
	model_thoughts = history.model_thoughts()

	trace_file = get_latest_files(save_trace_path)

	return final_result, errors, model_actions, model_thoughts, trace_file.get('.zip'), history_file
	except Exception as e:
	import traceback
	traceback.print_exc()
	errors = str(e) + "\n" + traceback.format_exc()
	return '', errors, '', '', None, None
	finally:
	# Handle cleanup based on persistence configuration
	if not keep_browser_open:
	if _global_browser_context:
	await _global_browser_context.close()
	_global_browser_context = None

	if _global_browser:
	await _global_browser.close()
	_global_browser = None

	async def run_custom_agent(
	llm,
	use_own_browser,
	keep_browser_open,
	headless,
	disable_security,
	window_w,
	window_h,
	save_recording_path,
	save_agent_history_path,
	save_trace_path,
	task,
	add_infos,
	max_steps,
	use_vision,
	max_actions_per_step,
	tool_call_in_content
	):
	try:
	global _global_browser, _global_browser_context, _global_agent_state

	# Clear any previous stop request
	_global_agent_state.clear_stop()

	if use_own_browser:
	chrome_path = os.getenv("CHROME_PATH", None)
	if chrome_path == "":
	chrome_path = None
	else:
	chrome_path = None

	controller = CustomController()

	# Initialize global browser if needed
	if _global_browser is None:
	_global_browser = CustomBrowser(
	config=BrowserConfig(
	headless=headless,
	disable_security=disable_security,
	chrome_instance_path=chrome_path,
	extra_chromium_args=[f"--window-size={window_w},{window_h}"],
	)
	)

	if _global_browser_context is None:
	_global_browser_context = await _global_browser.new_context(
	config=BrowserContextConfig(
	trace_path=save_trace_path if save_trace_path else None,
	save_recording_path=save_recording_path if save_recording_path else None,
	no_viewport=False,
	browser_window_size=BrowserContextWindowSize(
	width=window_w, height=window_h
	),
	)
	)

	# Create and run agent
	agent = CustomAgent(
	task=task,
	add_infos=add_infos,
	use_vision=use_vision,
	llm=llm,
	browser=_global_browser,
	browser_context=_global_browser_context,
	controller=controller,
	system_prompt_class=CustomSystemPrompt,
	max_actions_per_step=max_actions_per_step,
	tool_call_in_content=tool_call_in_content,
	agent_state=_global_agent_state
	)
	history = await agent.run(max_steps=max_steps)

	history_file = os.path.join(save_agent_history_path, f"{agent.agent_id}.json")
	agent.save_history(history_file)

	final_result = history.final_result()
	errors = history.errors()
	model_actions = history.model_actions()
	model_thoughts = history.model_thoughts()

	trace_file = get_latest_files(save_trace_path)

	return final_result, errors, model_actions, model_thoughts, trace_file.get('.zip'), history_file
	except Exception as e:
	import traceback
	traceback.print_exc()
	errors = str(e) + "\n" + traceback.format_exc()
	return '', errors, '', '', None, None
	finally:
	# Handle cleanup based on persistence configuration
	if not keep_browser_open:
	if _global_browser_context:
	await _global_browser_context.close()
	_global_browser_context = None

	if _global_browser:
	await _global_browser.close()
	_global_browser = None

	async def run_with_stream(
	agent_type,
	llm_provider,
	llm_model_name,
	llm_temperature,
	llm_base_url,
	llm_api_key,
	use_own_browser,
	keep_browser_open,
	headless,
	disable_security,
	window_w,
	window_h,
	save_recording_path,
	save_agent_history_path,
	save_trace_path,
	enable_recording,
	task,
	add_infos,
	max_steps,
	use_vision,
	max_actions_per_step,
	tool_call_in_content
	):
	global _global_agent_state
	stream_vw = 80
	stream_vh = int(80 * window_h // window_w)
	if not headless:
	result = await run_browser_agent(
	agent_type=agent_type,
	llm_provider=llm_provider,
	llm_model_name=llm_model_name,
	llm_temperature=llm_temperature,
	llm_base_url=llm_base_url,
	llm_api_key=llm_api_key,
	use_own_browser=use_own_browser,
	keep_browser_open=keep_browser_open,
	headless=headless,
	disable_security=disable_security,
	window_w=window_w,
	window_h=window_h,
	save_recording_path=save_recording_path,
	save_agent_history_path=save_agent_history_path,
	save_trace_path=save_trace_path,
	enable_recording=enable_recording,
	task=task,
	add_infos=add_infos,
	max_steps=max_steps,
	use_vision=use_vision,
	max_actions_per_step=max_actions_per_step,
	tool_call_in_content=tool_call_in_content
	)
	# Add HTML content at the start of the result array
	html_content = f"<h1 style='width:{stream_vw}vw; height:{stream_vh}vh'>Using browser...</h1>"
	yield [html_content] + list(result)
	else:
	try:
	_global_agent_state.clear_stop()
	# Run the browser agent in the background
	agent_task = asyncio.create_task(
	run_browser_agent(
	agent_type=agent_type,
	llm_provider=llm_provider,
	llm_model_name=llm_model_name,
	llm_temperature=llm_temperature,
	llm_base_url=llm_base_url,
	llm_api_key=llm_api_key,
	use_own_browser=use_own_browser,
	keep_browser_open=keep_browser_open,
	headless=headless,
	disable_security=disable_security,
	window_w=window_w,
	window_h=window_h,
	save_recording_path=save_recording_path,
	save_agent_history_path=save_agent_history_path,
	save_trace_path=save_trace_path,
	enable_recording=enable_recording,
	task=task,
	add_infos=add_infos,
	max_steps=max_steps,
	use_vision=use_vision,
	max_actions_per_step=max_actions_per_step,
	tool_call_in_content=tool_call_in_content
	)
	)

	# Initialize values for streaming
	html_content = f"<h1 style='width:{stream_vw}vw; height:{stream_vh}vh'>Using browser...</h1>"
	final_result = errors = model_actions = model_thoughts = ""
	latest_videos = trace = history_file = None


	# Periodically update the stream while the agent task is running
	while not agent_task.done():
	try:
	encoded_screenshot = await capture_screenshot(_global_browser_context)
	if encoded_screenshot is not None:
	html_content = f'<img src="data:image/jpeg;base64,{encoded_screenshot}" style="width:{stream_vw}vw; height:{stream_vh}vh ; border:1px solid #ccc;">'
	else:
	html_content = f"<h1 style='width:{stream_vw}vw; height:{stream_vh}vh'>Waiting for browser session...</h1>"
	except Exception as e:
	html_content = f"<h1 style='width:{stream_vw}vw; height:{stream_vh}vh'>Waiting for browser session...</h1>"

	if _global_agent_state and _global_agent_state.is_stop_requested():
	yield [
	html_content,
	final_result,
	errors,
	model_actions,
	model_thoughts,
	latest_videos,
	trace,
	history_file,
	gr.update(value="Stopping...", interactive=False), # stop_button
	gr.update(interactive=False), # run_button
	]
	break
	else:
	yield [
	html_content,
	final_result,
	errors,
	model_actions,
	model_thoughts,
	latest_videos,
	trace,
	history_file,
	gr.update(value="Stop", interactive=True), # Re-enable stop button
	gr.update(interactive=True) # Re-enable run button
	]
	await asyncio.sleep(0.05)

	# Once the agent task completes, get the results
	try:
	result = await agent_task
	final_result, errors, model_actions, model_thoughts, latest_videos, trace, history_file, stop_button, run_button = result
	except Exception as e:
	errors = f"Agent error: {str(e)}"

	yield [
	html_content,
	final_result,
	errors,
	model_actions,
	model_thoughts,
	latest_videos,
	trace,
	history_file,
	stop_button,
	run_button
	]

	except Exception as e:
	import traceback
	yield [
	f"<h1 style='width:{stream_vw}vw; height:{stream_vh}vh'>Waiting for browser session...</h1>",
	"",
	f"Error: {str(e)}\n{traceback.format_exc()}",
	"",
	"",
	None,
	None,
	None,
	gr.update(value="Stop", interactive=True), # Re-enable stop button
	gr.update(interactive=True) # Re-enable run button
	]

	# Define the theme map globally
	theme_map = {
	"Default": Default(),
	"Soft": Soft(),
	"Monochrome": Monochrome(),
	"Glass": Glass(),
	"Origin": Origin(),
	"Citrus": Citrus(),
	"Ocean": Ocean(),
	"Base": Base()
	}

	async def close_global_browser():
	global _global_browser, _global_browser_context

	if _global_browser_context:
	await _global_browser_context.close()
	_global_browser_context = None

	if _global_browser:
	await _global_browser.close()
	_global_browser = None

	def create_ui(theme_name="Ocean"):
	css = """
	.gradio-container {
	max-width: 1200px !important;
	margin: auto !important;
	padding-top: 20px !important;
	}
	.header-text {
	text-align: center;
	margin-bottom: 30px;
	}
	.theme-section {
	margin-bottom: 20px;
	padding: 15px;
	border-radius: 10px;
	}
	"""

	js = """
	function refresh() {
	const url = new URL(window.location);
	if (url.searchParams.get('__theme') !== 'dark') {
	url.searchParams.set('__theme', 'dark');
	window.location.href = url.href;
	}
	}
	"""

	with gr.Blocks(
	title="Browser Use WebUI", theme=theme_map[theme_name], css=css, js=js
	) as demo:
	with gr.Row():
	gr.Markdown(
	"""
	# 🌐 Browser Use WebUI
	### Control your browser with AI assistance
	""",
	elem_classes=["header-text"],
	)

	with gr.Tabs() as tabs:
	with gr.TabItem("⚙️ Agent Settings", id=1):
	with gr.Group():
	agent_type = gr.Radio(
	["org", "custom"],
	label="Agent Type",
	value="custom",
	info="Select the type of agent to use",
	)
	max_steps = gr.Slider(
	minimum=1,
	maximum=200,
	value=100,
	step=1,
	label="Max Run Steps",
	info="Maximum number of steps the agent will take",
	)
	max_actions_per_step = gr.Slider(
	minimum=1,
	maximum=20,
	value=10,
	step=1,
	label="Max Actions per Step",
	info="Maximum number of actions the agent will take per step",
	)
	use_vision = gr.Checkbox(
	label="Use Vision",
	value=True,
	info="Enable visual processing capabilities",
	)
	tool_call_in_content = gr.Checkbox(
	label="Use Tool Calls in Content",
	value=True,
	info="Enable Tool Calls in content",
	)

	with gr.TabItem("🔧 LLM Configuration", id=2):
	with gr.Group():
	llm_provider = gr.Dropdown(
	choices=[provider for provider,model in utils.model_names.items()],
	label="LLM Provider",
	value="openai",
	info="Select your preferred language model provider"
	)
	llm_model_name = gr.Dropdown(
	label="Model Name",
	choices=utils.model_names['openai'],
	value="gpt-4o",
	interactive=True,
	allow_custom_value=True, # Allow users to input custom model names
	info="Select a model from the dropdown or type a custom model name"
	)
	llm_temperature = gr.Slider(
	minimum=0.0,
	maximum=2.0,
	value=1.0,
	step=0.1,
	label="Temperature",
	info="Controls randomness in model outputs"
	)
	with gr.Row():
	llm_base_url = gr.Textbox(
	label="Base URL",
	value='',
	info="API endpoint URL (if required)"
	)
	llm_api_key = gr.Textbox(
	label="API Key",
	type="password",
	value='',
	info="Your API key (leave blank to use .env)"
	)

	with gr.TabItem("🌐 Browser Settings", id=3):
	with gr.Group():
	with gr.Row():
	use_own_browser = gr.Checkbox(
	label="Use Own Browser",
	value=False,
	info="Use your existing browser instance",
	)
	keep_browser_open = gr.Checkbox(
	label="Keep Browser Open",
	value=os.getenv("CHROME_PERSISTENT_SESSION", "False").lower() == "true",
	info="Keep Browser Open between Tasks",
	)
	headless = gr.Checkbox(
	label="Headless Mode",
	value=False,
	info="Run browser without GUI",
	)
	disable_security = gr.Checkbox(
	label="Disable Security",
	value=True,
	info="Disable browser security features",
	)
	enable_recording = gr.Checkbox(
	label="Enable Recording",
	value=True,
	info="Enable saving browser recordings",
	)

	with gr.Row():
	window_w = gr.Number(
	label="Window Width",
	value=1280,
	info="Browser window width",
	)
	window_h = gr.Number(
	label="Window Height",
	value=1100,
	info="Browser window height",
	)

	save_recording_path = gr.Textbox(
	label="Recording Path",
	placeholder="e.g. ./tmp/record_videos",
	value="./tmp/record_videos",
	info="Path to save browser recordings",
	interactive=True, # Allow editing only if recording is enabled
	)

	save_trace_path = gr.Textbox(
	label="Trace Path",
	placeholder="e.g. ./tmp/traces",
	value="./tmp/traces",
	info="Path to save Agent traces",
	interactive=True,
	)

	save_agent_history_path = gr.Textbox(
	label="Agent History Save Path",
	placeholder="e.g., ./tmp/agent_history",
	value="./tmp/agent_history",
	info="Specify the directory where agent history should be saved.",
	interactive=True,
	)

	with gr.TabItem("🤖 Run Agent", id=4):
	task = gr.Textbox(
	label="Task Description",
	lines=4,
	placeholder="Enter your task here...",
	value="go to google.com and type 'OpenAI' click search and give me the first url",
	info="Describe what you want the agent to do",
	)
	add_infos = gr.Textbox(
	label="Additional Information",
	lines=3,
	placeholder="Add any helpful context or instructions...",
	info="Optional hints to help the LLM complete the task",
	)

	with gr.Row():
	run_button = gr.Button("▶️ Run Agent", variant="primary", scale=2)
	stop_button = gr.Button("⏹️ Stop", variant="stop", scale=1)

	with gr.Row():
	browser_view = gr.HTML(
	value="<h1 style='width:80vw; height:50vh'>Waiting for browser session...</h1>",
	label="Live Browser View",
	)

	with gr.TabItem("📊 Results", id=5):
	with gr.Group():

	recording_display = gr.Video(label="Latest Recording")

	gr.Markdown("### Results")
	with gr.Row():
	with gr.Column():
	final_result_output = gr.Textbox(
	label="Final Result", lines=3, show_label=True
	)
	with gr.Column():
	errors_output = gr.Textbox(
	label="Errors", lines=3, show_label=True
	)
	with gr.Row():
	with gr.Column():
	model_actions_output = gr.Textbox(
	label="Model Actions", lines=3, show_label=True
	)
	with gr.Column():
	model_thoughts_output = gr.Textbox(
	label="Model Thoughts", lines=3, show_label=True
	)

	trace_file = gr.File(label="Trace File")

	agent_history_file = gr.File(label="Agent History")

	# Bind the stop button click event after errors_output is defined
	stop_button.click(
	fn=stop_agent,
	inputs=[],
	outputs=[errors_output, stop_button, run_button],
	)

	# Run button click handler
	run_button.click(
	fn=run_with_stream,
	inputs=[
	agent_type, llm_provider, llm_model_name, llm_temperature, llm_base_url, llm_api_key,
	use_own_browser, keep_browser_open, headless, disable_security, window_w, window_h,
	save_recording_path, save_agent_history_path, save_trace_path, # Include the new path
	enable_recording, task, add_infos, max_steps, use_vision, max_actions_per_step, tool_call_in_content
	],
	outputs=[
	browser_view, # Browser view
	final_result_output, # Final result
	errors_output, # Errors
	model_actions_output, # Model actions
	model_thoughts_output, # Model thoughts
	recording_display, # Latest recording
	trace_file, # Trace file
	agent_history_file, # Agent history file
	stop_button, # Stop button
	run_button # Run button
	],
	)

	with gr.TabItem("🎥 Recordings", id=6):
	def list_recordings(save_recording_path):
	if not os.path.exists(save_recording_path):
	return []

	# Get all video files
	recordings = glob.glob(os.path.join(save_recording_path, ".[mM][pP]4")) + glob.glob(os.path.join(save_recording_path, ".[wW][eE][bB][mM]"))

	# Sort recordings by creation time (oldest first)
	recordings.sort(key=os.path.getctime)

	# Add numbering to the recordings
	numbered_recordings = []
	for idx, recording in enumerate(recordings, start=1):
	filename = os.path.basename(recording)
	numbered_recordings.append((recording, f"{idx}. {filename}"))

	return numbered_recordings

	recordings_gallery = gr.Gallery(
	label="Recordings",
	value=list_recordings("./tmp/record_videos"),
	columns=3,
	height="auto",
	object_fit="contain"
	)

	refresh_button = gr.Button("🔄 Refresh Recordings", variant="secondary")
	refresh_button.click(
	fn=list_recordings,
	inputs=save_recording_path,
	outputs=recordings_gallery
	)

	# Attach the callback to the LLM provider dropdown
	llm_provider.change(
	lambda provider, api_key, base_url: update_model_dropdown(provider, api_key, base_url),
	inputs=[llm_provider, llm_api_key, llm_base_url],
	outputs=llm_model_name
	)

	# Add this after defining the components
	enable_recording.change(
	lambda enabled: gr.update(interactive=enabled),
	inputs=enable_recording,
	outputs=save_recording_path
	)

	use_own_browser.change(fn=close_global_browser)
	keep_browser_open.change(fn=close_global_browser)

	return demo

	def main():
	parser = argparse.ArgumentParser(description="Gradio UI for Browser Agent")
	parser.add_argument("--ip", type=str, default="127.0.0.1", help="IP address to bind to")
	parser.add_argument("--port", type=int, default=7788, help="Port to listen on")
	parser.add_argument("--theme", type=str, default="Ocean", choices=theme_map.keys(), help="Theme to use for the UI")
	parser.add_argument("--dark-mode", action="store_true", help="Enable dark mode")
	args = parser.parse_args()

	demo = create_ui(theme_name=args.theme)
	demo.launch(server_name=args.ip, server_port=args.port)

	if __name__ == '__main__':
	main()