Agent-E 是一个基于 AutoGen 代理框架的系统,旨在自动化用户计算机上的操作,目前专注于浏览器内的自动化。它通过自然语言与网页浏览器交互,执行填写表单、搜索和排序电商产品、定位网站内容、管理播放设置、执行网络搜索、管理项目管理平台任务等操作。Agent-E 正在成长中,已经能够处理多样化的任务,但最佳任务是用户自行发掘的。

使用场景

  • 在 YouTube 上搜索并播放 Veritasium 的 Oppenheimer 视频。
  • 使用电子邮件中的文本作为指令,自动填写表单并等待用户审核提交。
  • 在亚马逊上搜索 Finish 洗碗机洗涤片,按畅销排序并将其添加到购物车。
  • 验证 Twitter 上关于免费课程的信息,并导航到 NVIDIA 开发者页面确认课程的可用性。

产品特色

  • 填写表单:使用用户信息或来自其他网站的信息自动填写网络表单。
  • 电商产品搜索与排序:在电商网站如亚马逊上根据畅销或价格等标准搜索和排序产品。
  • 网站内容定位:在网站如 ESPN 上查找体育比分或在大学页面上查找联系信息。
  • 网络媒体交互:播放 YouTube 视频和管理播放设置,如全屏和静音。
  • 综合网络搜索:在广泛的主题上执行网络搜索,从历史地点到顶级本地餐厅。
  • 项目管理自动化:在项目管理平台(如 JIRA)上通过过滤问题来简化工作流程。
  • 个人购物助手:根据用户需求推荐产品,如游戏卡的存储选项。

用户群体

Agent-E 适合需要自动化网页任务的开发者和普通用户,无论是在数据输入、产品搜索、内容定位还是日常的网页浏览和管理中,都能提供高效的解决方案。

使用教程

  1. 安装必要的软件和依赖,如 uv 和 playwright。
  2. 创建并激活虚拟环境,生成 requirements.txt 文件并安装依赖。
  3. 配置 .env 文件,设置 AUTOGEN_MODEL_NAME 和 AUTOGEN_MODEL_API_KEY 等环境变量。
  4. 运行 Agent-E 程序,浏览器上会出现图标,点击后展开聊天式界面。
  5. 在聊天界面中输入自然语言请求,如 ‘打开 YouTube’ 或 ‘在亚马逊上找到 Nothing Phone 2 并按畅销排序’。
  6. 根据 Agent-E 的反馈进行操作,如审核表单填写内容或确认视频播放。

相关导航

暂无评论

暂无评论...