Agent-E 是一个基于 AutoGen 代理框架的系统,旨在自动化用户计算机上的操作,目前专注于浏览器内的自动化。它通过自然语言与网页浏览器交互,执行填写表单、搜索和排序电商产品、定位网站内容、管理播放设置、执行网络搜索、管理项目管理平台任务等操作。Agent-E 正在成长中,已经能够处理多样化的任务,但最佳任务是用户自行发掘的。
使用场景
- 在 YouTube 上搜索并播放 Veritasium 的 Oppenheimer 视频。
- 使用电子邮件中的文本作为指令,自动填写表单并等待用户审核提交。
- 在亚马逊上搜索 Finish 洗碗机洗涤片,按畅销排序并将其添加到购物车。
- 验证 Twitter 上关于免费课程的信息,并导航到 NVIDIA 开发者页面确认课程的可用性。
产品特色
- 填写表单:使用用户信息或来自其他网站的信息自动填写网络表单。
- 电商产品搜索与排序:在电商网站如亚马逊上根据畅销或价格等标准搜索和排序产品。
- 网站内容定位:在网站如 ESPN 上查找体育比分或在大学页面上查找联系信息。
- 网络媒体交互:播放 YouTube 视频和管理播放设置,如全屏和静音。
- 综合网络搜索:在广泛的主题上执行网络搜索,从历史地点到顶级本地餐厅。
- 项目管理自动化:在项目管理平台(如 JIRA)上通过过滤问题来简化工作流程。
- 个人购物助手:根据用户需求推荐产品,如游戏卡的存储选项。
用户群体
Agent-E 适合需要自动化网页任务的开发者和普通用户,无论是在数据输入、产品搜索、内容定位还是日常的网页浏览和管理中,都能提供高效的解决方案。
使用教程
- 安装必要的软件和依赖,如 uv 和 playwright。
- 创建并激活虚拟环境,生成 requirements.txt 文件并安装依赖。
- 配置 .env 文件,设置 AUTOGEN_MODEL_NAME 和 AUTOGEN_MODEL_API_KEY 等环境变量。
- 运行 Agent-E 程序,浏览器上会出现图标,点击后展开聊天式界面。
- 在聊天界面中输入自然语言请求,如 ‘打开 YouTube’ 或 ‘在亚马逊上找到 Nothing Phone 2 并按畅销排序’。
- 根据 Agent-E 的反馈进行操作,如审核表单填写内容或确认视频播放。
相关导航
暂无评论...