阿里开源了PageAgent,这是一个基于Node.js的网页自动化agent。
什么是PageAgent
我们可以从官网查看介绍

简单来说,PageAgent 是一个可嵌入网页的 AI 操作员。与传统面向开发者的浏览器自动化工具(如爬虫、脚本任务)不同,它能让网站开发者轻松集成,使最终用户通过自然语言与网页交互。

对于我们日常使用来说,这个agent可以将我们遇到的大量表单查询以及复杂页面的填写进行自动化处理。
接入
简单接入
我们尝试一下简单接入
<script src="DEMO_CDN_URL" crossorigin="true"></script>
TIP
DEMO_CDN_URL是 PageAgent 的 CDN 地址,你可以从官网获取。以下来源于官网20260422版本。
镜像 URL 全球 https://cdn.jsdelivr.net/npm/page-agent@1.8.0/dist/iife/page-agent.demo.js中国 https://registry.npmmirror.com/page-agent/1.8.0/files/dist/iife/page-agent.demo.js
点击此处呼出网页agent对话
可以通过呼出 PageAgent 并发送自然语言指令,例如
帮我填写测试表单,姓名张三,邮箱张三@example.com,年龄25,选择高级版,同意协议,并提交,
让 Agent 自动帮您完成下方复杂表单的填写。
