我试了下最近很火的 web-access:它不是普通联网插件,而是一套高权限网页操作思路
最近我顺手把一个叫 web-access 的 Skill 装到了 OpenClaw 里,来源是这个 GitHub 仓库:
第一眼看上去,它像是一个“增强联网能力”的 Skill,但真看完它的 README、SKILL.md 和几段核心脚本后,我觉得它更准确的定位应该是:一套给 Agent 用的网页访问策略 + 浏览器控制通道 + 站点经验机制。
它不是简单补一个搜索工具,而是试图回答一个更大的问题:当 Agent 需要上网时,到底应该用什么方式获取信息,什么时候该读静态页面,什么时候该直接接管浏览器。
它到底是什么?
从仓库介绍来看,web-access 想补上的主要是三块:
- 联网工具选择策略
- 通过 CDP 连接真实 Chrome 的浏览器操作能力
- 对特定网站的经验积累与复用
仓库里对它的描述也很直接:原本只有 WebSearch、WebFetch 这类能力还不够,真正麻烦的场景其实是登录态、动态渲染、页面交互、社交平台抓取和复杂网页流程。web-access 的野心,就是把这些都纳入一套统一方法里。
我觉得它最有意思的地方
1. 它不是单一工具,而是“调度策略”
我觉得这项目最聪明的一点,不在于多写了几个脚本,而在于它把“怎么联网”抽象成了一套判断逻辑。
在它的 Skill 说明里,大致是这么分流的:
- 只是做搜索发现:用 WebSearch
- 已知 URL,要抽正文:用 WebFetch
- 需要原始 HTML:用 curl
- 页面动态渲染、需要登录态、要点按钮或上传文件:直接走浏览器 CDP
这件事听起来很朴素,但对 Agent 很重要。很多时候不是“能不能上网”,而是“该用哪条通道上网才最靠谱”。
2. 它试图直接接入你平时用的 Chrome
这个设计很强,也很危险。
web-access 的核心脚本会:
- 检查 Node.js 环境
- 检查 Chrome 是否开启 remote debugging
- 自动发现调试端口
- 启动本地 CDP Proxy
- 通过 WebSocket 连接到你当前正在使用的 Chrome
一旦连上,它就能通过本地 HTTP API 去做很多事情,比如:
- 新建 tab
- 导航页面
- 在页面里执行 JS
- 点击按钮
- 模拟真实鼠标点击
- 上传文件
- 页面截图
- 读取页面信息
- 关闭自己开的 tab
换句话说,它不是“帮 Agent 看网页”,而是真的在给 Agent 一只可以操作浏览器的手。
3. 它默认把“已登录状态”当成能力来源
这也是它和很多普通网页工具最不一样的地方。
它不是拉起一个隔离浏览器,而是尽量复用你日常使用中的 Chrome,因此天然继承登录态。对一些必须登录才能读内容、必须在网页里点击才能完成的任务来说,这当然很方便。
但反过来说,这也意味着权限边界会变得很模糊:
- 如果你的 Chrome 里登着 GitHub、飞书、后台系统、社交平台
- 那么这个 Skill 在合适条件下就可能访问这些页面
- 甚至执行交互操作,而不仅仅是读取内容
这类能力,实用性很高,但一定不该被当成“普通搜索增强”。
它适合什么场景?
我觉得 web-access 真正适合的是这些任务:
- 需要登录之后才能访问的网页
- 动态渲染严重、普通抓取拿不到内容的页面
- 必须点击、滚动、上传、截图才能完成的流程
- 某些社交平台或后台系统的自动化操作
- 多个网页目标并行调研
特别是它提到的“并行分治”,思路其实挺对路:把多个互不依赖的网页任务分发给多个子 Agent,各自开 tab、各自处理、最后回收摘要。这比把所有抓取内容都塞进一个上下文里要干净很多。
它的问题也很明显
1. 权限太高
它的 README 和 Skill 文档写得很清楚:很多联网任务都应该优先纳入它的处理逻辑。问题是,一旦一个 Skill 试图接管“所有联网”,它就不再只是一个增强插件,而更像一个高权限入口。
简单说:
- 它能连浏览器
- 浏览器里有登录态
- 登录态背后是真实账户
这三件事叠在一起,就决定了它必须谨慎使用。
2. 它很容易和现有工具重叠
如果你本来已经有这些能力:
- 普通网页搜索
- 网页正文提取
- 独立浏览器自动化
那 web-access 的价值更多是在“复用真实 Chrome 登录态”这一点,而不是替代一切。
如果只是公开网页、普通文章、一般信息检索,其实没必要每次都把任务升级到真实浏览器层。
3. 社交平台自动化有现实风险
仓库里也提到了像小红书这类平台的操作,并明确提示了风控风险。这个提醒我觉得是对的。凡是涉及平台自动化,技术上能做,不代表账号层面没有代价。
我会怎么用它
如果是我自己的工作流,我会把 web-access 视作一个高权限模式,而不是默认模式。
我大概会这么分:
先用轻工具的场景
- 查资料
- 搜公开网页
- 读博客正文
- 拉取文档内容
这类事情,轻量工具就够了。
只有满足这些条件时,才启用 web-access
- 必须依赖我当前 Chrome 的登录态
- 页面必须通过真实交互才能推进
- 目标站点对静态抓取很不友好
- 我要做的是“操作网页”,不是“读取网页”
也就是说,它不是“默认通道”,而是“必要时启用的特权通道”。
最后
我觉得 web-access 是个很有想法的项目。
它真正值得看的一点,不是又多了几个抓网页的命令,而是它在试图把 Agent 联网这件事从“工具堆叠”推进到“策略层设计”。这一步其实挺关键。很多 Agent 工具都在补功能,但很少有人认真处理“什么时候该用哪种能力”这个问题。
但也正因为它不是普通 Skill,而是一个可能直接接入你真实浏览器、真实账户状态的高权限方案,所以它的正确使用方式绝对不是“装上就把所有联网都交给它”。
我会继续关注这个项目,但前提是:把它放在该放的位置——强力、有效,但需要节制。
来源:
- GitHub 仓库:https://github.com/eze-is/web-access
- 仓库说明中提到的公众号文章:https://mp.weixin.qq.com/s/rps5YVB6TchT9npAaIWKCw