BINARY GARDEN
2026-05-27 // AIAgent · CLI · skill · sibuchen

CC

浏览器自动化

What

  1. Playwright 是微软(Microsoft)开发的一个浏览器自动化工具。它可以通过代码控制浏览器,自动完成:"打开网页、点击按钮、输入内容、登录网站、截图、爬取数据、自动化测试..."
  2. playwright-cli 则是它的命令行工具(CLI,Command Line Interface),可以直接在终端中操作浏览器。

支持: Chrome、Firefox、Safari(WebKit)

Why

  1. Claude Code 中普通的“联网”通常只是向网站发送请求、获取网页源码,比如 API 请求这类方式。但现在很多网站内容依赖 JavaScript 动态加载,还需要点击、登录、滚动页面,单纯请求网页已经拿不到真正内容了。
  2. Playwright 的不同在于,它会真正启动 Chrome、Firefox 等浏览器,然后模拟人的操作,例如点击按钮、输入内容、等待页面加载、自动截图等。所以现在很多 AI Agent、自动化测试工具、网页爬虫都会结合 Playwright 使用。

how

源码位置:https://github.com/microsoft/playwright-cli

Skills

未来趋势(仅个人观点)

金谷园饺子馆 AI Skill

  1. 技术:一个基于 MCP 协议 和 腾讯云 CloudBase 构建的智能体插件,旨在将实体餐饮服务无缝接入 AI 对话流中。
  2. 功能:它不仅支持基础的餐厅信息查询(如营业时间、门店地址、Wi-Fi密码、菜品推荐及生饺子煮法),还深度内嵌了美团排队组件,允许用户直接进行在线取号、查询排队进度和点餐自取。
  3. 典型使用场景:当用户正在使用 Cursor、Trae、Qoder 等 AI 助手工作时,无需中断心流去切换 App 或掏出手机,只需用自然语言向 AI 下达指令,即可一站式搞定“查询餐厅状态”或“帮我排个号”的日常就餐需求,实现了数字工作空间与线下真实生活服务的巧妙连接。

移动支付 普及 -- 手机网页点餐(要输网址、体验差,几乎没人用) -- 二维火(首创 “扫码点餐” 商用版)

AI(LLM/Agent) 普及 -- openclaw (独立权限高,风险高) -- 未来?贾维斯? MOSS(550W)?

源码位置:https://github.com/JinGuYuan/jinguyuan-dumpling-skill

视频:支付宝AI支付生态大会

视频:关于AI泡沫的思考

科研领域

literature-retrieval

description: “多源学术文献检索skill。该功能可对接五大权威学术应用程序接口(OpenAlex, Semantic Scholar, arXiv, CORE, Crossref),根据用户指定的主题与筛选条件检索相关论文,并生成标准的 Markdown 格式结构化结果报告。当用户需要查找学术论文、检索研究文献、开展文献搜集、查询学术文章、查阅学术参考文献,或是搜集某一主题相关论文时,即便用户未明确提及 “文献检索”,也需启用本功能。若用户使用文献检索、论文检索、搜索文献、查找论文、文献调研等中文表述,同样触发该功能。”

后期将把 literature-retrieval 做成 npm 包, 并同步至个人博客。

academic-research-skills

what

Academic Research Skills(ARS)是一个面向 Claude Code 的学术研究 Skill 集合,用于辅助完成从文献研究、论文写作、同行评审到最终修改的完整学术工作流。它本质上不是单一 Prompt,而是一套结构化的 AI 协作系统。

why

  1. Deep Research — 13 个 Agent 的研究团队,支持苏格拉底引导、PRISMA 系统性回顾、意图检测、对话健康度监控、可选跨模型 DA、Semantic Scholar API 验证。
  2. Academic Paper — 12 个 Agent 的论文撰写团队,含风格校准、写作质量检查、LaTeX 输出强化、可视化、修订教练、引用格式转换、反泄露协议、VLM 图表验证。
  3. Academic Paper Reviewer — 7 个 Agent 的多视角同行评审,0-100 质量量表(主编 + 3 位动态审查者 + 魔鬼代言人),含让步门槛协议、攻击强度保持、可选跨模型 DA critique / calibration、R&R 追溯矩阵、只读约束。
  4. Academic Pipeline — 10 阶段全流程调度器,含自适应 checkpoint、主张验证、材料护照、可选 repro_lock、可选跨模型学术诚信验证、中途强化机制、分数轨迹追踪。
  5. 数据访问层级标注(v3.3.2+)— 每个 skill 声明 data_access_level(raw / redacted / verified_only),由 scripts/check_data_access_level.py 强制执行。设计灵感来自 Anthropic 的 automated-w2s-researcher(2026)。详见 shared/ground_truth_isolation_pattern.md。
  6. 任务类型标注(v3.3.2+)— 每个 skill 声明 task_type(open-ended 或 outcome-gradable)。目前 ARS 所有 skills 皆为 open-ended。
  7. Benchmark 报告 Schema(v3.3.5+)— JSON Schema + lint script,要求诚实的 benchmark 比较报告。详见 shared/benchmark_report_pattern.md。
  8. Artifact 可复现性 Lockfile(v3.3.5+)— Material Passport 添加可选 repro_lock 子区块。是配置文档化,不是重播保证 — LLM 输出不是逐字节可复现。详见 shared/artifact_reproducibility_pattern.md。

how

源码位置:https://github.com/Imbad0202/academic-research-skills

求职领域

generate-resume

description: “根据指定招聘岗位,定制/优化适配 ATS 系统的简历。输入内容:招聘岗位链接、求职者简介文件(示例:张三 - 个人简介.md)。输出内容:贴合岗位要求的 Markdown 格式简历,并附未达标要求附录。支持单次生成与批量生成两种模式。当用户提出以下需求时,均需启用本功能:制作简历、生成履历、根据岗位定制简历、求职应聘、为多个岗位批量生成简历;或是提及简历、履历、求职信、求职相关内容(包括口语化表述,如 “帮我改下简历”“我想应聘这个岗位”)。”

generate-resume 支持 "动态注入" 与 "自我迭代" 后期将把 generate-resume 做成 npm 包, 并同步至个人博客。

AI Coding Agents

主流 编程智能体 CLI/IDE

国外

Agent名称类型备注开发商支持的模型下载链接
Claude CodeCLIAnthropic只能使用 Claude 系列https://claude.com/product/claude-code
CodexCLI/IDEOpenAI只能使用 GPT 系列https://chatgpt.com/codex/cloud
Gemini CLICLI即将被 Antigravity CLI 取代Google只能使用 Gemini 系列https://geminicli.com/
AntigravityCLI/IDE2026.05.19 刚刚发布 可能不稳定Google只能使用 Gemini 系列https://antigravity.google/download
OpenCodeCLI/IDEOpenCode支持 各种系列 模型https://opencode.ai/
CursorIDECursor支持 各种系列 模型https://cursor.com/
KiroCLI/IDEKiro支持 各种系列 模型https://kiro.dev/
Mistral Vibe CLICLIMistralAI只能使用 Mistral 系列https://github.com/mistralai/mistral-vibe

国内

Agent名称类型备注开发商支持的模型直达链接
DeepSeekTUICLI由国外人员开发,专门适配DeepSeek模型的编程智能体CLI。不是DeepSeek官方开发的。HmbownDeepSeek 系列https://github.com/Hmbown/DeepSeek-TUI
QoderCLI/IDE阿里巴巴Qwen 系列https://qoder.com/zh
Qwen CodeCLI阿里巴巴Qwen 系列https://qwen.ai/qwencode
TraeIDE字节跳动支持各种系列模型https://www.trae.cn/ide/download
Kimi CodeCLI月之暗面Kimi 系列https://www.kimi.com/code/en
CodeBuddyIDE不推荐腾讯支持各种系列模型https://www.codebuddy.cn/home/
文心快码 (Comate)IDE不推荐百度文心 系列https://comate.baidu.com/en

自定义 API 推荐方案

Agent名称类型备注开发商支持的模型直达链接
cc-switchAPP使得 ClaudeCode 等只能使用自家模型的编程智能体 CLI 可以使用自定义的模型APIfarion1231几乎市面上所有模型及中转站https://github.com/farion1231/cc-switch

如何使用 cc-switch

  1. 选择一个合适的版本 > 下载 > 安装 cc-switch,下载地址:https://github.com/farion1231/cc-switch/releases

Image

  1. 打开 cc-switch > 点击 左上角 的设置

Image

  1. 点击 路由 > 打开 本地路由 > 打开3个按钮

Image

  1. 返回 主页面 > 点击 右上角 的新建

Image

  1. 选择 内置模型供应商 / 自定义配置

Image

  1. 配置 自定义 模型API
    1. API Key : 你的密钥 (注意区分 token-plan 还是 普通api 的API Key)
    2. 请求地址:具体看模型提供商 所提供的URL地址
    3. 配置模型:具体看模型提供商 所提供的模型名称
    4. 高级选项 > API 格式:如果 模型提供商 提供的是 OpenAI 格式 需要进行 格式转换

Image

  1. 测试 模型配置(第3个图标)
    注意:如果报错了 可以复制 错误码 > 再提交给 Claude 帮你分析

Image

Image

使用 CC

  1. 先看 3.1 如何使用 cc-switch
  2. 下载并安装 Claude Code,下载地址:https://claude.com/product/claude-code

Image

PowerShell 默认禁止运行任何未签名脚本(管道远程脚本)

其它方式:

npm install -g @anthropic-ai/claude-code

前提:Node.js,Git,Windows电脑允许执行本地脚本

  1. 终端运行 claude > have a try

Image