Hi 👋, 我是Ryan

这里记录我的技术探索、学习心得和生活思考。从ACM竞赛到AI协作,从代码到文字——这是一个程序员的十年 journey。

Claude Code StatusLine 跨平台配置指南

Claude Code StatusLine 跨平台配置指南 本文档说明如何在 Windows + WSL 双环境下配置 Claude Code 的状态栏,实现配置自动同步。 文件结构 1 2 3 4 5 6 7 8 9 Windows: C:\Users\<用户名>\.claude\ ├── settings.json # 主配置文件(原文件) ├── statusline.sh # 状态栏脚本(原文件) └── STATUSLINE_CONFIG.md # 配置文档 WSL: ~/.claude/ ├── settings.json # 软链接 → Windows ├── statusline.sh # 软链接 → Windows └── STATUSLINE_CONFIG.md # 软链接 → Windows(可选) 配置方案 1. settings.json 配置 1 2 3 4 5 6 { "statusLine": { "type": "command", "command": "bash $HOME/.claude/statusline.sh" } } 关键点: ...

2026年4月18日 · 5 分钟 · 891 字 · Ryan

CLI-Anything:让所有软件对 AI Agent 原生可用

CLI-Anything:让所有软件对 AI Agent 原生可用 引言 AI Agent 正在改变我们与软件交互的方式。但有一个根本性问题:今天的软件都是为人类设计的,不是为 Agent 设计的。 大多数专业软件(GIMP、Blender、LibreOffice、OBS Studio)通过 GUI 与人类交互,而 AI Agent 却只能通过脆弱的截图识别、模拟鼠标点击来操作它们。这种"UI 自动化"方案极其脆弱,且无法覆盖软件 90% 的功能。 CLI-Anything 试图从根本上解决这个问题:将任何软件转化为 AI Agent 可用的命令行工具(CLI)。 📦 项目地址:https://github.com/HKUDS/CLI-Anything ⭐ GitHub Stars: 30,000+(2026-03-08 创建,仅 1 个月!) 🔗 官网:https://clianything.cc/ 核心思路 CLI-Anything 的核心理念很简单:与其让 AI 通过模拟人类操作(截图、点击、拖拽)来控制软件,不如直接生成一个结构化的命令行接口,让 Agent 用命令行就能完全控制软件。 1 2 3 4 5 6 7 GUI 软件源码/API 文档 ↓ AI Agent 分析(7 阶段流水线) ↓ 结构化 CLI(带 REPL、JSON 输出、测试) ↓ Agent 通过命令控制软件 工作原理:7 阶段流水线 CLI-Anything 让 AI 编程助手(Claude Code、OpenCode、Codex 等)自动完成以下 7 个阶段: ...

2026年4月12日 · 3 分钟 · 633 字 · Ryan

Chrome DevTools MCP 完全指南:让你的 AI Agent 学会操控浏览器

Chrome DevTools MCP 完全指南:让你的 AI Agent 学会操控浏览器 一、引言 — 为什么 AI Agent 需要浏览器自动化? 过去两年,AI Coding Agent 已经彻底改变了我们写代码的方式。Claude Code、Cursor、Windsurf 这些工具能帮我们写代码、改 Bug、做重构,甚至能独立完成整个功能模块的开发。 但有一个场景,它们一直束手无策——操控浏览器。 想象一下这些日常场景: 你想让 AI 帮你填一个复杂的网页表单,它只能告诉你"先点这里,再填那里",然后你手动操作 你想自动抓取某个动态渲染的网页数据,得自己写 Puppeteer/Playwright 脚本,调试半天 你想让 AI 帮你测试网页的某个交互流程,它只能给你写一段代码,然后你跑起来看效果 你想监控某个网页的网络请求和性能数据,得打开 DevTools 手动分析 痛点很明确:AI Agent 很聪明,但它被困在终端和文件里,看不到浏览器,也点不了按钮。 Chrome DevTools MCP 的出现,打破了这层壁垒。它让 AI Agent 获得了"眼睛"(截图)和"双手"(点击、填表),能够真正像人一样操控浏览器。短短几个月,这个项目就冲上了 34k+ stars,成为了 AI 工具链中最热门的基础设施之一。 这篇文章,我们就来系统地了解 Chrome DevTools MCP 是什么、怎么用、能做什么。 二、什么是 Chrome DevTools MCP? 项目简介 Chrome DevTools MCP 是一个基于 Model Context Protocol (MCP) 的浏览器控制服务器。简单来说,它把你的 Chrome 浏览器变成了一个可以被 AI Agent 远程操控的 API 服务。 ...

2026年4月11日 · 10 分钟 · 2111 字 · Ryan

用 Playwright + OCR 实现校园网自动登录

每次连上校园 WiFi,都要打开浏览器 → 等认证页跳转 → 输学号密码 → 辨认模糊的验证码 → 勾选协议 → 点登录。一天掉线几次,操作就重复几次。 能不能让它自己搞定? 本文拆解我用 Playwright + ddddocr 实现的校园网自动登录方案,核心思路只有三步: curl 预检测 — 判断是否需要认证,避免不必要的浏览器启动 OCR 识别验证码 — ddddocr 本地识别,识别率 60-80% Playwright 自动填表 — 遍历 iframe 定位表单,填写并点击登录 整个脚本不到 420 行,npx xtu-login 一行运行,配个 cron 每 5 分钟自动检测,彻底告别手动认证。 校园网的认证机制 大学校园网普遍采用 Portal 认证(也叫 Web 认证)。它的原理是: 设备连接网络后,所有 HTTP 请求会被网关重定向到认证页面(通常叫 ePortal) 认证成功后,网关记录设备的 MAC 地址,放行一段时间 超过空闲时间或租约到期,重新拦截,需要再次登录 所以核心思路就是:检测是否被重定向 → 如果是,自动完成认证流程。 为什么这样选型? 检测层:curl 轻量、速度快,适合定时任务高频执行 通过 -L 跟随重定向,从响应中解析认证 URL 网络已连通时几乎零开销(< 1 秒完成) 自动化层:Playwright ...

2026年4月11日 · 3 分钟 · 487 字 · Ryan

Clash Verge Rev 入门指南:从零开始搭建科学上网环境

Clash Verge Rev 入门指南:从零开始搭建科学上网环境 本文面向纯新手,从安装到配置,从概念到实战,手把手带你搭一套能长期稳定使用的 Clash Verge Rev 环境。最后会附上我的完整配置脚本,可以直接抄作业。 一、安装与基础设置 1.1 下载安装 Clash Verge Rev 是开源软件,GitHub 地址:https://github.com/clash-verge-rev/clash-verge-rev Windows:下载 .exe 安装包,双击安装 macOS:下载 .dmg,拖拽到 Applications Linux:下载 .AppImage 或对应发行版的包 安装完成后打开,界面大概长这样: 1 2 3 4 5 6 7 8 ┌─────────────────────────────────────┐ │ Clash Verge Rev │ │ ┌──────────┬─────────────────────┐ │ │ │ 订阅 │ 节点列表 │ │ │ │ 规则 │ 连接日志 │ │ │ │ 设置 │ │ │ │ └──────────┴─────────────────────┘ │ └─────────────────────────────────────┘ 1.2 导入订阅 科学上网需要"节点",也就是代理服务器。通常你购买的机场服务商会提供一个订阅链接(一般以 https:// 开头,包含你的 token)。 ...

2026年3月30日 · 12 分钟 · 2422 字 · Ryan

OpenClaw实战:用ADB+本地OCR打造全自动安卓设备智能管理助手

前言:ADB的痛点是什么? ADB(Android Debug Bridge)几乎是所有安卓玩机党、测试工程师的必备工具,我们可以用它执行截图、点击、安装应用、文件传输等几乎所有手机操作,但它有一个最大的短板:它只能执行命令,没法"看到"手机屏幕上的内容。 很多时候我们想做自动化操作,都会卡在"判断当前屏幕有什么"这一步:比如想跳过开屏广告,你得先知道"跳过"按钮在什么位置;想自动签到,得先识别到"签到"按钮有没有出现;想批量提取截图里的文字,得手动一张张复制。 今天我们就用OpenClaw的两个现成技能:ADB工具集 + 本地PaddleOCR,组合出一个完全本地化、零API费用、隐私安全的全自动安卓设备管理助手,实现"识别→决策→操作"的完整闭环。 一、整体方案设计 整个架构非常简单,三层结构完全跑在本地,不需要任何云端服务: 1 2 3 4 ┌─────────────────┐ ┌─────────────────┐ ┌─────────────────┐ │ ADB交互层 │ → │ PaddleOCR识别层 │ → │ OpenClaw逻辑层 │ │ (手机操作) │ │(文字+坐标识别) │ │(规则判断+调度)│ └─────────────────┘ └─────────────────┘ └─────────────────┘ 各层职责: ADB层:负责和安卓设备交互,支持截图、点击、滑动、启动应用、拉取/推送文件、执行Shell命令等所有ADB原生能力 OCR层:基于本地PaddleOCR实现,识别截图中的文字内容和对应坐标位置,全程本地运行,不会上传任何图片到第三方 逻辑层:OpenClaw作为调度中心,把两个能力串联起来,支持自定义规则,甚至可以用自然语言直接控制(比如"帮我把手机里的所有账单截图文字提取出来") 二、前置环境准备 2.1 技能安装 首先确保你已经在OpenClaw中安装了两个必备技能: 1 2 3 4 5 # 安装ADB工具集技能 openclaw skills install adb # 安装本地PaddleOCR技能 openclaw skills install paddle-ocrv5 安装完成后运行openclaw skills list确认两个技能状态都是✓ ready。 2.2 ADB设备连接 安卓手机开启「开发者选项」→ 打开「USB调试」,用USB连接电脑,或者通过Wi-Fi无线连接 执行adb devices确认设备已经连接成功,能看到设备ID输出 (可选)配置ADB路径到系统环境变量,或者在TOOLS.md中配置你的ADB实际路径 2.3 本地OCR服务启动 PaddleOCR技能默认会启动本地MCP服务在端口18080,启动后可以通过lsof -i:18080确认服务正常运行。 ...

2026年3月9日 · 2 分钟 · 423 字 · Ryan

OpenClaw 多智能体路由:构建企业级 AI 协作基础设施

引言 随着 AI 智能体(Agent)在企业场景中的广泛应用,单一智能体已难以满足复杂业务需求。如何在同一基础设施上运行多个独立的 AI 智能体,并让它们协同工作,成为现代 AI 架构设计的核心挑战。 OpenClaw 的多智能体路由(Multi-Agent Routing)系统正是为解决这一问题而生。本文将深入解析其架构设计、核心概念与最佳实践,帮助读者构建企业级的多智能体协作基础设施。 什么是"一个智能体"? 在 OpenClaw 的语境中,一个智能体(Agent) 是一个完全独立、自包含的"大脑",拥有以下核心资源: 1. 独立工作空间(Workspace) 每个智能体拥有专属的目录结构: 1 2 3 4 5 6 ~/.openclaw/workspace-<agentId>/ ├── AGENTS.md # 智能体行为规范 ├── SOUL.md # 人格与个性定义 ├── USER.md # 用户信息 ├── TOOLS.md # 工具使用说明 └── ... # 其他工作文件 这些文件定义了智能体的"身份"——它如何思考、如何回应、拥有哪些工具能力。 2. 独立状态目录(AgentDir) 1 2 3 4 ~/.openclaw/agents/<agentId>/agent/ ├── auth-profiles.json # 认证配置(各频道账号) ├── models.json # 模型注册表 └── config/ # 智能体专属配置 关键原则:认证信息是按智能体隔离的。一个智能体的 Telegram 账号不会自动共享给另一个智能体。如需共享,必须显式复制 auth-profiles.json。 ...

2026年3月7日 · 4 分钟 · 698 字 · Ryan

OpenClaw Skill 介绍:Healthcheck 主机安全加固

OpenClaw Skill 介绍:Healthcheck 主机安全加固 简介 Healthcheck 是一个专业的 OpenClaw Skill,用于主机安全加固和风险容忍度配置。当你需要对运行 OpenClaw 的机器(笔记本、工作站、树莓派、VPS)进行安全审计、防火墙/SSH/更新加固、风险评估、暴露审查、OpenClaw cron 定时检查或版本状态检查时,这个工具就是你的最佳选择。 核心功能 🔍 安全审计 系统安全状况评估 漏洞扫描和检测 配置安全检查 权限和访问控制审查 🛡️ 主机加固 防火墙规则配置 SSH 安全设置 自动更新配置 服务最小化 📊 风险评估 风险容忍度配置 暴露面分析 威胁建模 安全建议生成 ⏰ 定时检查 OpenClaw 安全审计定时任务 版本状态检查 健康状态监控 使用方法 基础命令 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 # 运行基础安全审计 openclaw security audit # 深度安全审计 openclaw security audit --deep # 查看系统状态 openclaw status # 深度系统状态 openclaw status --deep # 检查健康状况 openclaw health --json # 查看更新状态 openclaw update status 定时任务管理 1 2 3 4 5 6 7 8 9 10 11 # 列出所有定时任务 openclaw cron list # 添加定时任务 openclaw cron add --name "daily-audit" --schedule "0 9 * * *" --command "openclaw security audit" # 查看定时任务运行记录 openclaw cron runs # 立即运行定时任务 openclaw cron run <job-id> 工作流程 Healthcheck Skill 遵循严格的工作流程: ...

2025年3月6日 · 2 分钟 · 280 字 · Ryan

OpenClaw Skill 介绍:Weather 天气查询

OpenClaw Skill 介绍:Weather 天气查询 简介 Weather 是一个简单但实用的 OpenClaw Skill,用于查询天气信息。它通过 wttr.in 服务获取天气数据,无需 API 密钥即可使用。 功能特点 🌍 支持全球任意地点的天气查询 🌡️ 实时温度、体感温度、湿度、风速 📅 3天天气预报 🌅 日出日落时间 🌙 月相信息 💨 空气质量指数(部分城市) 使用方法 基础查询 1 2 3 4 5 6 7 8 9 10 11 # 查询当前位置天气 curl wttr.in # 查询指定城市 curl wttr.in/Beijing curl wttr.in/London curl wttr.in/"New York" # 使用中文城市名 curl wttr.in/北京 curl wttr.in/上海 格式化输出 1 2 3 4 5 6 7 8 9 10 11 12 13 14 # 简洁模式(单行输出) curl "wttr.in/Beijing?format=3" # 自定义格式 curl "wttr.in/Beijing?format=%l:+%c+%t+%w+%h" # 常用格式变量 # %l - 地点 # %c - 天气状况 # %t - 温度 # %f - 体感温度 # %w - 风速 # %h - 湿度 # %p - 降水概率 JSON 输出 1 2 # 获取 JSON 格式数据 curl "wttr.in/Beijing?format=j1" 图片输出 1 2 # 获取 PNG 图片 curl "wttr.in/Beijing.png" -o weather.png 机场代码查询 1 2 3 4 5 6 7 # 使用 IATA 机场代码 curl wttr.in/PEK # 北京首都机场 curl wttr.in/PVG # 上海浦东机场 curl wttr.in/HKG # 香港机场 curl wttr.in/NRT # 东京成田机场 curl wttr.in/LHR # 伦敦希思罗机场 curl wttr.in/JFK # 纽约肯尼迪机场 在 OpenClaw 中使用 1 2 3 4 5 # 询问 OpenClaw 天气 @weather 北京今天天气怎么样? # 或直接使用命令 curl -s "wttr.in/Beijing?format=3" 注意事项 🆓 完全免费,无需注册或 API 密钥 🌍 支持全球 200,000+ 城市 🌐 支持多语言输出 ⏱️ 数据来自世界各地的气象站,通常每 1-2 小时更新 📊 预报准确度随时间递减,3天内的预报最可靠 相关链接 wttr.in 官方文档 GitHub 仓库 简单、实用、免费 —— 这就是 Weather Skill 的魅力所在! ...

2025年3月6日 · 2 分钟 · 215 字 · Ryan

OpenClaw Skill 介绍:Coding Agent 编程助手

OpenClaw Skill 介绍:Coding Agent 编程助手 什么是 Coding Agent? coding-agent 是一个 OpenClaw Skill,它允许你将编程任务委托给 Codex、Claude Code、Pi 等 AI 编程助手。无论是构建新功能、审查 PR、重构大型代码库,还是需要文件探索的迭代式编码,这个 Skill 都能帮上忙。 核心特性 1. 支持多种 AI 编程助手 工具 说明 Codex OpenAI 的编程助手,支持 GPT-5.2-codex Claude Code Anthropic 的 Claude 编程助手 Pi 轻量级编程助手 OpenCode 开源替代方案 2. 灵活的工作模式 单次执行模式: 适合快速任务 执行完自动退出 适合脚本和自动化 后台模式: 适合长时间运行的任务 可以监控进度 支持随时介入 3. 安全的执行环境 工作目录限制:Agent 只能在指定目录内工作 Git 沙箱:需要 git 目录才能运行 权限控制:支持自动审批或手动确认 使用方法 快速开始 单次执行(推荐用于简单任务) 1 2 3 4 5 # 基本用法 - 在临时目录执行 SCRATCH=$(mktemp -d) && cd $SCRATCH && git init && codex exec "Your prompt here" # 在实际项目中执行(带 PTY) bash pty:true workdir:~/Projects/myproject command:"codex exec 'Add error handling to the API calls'" 后台模式(适合长时间任务) 1 2 3 4 # 启动后台任务(带 PTY) bash pty:true workdir:~/project background:true command:"codex exec --full-auto 'Build a snake game'" # 返回的 sessionId 用于后续管理 监控和管理后台任务 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 # 查看所有运行中的会话 process action:list # 查看特定会话的日志 process action:log sessionId:XXX # 检查会话是否还在运行 process action:poll sessionId:XXX # 向会话发送输入(如果 Agent 提问) process action:write sessionId:XXX data:"y" # 发送输入并按回车 process action:submit sessionId:XXX data:"yes" # 终止会话 process action:kill sessionId:XXX 实用场景 场景 1:快速原型开发 1 2 3 4 5 # 创建一个临时目录并初始化 git SCRATCH=$(mktemp -d) && cd $SCRATCH && git init # 让 Codex 快速构建一个原型 codex exec --full-auto "Build a React todo app with TypeScript" 场景 2:代码重构 1 2 # 在现有项目中重构代码 bash pty:true workdir:~/project command:"codex exec --full-auto 'Refactor the authentication module to use JWT'" 场景 3:PR 审查 ⚠️ 重要:不要在 OpenClaw 的项目目录中审查 PR! ...

2025年3月6日 · 3 分钟 · 446 字 · Ryan