mt logoMyToken
ETH Gas
EN

聪明人的办公方式:把重复工作拆成 Skill,剩下的交给 Agent

Favoritecollect
Shareshare

作者:TinTinAI

想象这样一个场景:你在超市水果区挑西瓜,随手打开手机问豆包,几秒钟它就给你列出纹路、声音、瓜蒂几条鉴别标准,当场就能用上。生活里,我们已经悄悄习惯了 AI。

但在工作中,AI 却常常令人失望。老板让你写一份活动文案,结果 AI 返回来一堆「赋能行业、共创未来、开启新篇章」的陈词滥调。

问题出在哪?不是 AI 不会干活,是你还没学会如何 “派活”。更准确地说,AI 的使用方式已经进化到了 “你提需求,它来搞定” 的 Agent 时代。

6 月 6 日晚,TinTinAI 第一期直播邀请到 Validere AI 工程师 & 美国名校博士大壮老师,从 Agent 的基础概念入手,一步步跑通 OpenClaw 安装、飞书配置,再拆解真实 Skill 案例,完整演示了一个高效的 AI 助理是如何 “搓” 出来的。

以下为本场直播课程的精华复盘。错过直播的同学,可前往「TinTinAI」抖音或微信视频号查看完整回放。

技术演进:从语言模型到 Agent

语言模型的本质:下一个词的预测

在 2020 年或 2021 年左右,语言模型(LLM)还只是实验室里的预测工具,工作原理很像手机输入法的自动补全。 例如,当你输入“今天天气很”,输入法可能会根据概率预测补全“好”、“坏”或“热”。

虽然这在业内引发了讨论,但因为其工具属性不强,普通大众并没有真正用起来。

ChatGPT 的诞生与能力的延伸

直到 ChatGPT 横空出世,科学家们对模型进行了后训练和加工,让它能像真正的伙伴一样跟你对话。由于模型在预训练中吸收了海量数据,人们开始把它当成搜索引擎来交互,获取各种知识。

但在这个阶段,AI 还没有长出 “手脚”,无法真正帮人类去执行和完成复杂的任务。

随后,OpenAI 很快为 ChatGPT 增加了两个划时代的功能:

  • Web Search(网络搜索): 允许 AI 实时获取互联网上的最新信息,不再完全依赖于预训练的静态数据。

  • Function Call(函数调用): 语言模型不仅能在对话框里回答问题,还可以去调用已经写好的外部小工具。

一旦语言模型同时具备联网和调用工具的能力,它就有了成为智能体(Agent)的雏形。

Agent 和传统 LLM,交互方式有什么不同?

用程序员开发软件的场景来对比:

传统 LLM :遇到不会写的代码,去问 ChatGPT,它给出 1、2、3 步骤,程序员自己逐步执行,遇到 bug 再把报错贴回去,如此来回多轮才能迭代出结果。人是执行者,AI 是顾问,中间需要大量人工搬运信息。

Agent :程序员只需说 "我想开发这个功能",Agent 自主拆解步骤、调用工具执行、收集反馈、自适应调整,端到端地把问题解决。核心节点仍需人工审查,但整体效率已是另一个量级。

? 简而言之:以前的 AI 相当于“客服”(我问你答);现在的 Agent 则相当于“实习生”(你帮我做,做完告诉我结果)。

Skill:让 Agent 产生复利效应的关键

理解了 Agent 之后,一个更核心的概念随之出现: Skill(技能)

这个概念最早源于 Anthropic 团队内部工程师的文档沉淀。

他们发现,面对同一个任务,不同工程师写出的提示词差距很大。于是他们开始在内部共同维护一份文档,形成可以随时间迭代、共享借鉴、可插拔的标准化工作流文档。

这,就是 Skill 的雏形,本质上是一项 “复利工程” 。

什么时候不需要 Skill?

不是所有任务都适合做成 Skill,盲目开发反而增加负担。以下两类场景不需要 Skill:

  • 确定性的程序化工作流 :比如财务人员每月根据流水表格合账,有明确的计算公式和标准流程,直接用 Excel 公式或传统工作流处理更精准、更好维护。

  • 一次性临时任务 :领导临时交办的一件琐事,直接用 ChatGPT 或豆包交互即可。开发 Skill 的时间成本,远大于解决任务本身的成本。

什么时候真正适合 Skill?

最适合 Skill 的场景,是「输入非标准化、输出需标准化」的重复性任务。

典型场景是投资行业的信息收集:每次输入源都不同,可能是 PDF 财报、Excel 表格、网页文章等多种格式。

有了 Skill,AI 会按照你制定的标准流程对这些数据进行清洗、加工、整理,最终输出格式统一的结果。

实操演示:从零搭建一个写周报的 Skill

接下来以开源 Agent 工具 OpenClaw (俗称"小龙虾")为例,演示如何通过飞书联动 AI,搭建一个周报自动化智能体。

第一步:工具安装与环境配置

方式 A:官网命令行安装

进入 OpenClaw 官网,根据自己的操作系统找到对应的安装命令。

安装后进入配置环节,有两个核心要素需要配置:语言模型的 API,以及与 Agent 交互的渠道(如飞书)。

方式 B:飞书一键式轻量配置

直接使用飞书内置的一键版 OpenClaw(openclaw.feishu.cn),按照引导点击确认即可,适合不想折腾配置的用户,代价是自由度稍低,无法灵活切换语言模型。

? 新手小贴士:

安装过程中如遇到问题,可以借助第三方 AI 辅助编程工具 OpenCode (opencode.ai),用自然语言描述报错,让它帮你调试,绝大多数情况下都能顺利解决。

第二步:智能体性格与原生 Skill 初始化

在飞书中连通 OpenClaw 后,可以先用自然语言做一次人设初始化,告诉它你希望它的风格和称呼。

接着,让它列出目前已有的原生技能,它会逐一展示飞书内已配置好的基础能力,比如"飞书文档读写""文件管理""权限管理"等。这些单点技能,就是后续拼装复杂工作流的"积木插件"。

第三步:构建专属周报 Skill

在飞书对话框中直接对 OpenClaw 下令: “帮我设计一个自动生成飞书周报的 Skill。” 它会主动引导并反问你:这个 Skill 的具体定位是什么、在什么场景下触发?

你用自然语言描述清楚后,它会在后台自动生成并激活一个新的 Skill,通常包含以下几个部分:

  • Skill 名称: 例如 feishu-weekly-report

  • 描述/触发条件: 明确在什么特定指令或语境下,需要调用这个特定的工作流。

  • 工作流程(Pipeline): 详细列出每一步的具体执行步骤(例如:读取指定的临时碎片文档 -> 提取非结构化信息 -> 按照既定专业框架进行分类和提炼 -> 自动在飞书内新建文档并写入格式化周报)。

  • 写作原则: 规范输出的内容调性(如:简洁专业、结果导向、关键数据量化等)。

整个架构均由 AI 一次性自动生成。生成后,你还可以根据自己对周报格式的个性化要求,在里面随时进行细节微调。

第四步:一键触发,端到端交付

为了测试效果,我们可以提供一个非常零散、没有章法、想到什么写什么的自媒体运营日常记录文档(例如:“周一剪了视频,周二回复了私信)丢给飞书小龙虾,并对它说:“使用飞书 weekly report 技能,用这个文档里提供的信息帮我总结一份周报。”

它识别触发词后,调用刚才的 Skill,申请文档权限,自动完成读取、分类、生成、创建、写入全套流程,最终在飞书里输出一份格式整洁的周报,并附上各分类的条目统计。整个过程你无需介入,最后审查一遍结果即可。

Skill 并非一次写好就万事大吉,它需要根据反馈持续打磨 —— 这正是"复利工程"的意义:越用越顺手,越打磨越有价值。

不会写代码,也能立即开始

很多人一听到「配置 Agent」就觉得需要写代码。

整个演示过程没有写一行代码,与 OpenClaw 的所有交互都通过自然语言完成。即便遇到更复杂的任务,都可以借助 OpenCode 描述需求,代码也是由 AI 自己生成的。

本节课最有价值的东西,不是某个具体工具 —— 工具更新太快,学不完也追不上。

真正值钱的是一套思维方式:把重复性工作拆分成步骤,沉淀成标准化的 Skill,交给 Agent 执行。把基础原理弄清楚,你才能结合自己的工作场景用得比别人更熟练、更高效。

Disclaimer: This article is copyrighted by the original author and does not represent MyToken’s views and positions. If you have any questions regarding content or copyright, please contact us.(www.mytokencap.com)contact
More exciting content is available on
X(https://x.com/MyTokencap)
or join the community to learn more:MyToken-English Telegram Group
https://t.me/mytokenGroup