【LLM&SKILL&Agent&MCP&...】概念速查

LLM

Large Language Model,大语言模型

  • 就当前而言,LLM是基于Transformer架构、用于数十亿甚至数万亿的神经网络模型,通过自监督学习预测下一个词,从而掌握语法、知识以及推理能力,不过LLM并不知道”真假“,它知道的最多的是”网上最长出现的说法”,所以有时候会胡说八道(编造论文的参考文献)
  • 通俗点解释,LLM是一个读过互联网内容的“超级百事通”,比较擅长接话茬和聊天(也许吧)
  • 一般情况下,目前活跃度比较高的有Deepseek,阿里千问,豆包,GPT,Claude等

Transformer

框架,核心为Self-Attention

  • 这是源于2017年提出的一种深度学习的架构,核心为自注意力机制(可以不用管这玩意干嘛的),能够并行计算序列中所以元素之间的关联权重,一个比较突出的作用是,解决了RNN的长距离依赖和串行的效率问题
  • 此框架为现代LLM的基石,绝大部分LLM都基于此框架训练,不过最近Transfomer的创始人貌似正在寻找新的架构,这边就不多说了,感兴趣的话可以自行查询

Agent

助理,智能体

  • 现代LLM的一个发展方向便是Agent,基于LLM的自助系统,能够完成诸多复杂的任务,具备任务规划、工具使用、记忆能力
  • 当前比较火的两个开源Agent一个是Open claw,一个是Hermes Agent,不过我觉得更多人可能会喜欢用Opencode和Claudecode吧

SKILL

Agent的“手”

  • 前面提到了Agent能够完成复杂任务,而skill则是Agent工具箱的一个专用螺丝刀,能够协助其实现一些功能或者目标
  • 专业点说,skill是Agent可调用的模块化能力单元,一般是一个API函数或者一项具体的服务,能够通过自然语言出发(你跟它说查天气,它就自动调用查天气的skill去查,然后回答结果给你)
  • 有一个进阶操作,skill可以嵌套组合,形成一个更复杂的skill,当然,这里不多说

MCP

模型上下文协议,AI界的拓展坞

  • 如果把U盘、读卡器、有线or无线的外设插电脑上,每个都要专门的驱动,后来USB统一了接口,即插即用,而MCP即AI与外界工具的统一协议,这样只有有一个工具支持MCP,AI直接就能与之连接,而无需为每一个外部工具专门写一份定制源码
  • MCP最早由Anthropic公司提出(Claude它妈),是一个开放标准,有三个定义(原语):
    • Resources:暴露数据(如读文件、数据库)
    • Prompts:预设的提示模板
    • Tools:可调用的技能(skill)
  • AI通过MCP发现和调用这三者,开发者无需再去做单独的继承
  • 有一个比较广泛的实际应用场景:一个支持 MCP 的 IDE 插件,能让 AI 同时连接你的 GitHub、Notion、Slack 和 Jira,然后回答“上周大家讨论的那个 bug 后来怎么解决的?“它会自动去各系统搜证据回复

  • 说完了热门的,来说说比较冷门的几个

RAG

检索增强生成,Retrieval、Augmented、Generation

  • 标准流程:
    1. 用户提问
    2. 用 Embedding 模型将问题转为向量,去向量数据库里找最相似的文档片段
    3. 把问题 + 检索到的片段拼成新的提示,喂给 LLM
    4. LLM 基于提供的材料生成答案
  • 这样答案既有依据又能用自然语言表达
  • 其实通俗点说,就是你的LLM模型会自己检索资料,找到答案之后再回答问题,而非胡说八道

Fine-tuning

微调~一个看上去过时,却工作转移的”技能专攻“

  • 一个学物理的大学生,你让他去航天局造火箭,他还差得远。但如果你给他3个月的火箭设计资料专攻一下,他就能上手了。微调就是这种“短期专攻”
  • 预训练 LLM 已经学会通用知识,但不懂你的专业术语和特殊任务。微调就是用少量高质量标注数据,继续训练模型,更新它的部分参数,成本远低于从头训练
  • 微调可以让模型改变风格、格式、特定知识。比如让它学会用法律条文写合同

Prompt Engineering

提示词工程,让问题更加用于艺术感(:

  • 同样问 LLM “怎么赚钱”,有人得到“努力工作”,有人得到一份详细的副业清单。区别在于问法。Prompt Engineering 就是研究如何向 AI 提问才能得到最好答案的学问
  • 提示词可以包含角色扮演(“你是一位资深产品经理”)、少样本示例(给两个例子)、思维链(“请一步步思考”)。好的提示能激发出 LLM 潜在的推理能力,无需修改模型本身。
  • 其实不用“工程”这个词吓到自己——日常生活中你已经在做了,只是没总结而已,比如”请使用简体中文回答我的问题“(:

懒得总结了,大概了解一下都是干嘛的就行,日后若有新的比较火的术语,本文还会继续更新,欢迎留言

返回首页
0%