新手篇:AI名词知多少?它们相互啥关系?

AI什么时候开始火的起来的,你还记得么?

我印象中好像从2023年听到 chatGPT开始,AI开始进入大众视野,但是由于特殊原因,很多国人并没有真正接触和了解,直到到2024年底DEEPSEEK出来,国人全都知晓了,一时间 各种Kimi、豆包、元宝、千问、文心啥的层出不穷,大家都在各种工具上玩问与答,甚至完成些小创意,写代码,配音,画图,制作视频啥的,2025年可以说是中国开启的AI元年了。时间来到2026年, Clawdbot(小龙虾)又爆火,把智能体带入一个新高度。

但是自从AI火了后,网络就有各种教程、知识、应用,各种名词也层出不穷,搞的人一头雾水。因此,我试图学习、理解、并记录这些名词的意思,以及他们互相的关系。(会不断新增)



概念类

AI: 就是 人工智能的统称, 涵盖了这一领域所有东西。

AIGC: 就是指AI生成特定内容,比如 代码、图片、音乐、视频等。

AGI: (通用人工智能), 全能型的人工智能形态,可以拟人完成各种协助和任务处理,代替人完成许多事情。暂时还是个方向和概念,业界认为短则十年,长则数十年才能到达这个程度。

ASI(超人工智能)。。。。不想扯远了,就是说比人还厉害了。


底层原理类

NLP: (自然语言处理):将人类的自然语言转换成电脑能懂的指令,相较传统语音交互,技术上已经是水分岭。

LLM:(大语言模型,Large Language Model,缩写LLM):则是基于海量语料和超大参数规模训练的语言模型,能够理解和生成自然语言。当前主流的 LLM(如 GPT 系列、BERT、Claude、文心一言、豆包、千问、KMINI、minimax、GLM 等)。他们几乎都以 Transformer 作为底层架构。

Transformer:(大语言模型架构),它本身并不是大语言模型(LLM),而是一种深度学习架构,最早由 Google 在 2017 年提出,用于高效处理序列数据。它的核心是自注意力机制(Self-Attention),能够并行捕捉序列中任意位置的依赖关系,突破了早些年的 RNN/LSTM 架构在长距离依赖和训练效率上的瓶颈。


GPT,全称Generative Pre-training Transformer,是OpenAI开发的一种基于Transformer的大规模自然语言生成模型。

chatGPT: ChatGPT由OpenAI公司于2022年11月30日发布。同时由OpenAI开发的GPT-3.5模型基础上,ChatGPT通过无监督学习与强化学习技术进行调节,并提供了客户端界面,通过客户端支持用户与模型进行问答交互。ChatGPT不开源,但通过WebUI为用户提供免费的服务。

openAI: 就是家公司。


LLM: 大模型类,AI的大脑。

模型名核心关键词综合实力最佳适用场景推荐人群
GLM (智谱)全能、Agent、学术⭐⭐⭐⭐⭐复杂推理、企业开发开发者、企业、科研人员
Qwen (通义)开源第一、性价比⭐⭐⭐⭐⭐私有化部署、长文档开发者、中小企业
DeepSeek 深度数学代码、极低价⭐⭐⭐⭐编程辅助、逻辑分析程序员、极客
Kimi 月之暗面长文本、体验好⭐⭐⭐⭐读论文、搜资料学生、白领
豆包 字节语音、流量、生态⭐⭐⭐⭐语音对话、日常娱乐大众用户
MiniMax 稀宇科技创意、多模态⭐⭐⭐角色扮演、生成创作者、游戏开发者
chatgpt(openAI)
gemini(google)
xAI – Grok(马斯克的)
Llama(meta)

智能体类

MCP:AI 的 “万能连接器”,打破工具壁垒。

MCP(模型上下文协议 / 模型控制平面)的核心价值是 “标准化连接”。它就像为 AI 打造的 “万能插座”,不管是电脑文件、企业数据库,还是微信、天气 API 等外部工具,都能通过统一标准接入 AI,不用为每个工具单独开发适配接口。

RAG:(检索增强生成)的核心是 “先查资料再作答”,专门解决 AI 的 “幻觉问题”。

简单说,RAG 让 AI 的回答有 “据” 可依,既保证准确性,又能覆盖实时、专业的知识。它就像给 AI 配了一个专属知识库,用户提问后,AI 不会凭记忆硬答,而是先把问题转化为 “语义标签”,从外部知识库(产品手册、行业报告、实时数据等)中检索相关信息,再整合生成答案。

Agent:(Agent就是智能体),一般是通过提示词或工作流,主动帮我们完成某种类型的特定工作。比如这些腾讯元器的智能体,字节跳动的扣子智能体平台等等。

普通 AI 只能 “问一句答一句”,而 Agent 能理解用户的复杂需求后,自动拆解步骤、调用工具,直到完成任务。其中的每个Agent,都是为了解决某种特定任务而设计的。有的可以做PPT,有的会做表格,有的能优化提示词,有的会翻译英语……它们的适用场景,相对单一。

Agent Skills:它是既 MCP 后 Anthropic 推出的又一个 Agent 领域的行业标准。

Skills 的作用就是将那些重复性的、专业的流程进行打包封装。当你需要使用某种能力时,不再需要像过去那样每次都去查阅手册或重新输入冗长的提示词,而是像调用工具一样直接使用。

manus:中国团队做的通用 AI agent,可将您的想法转化为行动,收费的。

Manus 擅长工作和生活中的各种任务,在休息时完成所有事情。Manus可以依托虚拟环境,独立解决各类复杂多变的任务。通过思考和规划,它能自主决策和调用各类工具,直至交付最终成果。2025年底后面被meta公司收购,中国地区使用受限了。

clowdbot 、 Moltbot、OpenClaw: 这3个是一个东西,就是俗称小龙虾(因为Logo就是只小龙虾),只是因为商标啥的问题,最终就统一改成叫 OpenClaw。免费,2026年1月底上线,火的不要不要的。

OpenClaw是一款面向个人与轻量团队的低门槛AI自动化代理工具,前身为Clawdbot、Moltbot,经过版本迭代与品牌整合后,2026年统一以“OpenClaw”作为官方名称,核心定位是通过自然语言指令,替代人工完成流程化、重复性工作,无需用户掌握编程技能,适配多场景自动化需求。它能在 个人电脑(如 Mac、Windows、Linux)上运行,通过 WhatsApp、Telegram、iMessage 等聊天软件接收指令并直接操作电脑完成任务,能直接帮我们处理邮件、整理文件、甚至操作网页,简单来说,Clawdbot 是一个“听得懂自然语言的系统管理员”。并且它的交互的方式直接回归到了用户熟悉的聊天软件之中,就像是与一位同事或朋友交谈那样。此外它同时拥有完整的操作权限与超长记忆,这意味着它是一个专属于个人的AI助理


代码开发工具类

Claude Code: 由 Anthropic公司开发,目前最强。仅限 Claude模型,不开源。

Cursor:一直挺火的代码辅助工具。Cursor 是一款完整的 IDE(基于 VS Code 分叉),深度集成了 AI 能力。Cursor 不是在你的工作流中添加 AI,而是让 AI 成为工作流的核心

Gemini CLI : google公司的,部份免费。Gemini 是 Google DeepMind 推出的跨模态 AI 系统,集成了代码生成、优化、调试等多种功能。它不仅能生成代码,还能优化现有代码、进行性能调优,并且在深度学习和 AI 项目中提供强有力的支持。

OpenAI Codex:是 OpenAI 推出的 AI 编程助手,能够将自然语言转换为代码,并支持多种编程语言。Codex 的设计理念是通过快速生成代码、自动化常见任务、跨语言转换等功能,帮助开发者节省大量编程时间。

OpenCode :是一款在终端运行的免费、开源 AI 编程智能体 (agent)。它由 SST (Serverless Stack) 背后的团队构建。


Ollama :是一个开源工具,专为在本地计算机上​​快速部署和运行大型语言模型(LLM)​​而设计。通过简化的命令行操作,用户无需复杂配置即可调用诸如 DeepSeek、Qwen 等主流开源模型

Token: 是模型用来表示自然语言文本的基本单位,可以直观的理解为“字”或“词”;理解成手机流量吧!

工作流编排workflow

输入概述,即向大模型输入内容:

Prompt :提示词,问的越准得到回复越靠谱,但还是有很多限制。

Context :上下文,在提问中附带上其它信息,保证多轮对话连续性。但长期运行就会乱套

Harness:约束机制,制定相应的检查和纠正机制,保持长期持续运行。

我也只是记录大致并按类进行了梳理,这让我更好的了解其中的关系。如果您要了解更多,请直接问大模型!

发表评论