普通人 AI 入门使用手册
更新时间:2026-06-10
这份资料写给刚开始想学 AI 的人。
你可能已经刷到过很多 AI 工具、AI 教程、AI 赚钱案例。
但看多了以后,反而更容易乱:
- 到底先学哪个工具?
- ChatGPT、Claude、Kimi、DeepSeek 有什么区别?
- Prompt、Token、API、Agent 这些词到底是什么意思?
- AI 除了聊天和写文案,还能怎么真正用到生活、工作和项目里?
- 如果以后想做网站、工具、自动化流程,AI 又是怎么接进去的?
这份资料不想把你带进更复杂的概念里。
它想先帮你建立一个清楚的框架:
AI 不是一个神奇按钮。
它更像一个可以帮你读、写、整理、分析、拆解、生成初稿、连接流程的工具。
你越清楚自己要做什么,它越有用。
1. 先别急着学工具,先理解 AI 能帮你什么目录
很多人学 AI 的第一步,是收藏工具。
今天收藏一个绘图工具,明天收藏一个写作工具,后天又看到一个自动做 PPT 的工具。
收藏得越多,越不知道从哪里开始。
其实新手最应该先理解的不是工具,而是 AI 能处理哪类问题。
普通人最常用的 AI 能力,大概分成 5 类。
第一类是帮你读。
比如你看到一篇很长的文章、一份说明文档、一段聊天记录、一条专业新闻。
你不想从头慢慢读,就可以让 AI 先帮你提炼:
请帮我读下面这段内容。
用普通人能听懂的话回答:
1. 它主要在说什么?
2. 哪 3 点最重要?
3. 和我有什么关系?
4. 我今天可以怎么用?
第二类是帮你写。
不是让它完全代替你表达,而是先帮你写出一个初稿。
你可以让它帮你写朋友圈、私信回复、短视频文案、邮件、通知、自我介绍。
但要记住:
AI 写出来的东西,通常只是初稿。
真正让内容变好的,是你继续要求它修改。
比如:
请帮我把下面这段话改得更清楚。
要求:
1. 不要夸张。
2. 不要像广告。
3. 保留我的原意。
4. 句子短一点。
第三类是帮你整理。
当你信息太多、想法太乱、事情太杂时,AI 很适合帮你先分层。
比如:
请帮我把下面这些内容整理成:
1. 已经确定的事
2. 还不确定的事
3. 今天要做的事
4. 可以以后再做的事
第四类是帮你拆解。
很多时候,人不是不想做,而是不知道第一步是什么。
这时不要让 AI 给你一个很大的长期计划。
你可以这样问:
我想做这件事:[写清楚目标]
请不要给我长期规划。
只帮我拆成今天能完成的 3 步。
每一步都要具体到可以马上做。
第五类是帮你检查。
比如你写完一段话、做完一个方案、想到一个项目点子,但不知道哪里有问题。
可以这样问:
请帮我检查下面内容。
重点看:
1. 有没有说不清楚的地方?
2. 有没有逻辑跳跃?
3. 普通人看完会不会知道下一步做什么?
4. 哪些地方需要删掉?
这 5 类能力,比背很多工具名更重要。
因为工具会变。
但读、写、整理、拆解、检查,是你长期都会用到的能力。
2. 常见 AI 工具怎么选目录
新手不需要一开始就把所有工具都试一遍。
先选一两个用熟,比每天换工具更有用。
ChatGPT
ChatGPT 比较适合做日常综合助手。
你可以用它:
- 提问
- 学习
- 写作
- 总结
- 分析想法
- 拆解任务
- 做内容初稿
如果你不知道从哪个工具开始,ChatGPT 是一个比较稳的入口。
Claude
Claude 比较适合处理长内容。
比如:
- 长文章
- 聊天记录
- 访谈转写
- 文档整理
- 复杂资料总结
如果你经常要读很多资料,或者需要把一堆文字整理成清楚结构,Claude 很适合。
Perplexity
Perplexity 更像一个带来源的搜索助手。
适合:
- 查资料
- 找出处
- 快速了解一个新概念
- 判断一个信息有没有公开来源
当你担心 AI 一本正经胡说时,可以用它查来源。
Kimi、豆包、DeepSeek
这些工具对中文用户更友好。
适合:
- 日常提问
- 中文资料整理
- 手机端使用
- 入门尝试
如果你只是想先把 AI 用到生活和工作里,这些工具已经够用了。
新手怎么选
你可以这样选:
- 想聊天、写东西、拆问题:先用 ChatGPT。
- 经常读长文、整理资料:试 Claude 或 Kimi。
- 想查资料、看来源:用 Perplexity。
- 想中文日常轻量使用:豆包、Kimi、DeepSeek 都可以。
不要把时间花在比较工具上。
先拿一个真实问题去用。
能帮你省时间、理清思路、完成事情的工具,才是适合你的工具。
3. 一些常听到的 AI 词,用人话解释目录
这一部分不用背。
你只要大概知道它们是什么意思。
以后看到这些词,不会被吓住就够了。
GPT / 大模型
可以简单理解成:
一个读过大量文字、能根据你的要求生成回答的系统。
它不是人。
它不会真的理解你的人生。
但它能根据你给的信息,生成很像人写出来的文字、分析、步骤和代码。
Prompt
Prompt 就是你对 AI 说的话。
也就是你的提问和要求。
很多人把 Prompt 说得很玄。
其实对普通人来说,最重要的不是写得复杂,而是写得清楚。
一个好 Prompt 通常包含:
- 你是谁
- 你要做什么
- 你给了什么材料
- 你希望输出成什么样
- 你不希望它怎么写
Token
Token 是 AI 计算文字长度的单位。
你可以把它理解成:
AI 读写文字时用的计量单位。
你不需要精确计算。
只要知道:
- 你输入越多,消耗越多。
- AI 输出越长,也会消耗更多。
- 处理长文、批量内容、API 调用时,Token 会影响成本。
API
API 是让软件调用 AI 能力的通道。
你在 ChatGPT 网页里打字,是你本人在和 AI 对话。
但如果你想让自己的网站、表格、小程序、机器人自动去问 AI,就需要 API。
可以简单理解成:
API = 让你的软件去问 AI。
比如:
你做了一个网页,用户把一段文字粘进去,点击按钮。
网页把这段文字发给 AI。
AI 返回总结、待办、建议。
网页再把结果展示给用户。
这背后就可能用到 API。
API Key
API Key 是调用 API 的钥匙。
它很重要。
不要发给别人。
不要放在公开网页里。
不要上传到 GitHub。
如果别人拿到你的 Key,可能会用你的额度花你的钱。
Agent
Agent 可以理解成一个能连续做几步事的 AI 助手。
普通对话是:
你问一句,它答一句。
Agent 更像:
你给它一个目标,它自己拆步骤,调用工具,看结果,再继续下一步。
但新手不要一开始就追求 Agent。
先把单步任务用熟。
否则很容易变成:
你连自己要什么都没说清楚,就期待 AI 自动帮你完成一切。
Workflow
Workflow 就是工作流。
说白了,就是把一件事拆成固定步骤。
比如整理每日 AI 信息:
- 收集信息
- 筛选重要内容
- 改成人话
- 写出普通人能怎么用
- 发布到官网
- 同步到社群
这就是一个工作流。
AI 真正好用的地方,不只是聊天。
而是把它放进你经常重复的流程里。
RAG
RAG 可以理解成:
让 AI 先查你的资料,再回答。
比如你有一堆课程资料、社群内容、公司文档。
普通 AI 不一定知道这些内容。
但如果你把资料做成知识库,AI 就可以先从里面找相关内容,再回答用户问题。
这类能力常用在:
- 客服问答
- 知识库助手
- 课程资料查询
- 公司内部文档搜索
4. Codex 这类“能做事的 AI”,到底怎么用目录
很多人问 Agent 哪个好用。
我自己的判断比较直接:
不要先看它名字有多厉害。
先看它能不能帮你把一件真实事情推进成结果。
普通聊天 AI 更像是陪你讨论、帮你写、帮你分析。
Codex 这类 AI 不太一样。
它更像一个能进入项目里干活的助手。
比如它可以:
- 读你的项目文件
- 改网页
- 写脚本
- 改代码
- 跑命令
- 看报错
- 修问题
- 生成说明文档
- 帮你把改动提交到 GitHub
- 把网站部署到服务器
这就是我为什么觉得 Codex 很好用。
因为它不是只告诉我“你应该怎么做”。
它可以直接帮我做一部分。
这类 AI 大概分成几类
第一类,是代码和项目型 Agent。
代表有:
- Codex
- Claude Code
- Cursor
- Windsurf / Cascade
它们更适合处理和项目有关的事情。
比如:
- 做一个官网页面
- 修改已有网站
- 写一个自动化脚本
- 批量整理文件
- 修复代码报错
- 根据日志定位问题
- 写接口
- 改样式
- 生成项目文档
这类工具最适合的场景是:
你已经有一个明确目标,并且这个目标可以落到文件、代码、网页、脚本或项目里。
比如你不要只说:
帮我做一个网站。
更好的说法是:
我想做一个个人官网。
目标用户是想学 AI 的普通人。
首页要有每日 AI、学习资料、加入社群、赚钱实验、项目对接几个模块。
整体风格暗色、克制、有科技感。
请先读取项目结构,再告诉我你准备改哪些文件。
第二类,是工作流和应用型 Agent。
代表有:
- Dify
- Coze
- n8n
- Make
- Zapier
它们更适合把一个固定流程搭出来。
比如:
- 用户填表
- AI 分析内容
- 自动写入表格
- 自动分类
- 自动生成回复
- 自动通知你
这类工具适合你已经知道流程大概长什么样。
如果你连输入是什么、输出是什么、谁来检查都没想清楚,就不要急着搭自动化。
第三类,是知识库问答型 Agent。
它适合处理“有一堆资料,希望别人能问”的场景。
比如:
- 课程资料问答
- 公司内部知识库
- 客服常见问题
- 社群资料查询
- 产品说明查询
它背后经常会用到 RAG。
也就是让 AI 先查你的资料,再回答。
Codex 这类工具适合谁
如果你只是想问生活问题、写一段文案、总结一篇文章,普通对话 AI 就够了。
但如果你有这些需求,就可以开始了解 Codex 这一类:
- 你想做一个网站
- 你想改一个已有页面
- 你想把资料整理成网页
- 你想写一个自动化脚本
- 你想把重复工作交给程序
- 你想让 AI 帮你处理项目文件
- 你希望 AI 不只是回答,而是能执行
它不是只有程序员才能用。
但你至少要能说清楚:
- 你要做什么
- 给谁用
- 现在有什么文件或材料
- 你希望最后变成什么结果
- 哪些地方不能乱改
新手怎么用 Codex 这类 AI
第一步,不要给太大的模糊任务。
不要说:
帮我把官网做好。
要说:
请帮我修改官网的学习资料模块。
目标是让用户看出来:这是一份免费的 AI 入门资料,适合刚开始学 AI 的人。
不要写得像卖课。
请先读取相关文件,再告诉我你准备怎么改。
第二步,让它先理解项目。
可以说:
请先看一下项目结构,找到和首页、学习资料模块、下载资料有关的文件。
先不要改代码,先告诉我你看到的结构。
第三步,把任务拆小。
比如:
- 先改文案
- 再改目录
- 再改样式
- 再生成阅读版
- 最后构建和部署
不要一口气让它做一个巨大又模糊的东西。
第四步,让它验证。
比如:
改完以后,请运行构建检查。
如果是网页,请打开预览,检查按钮、链接、排版有没有问题。
最后告诉我改了哪些文件。
第五步,重要操作要确认。
比如:
- 发布
- 删除文件
- 覆盖数据
- 修改账号相关内容
- 提交到 GitHub
- 部署到服务器
这些操作最好让它说明清楚再做。
我觉得 Codex 最适合做的事
如果你刚开始用,不要让它一上来做特别复杂的产品。
可以先从这些小事开始:
- 修改一个网站模块。
- 把一份 Markdown 资料做成网页阅读版。
- 写一个批量整理文件名的脚本。
- 根据报错修一个简单问题。
- 把一段重复操作变成脚本。
- 帮你检查项目里某个功能是怎么实现的。
- 把你说的一段需求,落成具体页面或文档。
你会慢慢感受到差别:
聊天 AI 主要给你答案。
Codex 这类 AI 更像把答案往前推进了一步。
它能帮你把“我想做”变成“已经做了一版”。
这也是我觉得它真正有价值的地方。
5. 现在常见 AI 应用,应该怎么分类目录
现在 AI 工具很多。
如果你一个个记名字,很快就会乱。
更好的方法是先把它们放进几类。
你只要知道:
- 这个工具主要处理什么内容
- 它是直接打开就能用,还是需要一点技术门槛
- 它是回答问题,还是能替你连续做事
- 它适合生活、工作、创作、编程,还是自动化
这样以后看到一个新工具,你就不会被名字绕晕。
你可以先把下面这张图记住。
AI 应用大地图
├─ 通用大模型:聊天、写作、读文档、分析问题
├─ 搜索研究:查资料、找来源、整理报告
├─ 创作工具:生图、修图、视频、声音、音乐、设计
├─ 办公学习:PPT、表格、会议纪要、笔记、知识库
├─ 编程工具:写代码、改网页、修 bug、做小工具
├─ 操作电脑:看屏幕、点按钮、填表、跑流程
├─ 工作流平台:把多个软件连起来,重复任务自动跑
└─ 底层模型/API:给网站、系统、机器人接入 AI 能力
第一类:通用大模型
通用大模型,就是你平时说的“聊天 AI”。
它们不是只能聊天。
它们最核心的能力是:
- 理解你的文字
- 读懂图片、文件、网页
- 帮你写、改、总结、分析
- 帮你拆步骤、做判断
- 有些还能生成图片、做研究、操作工具
可以先这样理解:
| 类型 | 常见工具 | 更适合什么 |
|---|---|---|
| 国外通用模型 | ChatGPT | 综合能力强,适合写作、分析、图像、代码、研究和 Agent 任务 |
| 国外长文和代码 | Claude | 适合长文档、严谨写作、代码理解、复杂任务拆解 |
| 国外搜索和办公生态 | Gemini | 适合 Google 生态、搜索研究、文档理解、多模态任务 |
| 国外实时搜索 | Perplexity | 适合查资料、看来源、快速了解一个新问题 |
| 国外社交信息 | Grok | 适合看 X 上的实时信息和观点,但要自己判断可靠性 |
| 国内推理和性价比 | DeepSeek | 适合中文问答、推理、代码、API 接入,开发者用得多 |
| 国内长文档 | Kimi | 适合长文阅读、资料整理、中文文档、网页和研究任务 |
| 国内开源生态 | Qwen / 通义千问 | 适合开发者、开源模型、本地部署、企业接入 |
| 国内日常使用 | 豆包 | 适合普通中文用户,聊天、写作、图片、视频、学习都比较顺手 |
| 国内搜索和办公 | 文心 / 文小言 | 适合百度搜索、中文写作、PPT、图片视频和办公学习 |
| 国内搜索和微信生态 | 腾讯元宝 | 适合 AI 搜索、中文问答、内容总结、识图和日常工作 |
| 国内 Agent / 开发 | 智谱清言 / GLM | 适合 Agent、代码、工具调用、API 和开发者场景 |
新手不用每个都学。
先选 1 个主力工具,再配 1 个搜索工具就够了。
比如:
- 日常中文:豆包 / Kimi / DeepSeek
- 综合能力:ChatGPT
- 长文和代码:Claude / Kimi
- 查资料:Perplexity / Gemini / Kimi
- 做项目:ChatGPT / Codex / Claude / Cursor
第二类:搜索研究类 AI
搜索研究类 AI,不是单纯陪你聊天。
它更像一个会帮你查资料的人。
它会去找网页、文章、报告、新闻,再整理成答案。
| 工具 | 适合什么 | 注意点 |
|---|---|---|
| Perplexity | 快速查资料、看来源、了解一个新领域 | 适合先扫一遍,不要只看结论 |
| ChatGPT Deep Research | 做比较长的调研、竞品分析、资料报告 | 慢一点,但适合复杂问题 |
| Gemini Deep Research | 结合 Google 搜索、Gmail、Drive 等资料做研究 | 如果你用 Google 生态,会更顺 |
| NotebookLM | 围绕你上传的资料做问答、总结、思维导图 | 适合读自己的资料,不适合凭空查全网 |
| Kimi | 中文长文、网页、PDF、资料包整理 | 适合国内内容和中文资料 |
这类工具最适合用在:
- 学一个陌生领域
- 做竞品调研
- 整理一堆文章
- 看政策、报告、论文
- 做视频选题前的信息收集
不要只问:
帮我讲讲 AI Agent。
更好的问法是:
请帮我调研 AI Agent 现在主要分成哪几类。
要求:
1. 给出分类表。
2. 每类列 3 个代表工具。
3. 说明普通人能怎么用。
4. 标出哪些是事实,哪些是你的判断。
第三类:操作电脑和 Agent
Agent 这个词很容易被讲得很玄。
你可以先把它理解成:
能连续做几步事的 AI。
但 Agent 也分等级。
| 等级 | 它能做什么 | 代表形态 | 新手怎么理解 |
|---|---|---|---|
| L0 对话助手 | 只给建议,不自己操作 | 普通 ChatGPT、Kimi、豆包 | 它告诉你怎么做 |
| L1 网页助手 | 能在浏览器里点按钮、填表、查网页 | ChatGPT Agent、Operator、Comet、部分浏览器助手 | 它能帮你跑网页任务 |
| L2 电脑操作 | 能看屏幕、点鼠标、敲键盘、打开软件 | OpenAI Computer Use、Claude Computer Use、部分桌面 Agent | 它像一个远程操作员 |
| L3 项目 Agent | 能读代码、改文件、跑命令、修 bug、提交结果 | Codex、Claude Code、Cursor、GitHub Copilot、Trae、Cline、Aider | 它能参与做项目 |
| L4 工作流 Agent | 能把多个软件和 API 连起来,长期重复执行 | Dify、Coze、n8n、Zapier、Make | 它能把流程固定下来 |
这里最重要的不是工具名。
而是你要知道:
普通聊天 AI 负责“想清楚”。
电脑操作类 AI 负责“帮你点”。
项目 Agent 负责“帮你改项目”。
工作流 Agent 负责“让重复流程以后自动跑”。
新手不要一上来就追求全自动。
更稳的顺序是:
- 先用聊天 AI 把步骤拆清楚。
- 再用 Codex / Cursor 这类工具做一个小项目。
- 如果同一件事重复 3 次以上,再考虑工作流。
- 如果工作流稳定,再考虑 API 和自动化。
第四类:生图和设计类 AI
生图 AI 的核心不是“画画”。
它更像是把你的文字想法变成画面。
常见方向有这几类:
| 类型 | 常见工具 | 更适合什么 |
|---|---|---|
| 通用生图 | ChatGPT Images / GPT Image、Midjourney、即梦 | 海报、插画、封面、概念图、视觉参考 |
| 商业安全设计 | Adobe Firefly、Canva | 品牌图、营销图、设计稿、可编辑素材 |
| 中文创作和短视频素材 | 即梦、豆包、文心、腾讯元宝 | 中文提示词、头像、封面、国风、短视频素材 |
| 开源和高自由度 | Stable Diffusion、ComfyUI、LiblibAI、Civitai | 想控制模型、风格、人物一致性,需要一定学习成本 |
| 商品图和电商图 | 绘蛙、稿定、美图设计室、Canva | 商品主图、详情页、营销海报 |
如果你只是想做抖音封面、小红书图、课程海报:
先用 ChatGPT Images、即梦、Canva 就够了。
如果你想控制同一个人物、同一套风格、批量出图:
再去学 Stable Diffusion、ComfyUI、LiblibAI。
第五类:视频类 AI
视频 AI 比生图更难。
因为它不只是生成一张图,还要处理动作、镜头、人物一致性、物理运动和声音。
| 工具 | 更适合什么 | 使用门槛 |
|---|---|---|
| Runway | 电影感短片、广告感镜头、专业创作者 | 中等 |
| Google Veo | 高真实感视频、带声音的视频、创意短片 | 中等 |
| Luma Ray | 镜头控制、连续性、创意视频流程 | 中等 |
| Kling / 可灵 | 中文创作者、图生视频、人物和镜头控制 | 中等 |
| 即梦 | 中文提示词、短视频素材、图片和视频一体化 | 低 |
| 海螺 / MiniMax | 文生视频、图生视频、人物情绪和短视频创作 | 低到中等 |
| Pika | 快速做有趣短视频、特效片段 | 低 |
新手要注意:
视频 AI 现在更适合做“短片段”和“素材”。
不要一开始就想让它完整生成一条很长、逻辑严密的视频。
更现实的用法是:
- 先写脚本。
- 拆成 3 到 8 个镜头。
- 每个镜头生成 3 到 8 秒素材。
- 再用剪映、CapCut、PR 之类工具剪在一起。
如果你看到 Sora 教程,要注意它的独立产品和 API 状态已经发生过变化。
视频类工具更新很快,使用前最好先看官网能不能正常使用。
第六类:声音、配音和音乐类 AI
这类 AI 主要处理声音。
| 类型 | 常见工具 | 更适合什么 |
|---|---|---|
| 配音和克隆声音 | ElevenLabs、MiniMax Speech、讯飞、火山语音 | 短视频配音、课程旁白、多语言声音 |
| 音乐生成 | Suno、Udio、MiniMax Music | 生成歌曲、BGM、旋律、歌词 demo |
| 语音转文字 | Whisper、飞书妙记、腾讯会议、剪映、通义听悟 | 会议纪要、口播转文字、访谈整理 |
| 声音修复 | Adobe Podcast、剪映、CapCut | 降噪、增强人声、清理录音 |
普通人最实用的是:
- 把录音转文字
- 给视频配音
- 给课程做旁白
- 做简单 BGM
- 把访谈整理成文字稿
声音克隆要特别注意授权。
不要随便克隆别人的声音。
第七类:办公、学习和知识库 AI
这类工具不是为了炫技。
它们更适合把你已有的资料整理清楚。
| 工具 | 更适合什么 |
|---|---|
| NotebookLM | 围绕资料做问答、摘要、思维导图、学习笔记 |
| Notion AI | 笔记、项目、知识库、团队文档 |
| 飞书妙记 / 飞书智能伙伴 | 会议纪要、文档整理、团队协作 |
| 腾讯会议 AI / 通义听悟 | 会议录音、纪要、重点提取 |
| Gamma / Canva / 文心 / 扣子 | PPT、大纲、演示、轻量设计 |
| Excel Copilot / WPS AI / ChatExcel | 表格分析、公式解释、数据整理 |
如果你是学生、职场人、内容创作者,先从这类工具开始很划算。
因为它能直接减少你每天整理资料的时间。
第八类:编程和做网站的 AI
这类工具不是只给程序员用。
现在很多人做个人网站、小工具、自动化脚本,都会用到它。
| 类型 | 常见工具 | 更适合什么 |
|---|---|---|
| AI 代码编辑器 | Cursor、Trae、GitHub Copilot、Devin Desktop / Windsurf | 一边看代码一边改项目 |
| 命令行 / 项目 Agent | Codex、Claude Code、Gemini CLI、Aider、Cline、OpenCode | 改文件、跑测试、修 bug、做功能 |
| 一句话做应用 | Replit Agent、Bolt、v0、秒哒、码上飞 | 快速做网页、小应用、原型 |
| 企业级代码助手 | GitHub Copilot、Amazon Q、Cursor Enterprise | 团队开发、代码审查、安全规范 |
新手不用先学编程语法。
你可以先学会三件事:
- 把你想做的东西说清楚。
- 会看 AI 改了哪些文件。
- 会让 AI 运行、检查、修复错误。
这就是为什么我会说 Codex 好用。
它不是只回答你代码怎么写。
它能直接进项目里改文件、跑命令、检查结果。
第九类:工作流和自动化平台
当你发现一件事重复出现,就可以考虑工作流。
工作流不是让 AI “自由发挥”。
而是把步骤固定下来。
比如:
每天早上:
1. 抓取 AI 新闻
2. 让 AI 筛选 5 条
3. 改写成普通人能看懂的话
4. 保存到网站
5. 同步到社群
常见工具可以这样看:
| 工具 | 更适合什么 | 门槛 |
|---|---|---|
| Coze / 扣子 | 搭建智能体、职场助手、内容流程、简单应用 | 低到中等 |
| Dify | 做 AI 应用、RAG 知识库、Agent、企业内工具 | 中等 |
| n8n | 连接各种软件、自己部署、复杂自动化 | 中等到高 |
| Zapier / Make | 连接海外常用软件,自动发邮件、同步表格、触发任务 | 低到中等 |
| 飞书多维表格 / 自动化 | 团队协作、表格流程、内部管理 | 低 |
判断要不要做工作流,可以用一个简单标准:
如果这件事你只做一次,不要自动化。
如果这件事每周都做,而且步骤稳定,就值得自动化。
第十类:底层模型、API 和本地部署
这一类稍微更技术一点。
但你不用害怕。
它其实就是把 AI 接到自己的产品里。
| 方式 | 适合谁 | 举例 |
|---|---|---|
| 网页 / App 直接用 | 普通用户 | ChatGPT、Kimi、豆包、即梦、Canva |
| 插件 / 编辑器里用 | 轻度进阶 | Cursor、Trae、Copilot、浏览器插件 |
| API 接入 | 做网站、工具、小程序的人 | OpenAI API、DeepSeek API、Qwen API、火山方舟、硅基流动 |
| 本地运行 | 想保护隐私、研究模型的人 | Ollama、LM Studio、Qwen、Llama、GLM |
| 自建工作流 | 想做长期自动化的人 | Dify、n8n、Coze、FastGPT、Flowise |
你可以这样理解:
直接打开用,是“用别人的 AI 工具”。
API 接入,是“把 AI 放进你的工具里”。
本地部署,是“把模型放到自己的电脑或服务器里跑”。
自建工作流,是“把多个 AI 和软件连成一条流程”。
新手不用一开始就学 API 和本地部署。
但你至少要知道它们存在。
这样你以后看到别人说“接 API”“部署模型”“搭 RAG”“做 Agent”,就知道大概是在说哪一层。
最简单的选择方法
如果你现在不知道该用什么,就按下面选。
| 你想做什么 | 先试这些 |
|---|---|
| 日常问答、写作、整理 | ChatGPT / Kimi / 豆包 / DeepSeek |
| 查资料、看来源 | Perplexity / Gemini Deep Research / Kimi |
| 读长文、整理 PDF | Kimi / Claude / NotebookLM |
| 做封面、海报、图片 | ChatGPT Images / 即梦 / Canva / Midjourney |
| 做短视频素材 | 即梦 / 可灵 / Runway / Luma / 海螺 |
| 配音、录音转文字 | ElevenLabs / 飞书妙记 / 剪映 / Whisper |
| 做 PPT 和文档 | Canva / Gamma / 文心 / Notion AI |
| 做网站、小工具 | Codex / Cursor / Claude Code / Trae / Bolt |
| 做自动化流程 | Coze / Dify / n8n / Zapier |
| 想接进自己的产品 | API / Dify / Coze / n8n |
这一节不需要一次背完。
你先把它当成地图。
以后看到一个新工具,先问:
它属于哪一类?
它解决的是读、写、画、剪、说、查、做项目,还是跑流程?
它是打开就能用,还是要接 API?
它只是回答我,还是能替我连续做事?
能回答这几个问题,你就不容易被 AI 工具名字带着跑。
6. 怎么问,AI 才更容易给你有用答案目录
很多人觉得 AI 不好用。
不是因为 AI 完全不行。
而是问题太空。
比如:
帮我写一个方案。
这个问题太空了。
AI 不知道方案给谁看、目标是什么、你有什么资源、你想要多详细。
更好的问法是:
我是一个刚开始做 AI 内容的个人创作者。
我的目标用户是想学 AI 但不知道从哪里开始的普通人。
我想做一份免费资料包,引导他们从官网领取。
请帮我设计一个简单方案。
要求:
1. 不要像卖课。
2. 重点是真诚、实用、容易开始。
3. 输出成 5 个步骤。
4. 每一步都要有具体动作。
一个好问题,可以按这个顺序写:
我是谁:
我要做什么:
现在的情况:
已有材料:
目标用户或对象:
限制条件:
希望你怎么帮我:
输出格式:
不要做什么:
如果你自己也没想清楚,可以先让 AI 问你。
我想做这件事:[事情]
但我现在还没想清楚。
请你先问我 5 个关键问题。
等我回答后,再帮我整理方案。
这个方法很重要。
因为很多时候,你不是缺答案。
你是问题还没有被说清楚。
7. 生活里可以直接用的场景目录
AI 入门最好的方式,不是先看很多教程。
而是今天就用它解决一个小问题。
整理微信消息
当别人发来一大段话,你看完还是不知道该做什么时,可以直接复制:
请帮我整理下面这段微信消息。
输出:
1. 对方想让我做什么
2. 我需要回复什么
3. 有哪些时间点
4. 我下一步应该做什么
5. 如果要回复,请帮我写一版自然回复
把文章变成重点
请帮我读下面这篇文章。
输出:
1. 一句话总结
2. 3 个最重要的观点
3. 哪些内容对普通人有用
4. 哪些内容可能只是作者观点
5. 我是否值得完整阅读,为什么
把情绪很乱的话整理清楚
有时候你想解释、拒绝、表达不满,但怕说重了。
可以这样问:
下面是我想表达的话,可能有点乱。
请帮我改成更冷静、更清楚的表达。
要求:
1. 不攻击对方
2. 不委屈自己
3. 说清楚我的需求
4. 语气自然一点
做购物对比
我想买:[商品]
预算是:[预算]
主要用途是:[用途]
请帮我做一个购买前对比。
告诉我:
1. 最应该关注哪些参数
2. 哪些参数不用太在意
3. 适合我的选择标准
4. 买之前要避开的坑
做旅行计划
我要去:[地点]
时间:[几天]
预算:[预算]
偏好:[轻松 / 拍照 / 美食 / 亲子 / 省钱]
请帮我安排一个行程。
要求:
1. 不要太赶
2. 每天最多 3 个主要地点
3. 标出上午、下午、晚上的安排
4. 提醒我哪些事项需要提前预约
8. 工作里可以直接用的场景目录
AI 在工作里最有用的地方,往往不是替你“做完工作”。
而是帮你把信息整理清楚,把初稿先做出来,把重复事情变快。
写汇报前整理思路
我要写一份工作汇报。
这是我最近做的事:[粘贴内容]
请帮我整理成:
1. 完成了什么
2. 有什么结果
3. 遇到什么问题
4. 下一步计划
5. 哪些内容适合放到汇报里
把会议记录变成行动清单
下面是会议记录。
请帮我整理成行动清单。
表格列名:
任务 / 负责人 / 截止时间 / 需要确认的问题 / 下一步
写邮件
请帮我写一封邮件。
收件人:[对象]
目的:[目的]
背景:[背景]
希望对方做的事:[动作]
要求:
1. 礼貌
2. 直接
3. 不要太长
4. 结尾有明确下一步
模拟别人会怎么问
如果你要做汇报、谈合作、发产品、发视频,可以先让 AI 模拟对方问题。
我准备做这件事:[写清楚]
目标对象是:[老板 / 客户 / 用户 / 粉丝]
请模拟他们可能会问我的 10 个问题。
按重要程度排序。
每个问题后面写一个简短回答思路。
这类用法很实用。
它能帮你提前发现自己没有想清楚的地方。
9. 当你想再往前一步:从对话到流程目录
如果你只是偶尔问 AI,打开聊天框就够了。
但如果你发现一件事经常重复,就可以开始考虑流程。
比如你每天都要看 AI 新闻。
一开始你可以手动问:
请把这条 AI 新闻解释给普通人听。
输出:
1. 它发生了什么
2. 为什么重要
3. 对普通人的生活或工作有什么影响
4. 我今天可以用它做一个什么小练习
如果你每天都这么做,就可以把它变成固定模板。
再进一步,你可以把它变成工作流:
- 收集信息
- 让 AI 初步总结
- 人工筛选重要内容
- 让 AI 改成人话
- 生成官网版本
- 生成社群简短版
- 你确认后发布
这时,AI 就不只是聊天工具了。
它开始进入你的工作方式。
很多人会卡在这里:
他们一直在问 AI 问题,但没有把好用的方法固定下来。
真正有价值的是:
把一次好用的问法,变成下次还能用的模板。
把一个经常重复的动作,变成固定流程。
把一个流程里最耗时间的部分,交给 AI 辅助。
10. API 是什么,什么时候需要它目录
这一部分稍微进阶一点。
但你不用会写代码,也可以先理解它的作用。
如果你只是自己用 AI,打开网页对话就可以。
但如果你想让 AI 出现在你自己的产品、网站、表格或自动化流程里,就可能需要 API。
比如:
- 用户在你的网站提交一段内容,AI 自动帮他总结。
- 用户上传一段聊天记录,AI 自动整理成待办。
- 你把评论放进表格,AI 自动判断哪些人想进群。
- 每天早上系统自动收集 AI 信息,再让 AI 生成初稿。
- 客服系统收到问题后,先让 AI 根据知识库生成回答草稿。
这些都不是你手动打开 ChatGPT 复制粘贴。
而是你的系统在背后调用 AI。
最简单的结构是:
用户输入
↓
你的网站或工具
↓
你的服务器
↓
AI API
↓
你的服务器
↓
把结果展示给用户
这里最重要的一点是:
API Key 不要放在前端网页里。
因为前端代码别人能看到。
Key 应该放在服务器环境里。
如果你以后想做 AI 小工具,最小版本可以先这样想:
- 用户输入一段文字。
- 后端把文字发给 AI。
- AI 按你设定的格式返回。
- 页面展示结果。
比如让 AI 返回结构化结果:
请分析用户提交的内容,并只输出 JSON:
{
"summary": "一句话总结",
"user_need": "用户真正需求",
"suggested_reply": "建议回复",
"risk_level": "low / medium / high",
"next_step": "下一步动作"
}
为什么要 JSON?
因为程序更容易读取。
如果 AI 随便写一大段文章,你的网站很难稳定处理。
如果它按固定字段返回,你就可以把 summary 放在摘要区,把 next_step 放在下一步建议区。
这就是从“聊天”走向“产品功能”的关键。
你暂时不用急着写代码。
但你要先理解:
对话式 AI 是给人看的。
API 是给软件调用的。
结构化输出,是让软件更容易继续处理的。
11. 怎么把 AI 用到自己的事里目录
真正会用 AI,不是收藏很多提示词。
而是能把它放进自己的真实事情里。
你可以按这个顺序来。
第一步,选一件今天真的要做的小事。
不要选太大的目标。
不要一上来问:
我怎么用 AI 赚钱?
先选小事:
- 帮我整理今天的待办。
- 帮我改一段自我介绍。
- 帮我总结一篇文章。
- 帮我写一封邮件。
- 帮我拆一个视频脚本。
第二步,把原始材料给它。
AI 不是读心术。
你给得越清楚,它越好用。
材料可以是聊天记录、文章、表格、草稿、想法、用户评论。
第三步,先让它整理,再让它建议。
很多人一上来就让 AI 给建议。
更好的顺序是:
- 先整理事实。
- 再分析问题。
- 最后给建议。
可以这样问:
请先不要给建议。
先帮我整理下面内容里的事实、问题和待确认信息。
整理完以后,再给我 3 个下一步建议。
第四步,把好用的问法存下来。
你每次用完 AI,可以问自己:
- 这次哪个问法最好用?
- 哪个回答能直接用?
- 下次我还会遇到类似问题吗?
如果会,就把这次的问法存下来。
这就是你的个人提示词库。
不用很多。
先存 10 条真正用过的,就比收藏 1000 条没用过的强。
12. 新手最容易踩的坑目录
第一个坑,是只收藏,不使用。
收藏再多提示词,也不等于会用。
你真正需要的是今天用它解决一个小问题。
第二个坑,是一上来问太大的问题。
问题越大,回答越空。
不要问:
我怎么做副业?
可以改成:
我现在有 1 小时时间。
我想测试一个 AI 资料包有没有人需要。
请帮我设计今天能完成的 3 个动作。
第三个坑,是不给背景。
AI 不知道你的情况。
你要告诉它:
- 你是谁
- 你想做什么
- 给谁看
- 现在卡在哪里
- 有什么限制
第四个坑,是把 AI 回答当最终答案。
AI 给的是初稿。
你要继续改。
你可以让它:
- 再短一点
- 更具体一点
- 更像人话
- 去掉废话
- 按表格输出
- 补充风险
第五个坑,是过早追求全自动。
很多人刚开始就想:
能不能让 AI 自动赚钱?
能不能让 AI 自动做项目?
能不能完全不用人?
更现实的顺序是:
- 先让 AI 帮你省时间。
- 再让 AI 帮你提高质量。
- 再把重复流程固定下来。
- 最后再考虑自动化。
13. 今天就可以做的第一步目录
打开你常用的 AI 工具。
复制下面这段话。
我是 AI 新手。
我想先把 AI 用到真实生活和工作里。
请你先问我 5 个问题,了解我的工作、学习、兴趣和最近最常遇到的重复任务。
等我回答后,请帮我找出 3 件今天就能用 AI 改善的小事。
每件事都要给我一段可以直接复制使用的提问方式。
你不需要等准备好了再开始。
先用 AI 解决一个真实小问题。
这才算真正入门。
14. 这份资料怎么继续用目录
你可以这样用:
- 遇到一个问题,先来这里找类似场景。
- 复制一个基础问法。
- 把里面的内容换成自己的情况。
- 用完以后,把好用的问法保存下来。
- 如果一件事重复出现,再考虑模板、流程、API 或自动化。
AI 入门不是背概念。
也不是收藏很多工具。
是从一件真实小事开始:
让它帮你读清楚、写清楚、想清楚、做清楚。
再慢慢把这些能力放进自己的流程里。