作者： flyfarther_xcx2

32岁宝妈靠AI写短故事3个月变现2.1w！带娃赚钱两不误！我把操作全写出来啦！！！

作为一个被边缘化的二胎宝妈，为了赚点家用试过很多兼职副业，搞到最后90%都没成，微商囤货压了一堆货卖不动、刷单被骗2800、手工DIY作品卖不出去…折腾来折腾去，钱没赚到，材料设备搭进去一大堆…

后来才明白，对于我们大多普通人来说，只有实打实的技术才能稳定赚钱！比如我现在在做的「AI写短故事」，借助AI技术，3个月稿费收益2.1w+！带娃搞钱两不误！日子也渐渐好起来了～

「AI写短故事」听着高级，其实简单到离谱！只需要给AI输入主题就能生成故事框架，会电脑就能上手，两小时就能写出平台抢着要的万字稿件！更重要的是！现在市场需求大到吓人！短剧、漫剧、有声书都贼缺短故事，连我这种0基础小白都能薅到稿费！现在进场跟捡钱似的！！！

最爽的是不用囤货、发货、投资，时间自己说了算，孩子一哭随时停，比上班爽多了！

是我们在家搞钱的好机会！！！

不知道咋整没关系，知乎知学堂就有「AI写短故事全套教程」，AI网文大佬手把手教你AI小说搞钱，最简单的语言，讲最”干”的操作！从「AI写故事实操」到「投稿变现」给你包圆儿了！咱直接对着操作复制黏贴就ok！！！

领取入口放下面了，感兴趣的友友戳卡自取就ok！

大厂出品，没有套路！大家可放心使用！我知道现在每个人的时间都很宝贵，我放这个教程卡片就是为了让大家快速了解AI写故事全套操作、快速上手！！！

教程说的很实在，从AI创作黄金开篇到投稿变现全覆盖！

咱直接按图索骥就ok！对宝妈小白超级友好～

听完记得领「电子版资料」！

尤其是圈出来的那个「如何拆解他人的故事变成自己的」！

部分资料

举个例子：

就这导语，编编还夸我网感好！

其实全是AI写的嘻嘻 ₌･֊･₌

不要以为我会玩AI就觉得我很牛啥的，其实我刚开始写的时候也是两眼一抹黑，只会对着AI只会说写个故事，出来的东西干巴巴的自己都看不下去。

按教程系统地学了一把子才知道：得说清楚主角是谁、在哪种场景、想要啥情绪的故事等等，从AI工具大模型、故事题材、到给AI喂的爆款大纲，都是有顺序和讲究的～

具体为啥我也不懂，但是管他呢！咱直接无脑复制就完了！

我就靠这招，让我用AI写的短故事从「无人问津」到现在「10投9中」！

稿费也水涨船高，再也不用为工作和孩子焦虑的睡不着觉了。

「详细版视频教程」放下面了，需要的uu戳卡自取：

说句实话，有这成果不是我个人能力有多强，而是教程靠谱+市场需求大！！！

不仅有视频教程可以无脑复制，还有各大平台签约模版和电子版资料！尤其是各大平台投稿模版！建议人手一份！

毕竟会用AI写故事是基础，懂得投稿变现才是重点！！！

AI发展到今天，用AI写短故事早已不是虚像，而是一个需求巨大、前景广阔、能实实在在创造价值的黄金赛道！！！

尤其是「AI短故事」！

现在各大内容平台都在疯狂抢稿，像番茄小说的超短篇保底稿费已达80-500元/千字！

中短篇更是高达100-700元/千字，爆款作品单月分账甚至能突破200w！！！

说白了咱普通人要搞钱，最重要的就是「顺势」！！！

当年直播带货刚火时，拿手机瞎聊都能卖货赚钱；后来短剧风口，那群拍短剧的，单集分成就比我工资高。现在轮到AI短故事了——200w的盘子，平台疯狂扶持，简直老天爷赏饭吃！

以前写一个短故事得多久？门槛有多高？

现在我这种0基础小白都能用AI写故事赚钱，这就是AI给的势！！！

就像当年抖音给素人推流一样，等大家都入场了就卷起来了。

风口这玩意儿，一辈子遇不上几次。

趁现在风口正盛，有靠谱教程，咱干就完了！别等大家卷起来了再后悔！！！

最后，附下「AI写故事」全套教程，想快速搞钱的友友自取：

文章来源于互联网:32岁宝妈靠AI写短故事3个月变现2.1w！带娃赚钱两不误！我把操作全写出来啦！！！

2026年1月19日
2026 搞钱新思路！AI 视频变现，普通人也能上手的保姆级经验分享

2025 年末，互联网被一群会说话的 AI 萌宠席卷：YouTube 上，马尔济斯犬 “大麦” 用 10 个月 145 条视频圈粉 8.5 万，单月广告收入达 11 万元；比熊犬 “云朵” 仅靠 22 条内容，两个月斩获超 423 万播放量…..普通人靠 ChatGPT 写脚本、Midjourney 生图、剪映剪辑，十几分钟就能出片，无需专业技能，AI 把创作门槛拉到最低，也打开了流量变现捷径。

转眼马上进入 2026 年，AI 技术的普及让这场流量红利愈发汹涌。当做号依然是最大众化的变现路径，当 AI 从工具升级为创作合伙人，普通人如何抓住这波趋势，将 AI 生成的视频转化为稳定收入？今天 AdsPower 这篇文章就来告诉你！

普通人如何 AI 视频变现？

第一步：找准定位

2026 年的 AI 视频赛道，流量稀释已成必然，泛娱乐内容的变现效率大幅下滑，唯有垂直领域 + 实用价值的组合，才能实现高效转化。以下三个高潜力赛道，兼顾门槛低、溢价高、可持续性强的特点，特别适合普通人切入。

（1）AI 知识漫剧

将晦涩难懂的专业知识，通过 AI 转化为视觉冲击力强、节奏紧凑的漫剧形式，解决用户学习难的痛点，又符合短视频的观看习惯。

AI 知识漫剧的高价值选题可覆盖金融、历史、心理学等垂直领域，实操中需坚持选题小而深，避开大而全的模糊定位，同时保持风格统一，强化账号辨识度。

（2）AI 虚拟博主（UGC）

虚拟人无需真人出镜、没有档期限制，且人设稳定、风格可控，尤其受美妆、穿搭、生活方式类品牌青睐。明确三维人设：性格 + 视觉标识 + 内容切口；可以给给虚拟人加记忆点标签打造反差感，比如 “带重庆方言的美妆博主”。

（3）全球化翻译号

利用 AI 的实时翻译、嘴型对位技术，将国内已经验证的爆款内容，快速适配海外市场，实现一份内容，多平台变现。

图源网络，侵删

第二步：掌握提示词驱动 workflow

2026 年的 AI 视频生产，已彻底告别复杂建模和漫长渲染，核心是 “用精准提示词指挥工具链”，从脚本到成片，全程 AI 辅助，普通人也能实现批量高质量产出。

（1）脚本生成

脚本生成的核心工具可选择逻辑更严谨、支持多风格适配的 DeepSeek 或 ChatGPT，关键在于跳出笼统描述的误区，用 “场景 + 风格 + 语气 + 细节” 构建反直觉指令，让 AI 精准捕捉创作方向。也可以让 AI 帮忙拆解爆款视频进行复制同类型脚本，让脚本更贴合爆款逻辑。

（2）视觉生成

视觉生成的核心是兼顾内容质感与风格统一性，这也是提升账号辨识度的关键。生图环节的核心技巧是运用 “主体 + 风格 + 细节 + 画质 + 种子词（–seed XXXX）” 的精准提示词公式，且同一账号需始终沿用相同的 “种子词 + 核心风格描述”，避免人物五官、场景风格出现突兀变化。视频生成则要聚焦提示词的精准度，需明确画面动作、背景、光影等要求，同时将分辨率设为 1080P、帧率 30fps 以适配主流平台，生成后预览如果发现动作不自然，就补提示词进行优化，不用逐帧改。

生图核心工具：Midjourney 、Nano Banana Pro 、DALL-E 3 等；

视频生成工具：Kling 、Luma Dream Machine等。

（3）音频与克隆

音频是 AI 视频打造差异化、强化记忆点的核心，关键技巧在于兼顾适配性与独特性。可以根据内容风格选择 “自然口语”“搞笑幽默”“专业解说” 等预设语气生成配音，建议将语速调整为 1.2 倍速，更贴合短视频快节奏传播需求。也可以通过录制方言或特色语气的样本音频，克隆专属配音，让账号在同类 AI 视频中快速脱颖而出，形成独特标签。

AI 音频工具：ElevenLabs、Whisper X（OpenAI）、讯飞听见 AI 配音、Play.ht、Massive Voice Clone（Meta）、Deepgram、Descript等

（4）一键合成

一键合成的核心是借助 AI 工具构建 “素材导入 – 智能适配 – 自动化处理 – 细节微调” 的轻量化流程，无需专业剪辑技能即可实现高效批量出片。

一键合成 AI 工具：剪映、AuroCut 、FastMix AI 、VidMind 、Magikut AI 等

第三步：变现

AI 视频的变现核心是流量匹配场景，2026 年的变现路径更多元、更直接，无需漫长积累，新手也能快速起盘，以下是梯度变现方案。

（1）平台流量奖励

核心逻辑是靠平台广告分成赚取基础收入，同时积累粉丝，为后续高价值变现铺路。其中YouTube AdSense 是不可错过的高收益赛道，利用汇率差赚取的美金收益，比国内平台分成高出 20%-30%，但这条赛道的门槛恰恰在于海外账号的运营。

新账号注册要面对设备指纹、网络环境、行为模式等多重风控检测，稍不注意就会被封禁，前期投入的 AI 视频内容和运营时间全部白费；特别是如果想要放大收益，还需要运营多个账号布局不同垂类内容是关键，但同一设备登录多个账号极易触发关联风控，这成了很多创作者的变现卡点。

这个时候 AdsPower 就能帮大家解决这些难题，它能为每个 YouTube 账号创建独立的浏览器环境，再搭建海外IP ，有效防止 WebRTC 泄露真实 IP，从根源上规避多账号关联封禁的风险，让创作者可以放心布局多个垂类账号，批量发布 AI 知识漫剧、虚拟博主等内容。

不仅如此，AdsPower 还支持 RPA 自动化、窗口同步等功能，能帮助创作者高效养号，逐步提升账号权重，解决新账号 0 观看、粉丝积累慢的问题。

对于小团队来说，成员管理和分组权限功能更是刚需，不同运营人员可以在不同设备上一键登录对应账号，无需频繁切换和输入密码，大幅提升了多账号运营效率。

借助 AdsPower 的子成员功能，还能模拟多坐席使用各类海外营销工具，大大降低按坐席计费的工具成本，特别适合初创团队和个人创作者控制变现投入。

除了 YouTube，INS 、抖音的流量分成也适合高频产出萌宠、资讯、解压类内容的账号，搭建 AI 变现矩阵账号，扩大收益渠道。

（2）私域转化和带货

核心思路很简单，用 AI 视频引流，卖高毛利的产品和课程，一次创作就能多次变现。做私域课程的话，直接把 AI 视频的创作流程打包成工具包和教程，用低价引流、高价进阶的路子，引导用户私信领资料进私域成交。

带货就按视频类型搭商品，萌宠视频挂宠物用品，虚拟博主视频挂服饰配饰，关键是把商品自然融进内容里，别搞硬广。

（3）定制服务

给本地商家、中小企业做 AI 视频定制，需求旺、客单价高还能反复接单。基础业务瞄准餐饮、奶茶店等，有一定创作能力的还可以接企业 AI 内容代运营，一个人就能服务 3-5 家客户。要是涉及多平台多账号分发，就用 AdsPower 去高效管理客户账号矩阵，批量发定制视频，直接提升服务的效率和专业度。

写在最后

2026 年的 AI 视频变现风口，从来不是专业团队的专属。找准垂直赛道，用提示词玩转 AI 工具，再靠平台分成、私域带货、B 端定制等变现渠道，普通人也能分得一杯羹。

而 AdsPower 这样的工具，更是帮你打通海外多账号运营的关键。避开风控封禁的坑，高效养号涨粉，还能降低团队协作和工具使用的成本，让变现之路走得更稳更快。

与其站在原地观望，不如现在就动手选一个赛道，打磨出第一条 AI 视频。红利期的每一步行动，都是在为自己的稳定收入铺路。

文章来源于互联网:2026 搞钱新思路！AI 视频变现，普通人也能上手的保姆级经验分享

2026年1月19日
建议收藏！2025年最好用的17个免费AI工具，包括DeepSeek、腾讯元宝、豆包、ima……

AI一天，人间十年。这句话虽然有点夸张，但是，身处在AI这个领域，时时刻刻见证着AI的更新迭代速度之快，确实是让人感觉到吃惊。

目前我正在尝试做一个小小的AI博主，主要是分享一些普通人也能拿来就用的AI教程。

因为我也是从小白一路走过来，踩过很多坑，也更清楚哪些工具更适合小白入手。

今天夏至要为大家介绍一些2025年值得去用的AI工具。关键是免费！

以下这些方便大家在日常的学习、工作、生活、创作和育儿中，能够利用这些AI工具为自己提速增效，解放时间。

话不多说，马上开始！

1、豆包

官方网址：

使用方式：

手机APP、电脑网页端、电脑客户端。

功能亮点：

作为字节跳动旗下用户量突破1亿的国民级AI工具，豆包深度融合抖音生态实现短视频脚本智能生成与带货文案创作，其特色在于通过”场景化智能体”覆盖育儿指导、心理按摩等20+生活场景，配合语音对答功能让用户感受拟人化交互。

2024年新增音乐生成功能可基于歌词自动创作BGM，2025年上线的视频生成内测支持输入文案生成动态分镜，最新推出的图片理解功能可解析表情包深层含义并生成幽默回复。

教育领域表现尤为突出，英语学习助手可模拟真实对话场景纠正发音，育儿模块能根据儿童年龄推荐适龄故事并生成睡前语音。

2、夸克

使用方式：

电脑网页端、电脑客户端、APP。

功能亮点：

全面开启深度思考，搜经验、做攻略、解难题，随时搜一搜。输入指令，复杂问题轻松解决，文字、图文、视频、表格，都能快速理解。

夸克的桌面AI助手方便随时提问找答案，划词工具栏可以随时解读、翻译、润色文本。快捷键截屏，还支持截屏搜题、搜索等。

3、飞书

使用方式：

电脑网页端、电脑客户端、APP

功能亮点：

飞书是字节跳动推出的企业级协同办公平台，以“All in One”为目标，整合即时通讯、文档协作、项目管理、数据分析等功能，提供一站式解决方案。

其核心功能包括支持文字、语音、视频会议，消息传递实时性强，适用于跨地域团队协作。在飞书接入deepseek之后，也可实现通过设置多维表格，可单次批量处理上百条内容，完成短视频脚本、文案的批量制作。

4、扣子

使用方式：

电脑网页端

功能亮点：

AI智能体种类非常丰富，支持一句话生成一个智能体，工作流功能非常强大，目前扣子现已推出满血版 Deepseek 全家桶，支持免费体验 R1、V3 模型。

除此之外，扣子支持 DeepSeek 思维链（Chain-of-Thought，CoT）和 Function Calling 能力，为制作智能体添加私有知识和多种技能，拓展智能体的能力边界，一键满足多种场景需求。

5、讯飞星火

使用方式：

电脑网页端、APP、小程序

特色功能：

依托科大讯飞27年语音技术积累，星火V4.0版本在医疗法律领域实现92%高精度问答，独家AI口语陪练系统可实时评估发音准确度并生成纠错报告。

2025年更新的”启发式对话”功能支持构建虚拟人格，用户可自定义AI助手的知识背景与沟通风格，特别适合教师创建学科专属辅导机器人。

多语言实时互译覆盖60+语种，会议记录功能可自动生成带时间戳的摘要，并标记关键决策点。

6、通义千问

使用方式：电脑网页端、APP

功能亮点：

具有语音实时记录、一键AI总结、上传音视频分析功能，非常适合上班工作的相关场景使用。

7、Kimi

使用方式：手机APP、电脑网页端、电脑客户端。

功能亮点：

Kimi尤其擅长长文本处理和专业领域的深度分析。它能够一次性处理高达200万字的文本信息，这在AI领域中处于领先地位。

同时KIMI也能用来一键生成PPT，功能免费使用特别友好。模板也挺多。建议有这个需求的小伙伴可以去试试。

8、秘塔AI搜索

使用方式：手机APP、电脑网页端、小程序

功能亮点：

采用无广告纯净搜索模式，直接抓取政府官网、知网等权威信源，搜索结果自动整理为思维导图与对比表格。

2025年集成DeepSeek-R1满血版模型后，输入复杂问题如”长三角新能源政策影响”可自动生成带数据可视化的分析报告。

9、腾讯元宝

使用方式：电脑客户端、电脑网页端、手机APP、小程序。

功能亮点：

深度融合微信生态的内容创作神器，可优先抓取10万+公众号爆文生成自带传播基因的推文。

2025年接入DeepSeek-R1模型后，在逻辑推理任务中正确率提升40%，输入模糊需求如”制定三个月产品计划”可自动拆解为甘特图。隐私保护通过国家等保三级认证，聊天记录本地加密存储，适合处理敏感商务对话。

10、文心一言

使用方式：网页端/APP

功能亮点：

文心一言是百度推出的一款AI工具，特别擅长中文语境下的语言处理和内容创作。它依托百度强大的搜索引擎和海量数据，具备出色的知识增强和检索能力。

文心一言在文学创作、商业文案创作等方面表现出色，能够提供高质量的文本生成和灵感支持。此外，它还支持多模态输入，能够处理文本、图片、音频等多种形式的内容。

11、DeepSeek

使用方式：电脑网页端、手机APP。

功能亮点：

在GRE数学题测试中达到89%正确率的逻辑专家，可展示完整推理过程帮助用户理解解题思路。

2025年开源的R1模型价格仅为同行1/50，企业API调用成本降低90%。也由于它的开源，国内AI工具纷纷跟进，也嵌入了DeepSeek的R1深度思考模式。

12、即梦AI

使用方式：电脑网页端、APP

功能亮点：

2025年新增”动作模仿”功能可让静态图片模仿参考视频的肢体动作。今年也推出了数字人功能，对嘴型非常好用。

同时也专注于AI绘画领域，提供了丰富的艺术风格选择和简单直观的操作体验。它对中文提示词的理解相当准确，适合各类设计素材的制作。

13、智谱清言

使用方式：

电脑网页版、电脑客户端、APP、小程序。

特色功能：

智谱清言是一款由智谱AI公司开发的AI工具，专注于中文环境下的写作和对话，它对中文表达的理解相当准确，响应速度快，特别适合国内用户的使用习惯。虽然在某些专业领域的知识深度上还有提升空间，但在日常写作和内容创作方面已经相当实用。

与其他AI工具相比，能够更好地适应中文用户的语言习惯。此外，智谱清言的智能体功能也非常丰富，用户可以根据自己的需求创建个性化的智能体，这使得它在特定应用场景中更具灵活性。

使用方式：

橙篇支持电脑浏览器、客户端、APP使用。

特色功能：

橙篇是一款由百度开发的AI工具，特别擅长长文本生成和处理。橙篇在长文本生成方面具有明显优势，能够生成长达10万字的专业文档，并提供多格式跨模态内容的深度编辑功能。

此外，橙篇还具备强大的文献知识检索能力，依托百度文库和百度学术等资源，能够快速获取实时专业资料。

15.可灵AI

使用方式：

电脑网页端、APP

功能亮点：

在视频创意效果方面独树一帜，特别是在人像处理和特效制作方面有出色表现。它提供了多样的创意玩法，虽然部分功能的稳定性和学习曲线还需改善，但在创意视频制作领域具有独特优势。

16、Get笔记

使用方式：

电脑网页端、APP、小程序

Get笔记是一款由得到APP的技术团队开发的AI笔记软件，特别擅长语音识别和文本润色。它能够实时将语音转换成文字，并通过智能算法去除口语中的冗余词和纠正发音不标准的英文，使笔记更加流畅和专业。

与其他AI工具相比，Get语音的优势在于其便捷性和高效的文本处理能力。作为微信小程序，它无需下载即可使用，非常适合习惯使用微信的用户。Get语音还支持跨平台同步与导入，方便用户在不同设备间管理和使用笔记。

17、ima知识库

使用方式：电脑客户端、小程序、手机APP（仅安卓手机）

功能亮点：

个人知识库管理的好帮手。同时也接入 DeepSeek R1 深度思考模型，整个界面非常简洁，方便又好用。

文章来源于互联网:建议收藏！2025年最好用的17个免费AI工具，包括DeepSeek、腾讯元宝、豆包、ima……

2026年1月8日
写给小白的AI入门科普

█ 到底什么是AI？
AI，是artificial intelligence的缩写。
Artificial，很多同学认字认半边，会以为是艺术（art）的什么形容词。其实不然，artificial的意思就是“人工的、人造的”，和natural（天然的）是反义词。
Intelligence，这个不容易认错，是“智能”的意思。英特尔（Intel）公司的名字，就是基于这个词的前五个字母。
结合起来，AI，就是“人工的、人造的智能”，用人为的手段，创造智能。

关于AI的定义，行业里有很多种说法。比较学术化的一种，是这么说的：
AI，是研究、开发用于模拟、延伸和扩展人的智能行为的理论、方法、技术及应用系统的一门综合性科学。
这个定义很拗口，看得都头大。
其实，对于AI，我们可以拆解来看。

首先，AI的本质属性，是一门科学，是一个技术领域。
它涉及到了计算机科学、数学、统计学、哲学、心理学等多种学科的知识，但总体上，归类于计算机学科之下。
其次，AI的研究目的，是让一个“系统”具备智能。
这个“系统”，可以是一套软件程序，也可以是一台计算机，甚至是一个机器人。
第三，什么样的水平，才叫做真正的智能。
这是问题的关键。目前看来，能够像人一样感知、理解、思考、判断、决策，就是实现了人工智能。
配合机器人、机械臂等物理载体，AI也可以实现行动能力。
综合以上三点，理解AI的定义就比较容易了。

█ AI和普通计算机有什么区别？
AI，目前仍然是基于计算机的基本玩法，采用的是半导体芯片技术（所以经常会被称为“硅基”），以及计算机的一些体系和平台。
那么，它和传统的计算机程序，有什么区别呢？

传统的计算机程序，就是一个规则的集合。程序员通过代码告知计算机规则，计算机根据规则，对输入数据进行判断和处理。
例如经典的“if……else……（如果……否则……）”语句——“如果大于65岁，就退休。否则，继续上班”。
然后，计算机程序会根据这个规则，对所有输入年龄数据进行判断和处理。
但是，在现实生活中，很多要素（例如图像和声音）是极为复杂和多样的，我们很难给出固定的规则，让计算机实现高准确率的判断和处理。
例如，判断一只狗是不是狗。
狗有很多品种，每种狗有不同的颜色、体型、五官特征。狗在不同的时间，也有不同的表情、姿势。狗还会处于不同的背景环境下。

所以，计算机通过摄像头捕捉到的狗的影像，是无穷尽的。很难通过有限数量的规则，去帮助计算机做出判断。
想要让计算机实现像人一样的智能，不能采用简单的规则驱动，而是应该像教孩童一样，不断输入数据和答案，让他自行总结特征，形成自己的判断规则。
换言之，在经典的程序设计中，人们输入的是规则（即程序）和数据，系统输出的是答案。

而AI的计算过程，分为两个步骤：
第一个步骤，输入的是数据和预期得到的答案，系统输出的是规则。
第二个步骤，将输出的规则应用于新的数据，然后再输出答案。

第一步，我们可以称之为“训练”。第二步，才是真正“干活”。
这就是传统计算程序和现在主流AI技术的一个典型区别。（注意，我说的是“现在主流AI”。有一些“历史AI”和“非主流AI”，玩法不一样。不能一概而论。

█ AI，有哪些类别？
前面说了，人工智能是一个非常庞大的科学领域。
从1950年代正式诞生以来，围绕人工智能，已经有很多科学家进行了大量的研究，也输出了很多非常了不起的成果。
这些研究，根据思路方向的不同，被分为了很多种学派。比较有代表性的，是符号主义学派、联结主义学派、行为主义学派。
这些学派并没有对错之分，相互之间也有一些交叉融合。
早期的时候（1960-1990），符号主义（以专家系统、知识图谱为代表）是主流。后来，从1980年开始，联结主义（以神经网络为代表）崛起，一直到现在，都是主流。

将来，也许有新的技术崛起，形成新的学派，也不一定。
除了方向路线之外，我们也可以从智能水平以及应用领域等方面对AI进行分类。
按智能水平，可以分为：弱人工智能（Weak AI）、强人工智能（Strong AI）、超人工智能（Super AI）。
弱人工智能只专精于单一任务或一组相关的任务，不具备通用智能能力。我们目前就处于这个阶段。

强人工智能更厉害一些，具有一定的通用智能能力，能够理解、学习并应用于各种不同的任务。这个还处于理论和研究阶段，还没落地。
超人工智能当然是最强的。它在几乎所有方面都超过人类智能，包括创造力、社交技能等。超人工智能是未来的终极形态，我们假设它能够实现。
关于按应用领域的AI分类，我们待会再说。

█ 什么是机器学习？

其实我们前面介绍规则总结的时候，其实已经提到了机器学习。
机器学习的核心思想，是构建一个可以从数据中学习的模型，并利用这个模型来进行预测或决策。
机器学习不是一个具体的模型或算法。它包括了很多种类型，例如：
监督学习：算法从带有标签的数据集中学习，即每个训练样本都有一个已知的结果。
无监督学习：算法从没有标签的数据集中学习。
半监督学习：结合了少量的带标签数据和大量的未带标签数据进行训练。
强化学习：通过试错的方式，学习哪些行为可以获得奖励，哪些行为会导致惩罚。

█ 什么是深度学习？
深度学习，具体来说，是深度神经网络学习。
深度学习是机器学习的一个重要分支。机器学习底下有一条“神经网络”路线，而深度学习，是加强版的“神经网络”学习。
神经网络是联结主义的代表。顾名思义，这个路线是模仿人脑的工作原理，建立神经元之间的联结模型，以此实现人工神经运算。

深度学习所谓的“深度”，是神经网络中“隐藏层”的层级。
经典机器学习算法使用的神经网络，具有输入层、一个或两个“隐藏层”和一个输出层。
深度学习算法使用了更多的“隐藏层”（数百个）。它的能力更加强大，让神经网络能够完成更困难的工作。
机器学习、神经网络和深度学习的关系，通过下面的图可以看出：

█ 什么是卷积神经网络、循环神经网络？
神经网络从1980年代开始崛起之后，就形成了很多的模型和算法。不同的模型和算法，有着各自的特性和功能。

卷积神经网络（Convolutional Neural Network，CNN）和循环神经网络（Recurrent Neural Network，RNN），是1990年代左右诞生的比较知名的神经网络模型。
它们的具体工作原理比较复杂。反正大家记住：

卷积神经网络（CNN）是一种用于处理具有类似网格结构的数据（例如图像和视频）的神经网络。所以，它通常用于计算机视觉中，可以用来图像识别和图像分类。
而循环神经网络（RNN）是一种用于处理序列数据的神经网络，例如语言模型和时间序列预测。所以，它通常用于自然语言处理和语音识别。

█ 什么是transformer？
transformer也是一个神经网络模型。它比卷积神经网络和循环神经网络更加年轻（2017年由谷歌研究团队提出），也更加强大。
作为非专业人士，不需要去研究它的工作原理，只需要知道：
1、它是一种深度学习模型；2、它使用了一种名为自注意力（self-attention）的机制；3、它有效解决了卷积神经网络和循环神经网络的瓶颈（局限性）问题；4、它很适合自然语言处理（NLP）任务。相比循环神经网络，它的计算可以高度并行化，简化了模型架构，训练效率也大大提升；5、它也被扩展到了其他领域，如计算机视觉和语音识别。6、现在我们经常提到的大模型，几乎都是以transformer为基础。

神经网络还有很多种，我在网上找到一张图，供参考：

█ 什么是大模型？
这两年AI火，就是因为大模型火。那么，什么是大模型？
大模型，是具有庞大参数规模和复杂计算结构的机器学习模型。
参数，是指在模型训练过程中，学习和调整的变量。参数定义了模型的行为、性能、实现的成本以及对计算资源的需求。简单来说，参数是模型内部用来做出预测或决策的部分。
大模型，通常拥有数百万至数十亿的参数。相对应的，参数少的，就是小模型。对一些细分的领域或场景，小模型也够用。
大模型需要依赖大规模数据进行训练，对算力资源的消耗极大。

大模型有很多种类别。通常所说的大模型，主要是指语言大模型（以文本数据进行训练）。但实际上，还有视觉大模型（以图像数据进行训练），以及多模态大模型（文本和图像都有）。

绝大多数大模型的基础核心结构，都是Transformer及其变体。

按应用领域，大模型可以分为通用大模型和行业大模型。
通用大模型的训练数据集更加广泛，覆盖的领域更加全面。行业大模型，顾名思义，训练数据来自特定行业，应用于专门的领域（例如金融、医疗、法律、工业）。

█ GPT的本质是什么？
GPT-1、GPT-2……GPT-4o，等等，都是美国OpenAI这家公司推出的语言大模型，同样都是基于Transformer架构。
GPT的全称，叫做Generative Pre.trained Transformer，生成式-预训练-Transformer。
Generative（生成式），表示该模型能够生成连续的、有逻辑的文本内容，比如完成对话、创作故事、编写代码或者写诗写歌等。
这里刚好提一下，现在常说的AIGC，就是AI Generated Content，人工智能生成内容。内容，可以是文本、图像、音频、视频等。
GPT系列面向文本，谷歌也推出过竞品BERT。
文生图，比较有代表性的是DALL·E（也来自OpenAI）、Midjourney（知名度大）和Stable Diffusion（开源）。
文生音频（音乐），有Suno（OpenAI）、Stable Audio Open（由Stability.ai开源）、Audiobox（Meta）。
文生视频，有Sora（OpenAI）、Stable Video Diffusion（由Stability.ai开源）、Soya（开源）。图也可以生视频，例如腾讯的Follow-Your-Click。

AIGC是一个“应用维度”的定义，它不是一个具体的技术或模型。AIGC的出现，扩展了AI的功能，打破了此前AI主要用于识别的功能限制，拓宽了应用场景。
好了，继续解释GPT的第二个字母——Pre.trained。
Pre.trained（预训练），表示该模型会先在一个大规模未标注文本语料库上进行训练，学习语言的统计规律和潜在结构。
通过预训练，模型才有了一定的通用性。训练的数据越庞大（如网页文本、新闻等），模型的能力就越强。
大家对于AI的关注热潮，主要源于2023年初的ChatGPT爆火。
ChatGPT的chat，是聊天的意思。ChatGPT是OpenAI基于GPT模型开发的一个AI对话应用服务（也可以理解为GPT-3.5）。

通过这个服务，人们才可以亲身体验到GPT模型的强大，有利于技术的宣传和推广。

事实证明，OpenAI的策略成功了。ChatGPT充分吸引了公众关注度，也成功推动了AI领域的发展热潮。

█ AI，究竟能做什么？
AI的作用，极为广泛。
概括来说，AI和传统计算机系统相比，能提供的拓展能力，包括：图像识别、语音识别、自然语言处理、具身智能等方面。

图像识别，有时候也被归类为计算机视觉（Computer Vision，CV），让计算机具备理解和处理图像和视频的能力。常见的是摄像头、工业质检、人脸识别之类的。

语音识别，就是理解和处理音频，获得音频所搭载的信息。常见的是手机语音助手、电话呼叫中心、声控智能家居之类的，多用于交互场景。
自然语言处理，前面介绍过，就是使计算机能够理解和处理自然语言，知道我们到底在说什么。这个很火，多用于创造性的工作，例如写新闻稿、写书面材料、视频制作、游戏开发、音乐创作等。
具身智能，就是把人工智能搭载在一个物理形态（“身体”）上，通过与环境互动，来获得和展示智能。
带AI的机器人，属于具身智能。
斯坦福大学年初推出的“Mobile ALOHA”，就是一个典型的家用具身机器人。它可以炒菜、煮咖啡甚至逗猫，火爆全网。
值得一提的是，并不是所有的机器人，都是人形机器人。也不是所有的机器人，都用到了AI。
人形机器人
AI特别擅长对海量数据进行处理，一方面通过海量数据进行学习和训练，另一方面，基于新的海量数据，完成人工无法完成的工作。或者说，找到海量数据中潜在的规律。
目前AI在社会各个垂直行业的应用，主要是围绕上面的能力进行延展。
我们举一些常见的例子。
在医疗领域，AI已经可以用于分析X光片、CT扫描、MRI图像等，帮助识别识别异常区域，甚至做出诊断判断。AI还可以用于识别组织切片中的细胞变异，辅助病理学家进行癌症筛查和其他疾病的诊断。
AI还可以分析患者的基因组数据，确定最适合的治疗方案。AI也可以根据患者的病史和生理指标，辅助预测病情趋势。
在药品研发方面，AI可以帮助模拟化学成分的相互作用，缩短新药研发周期。
发生严重的公共卫生事件时，AI可以分析流行病数据，预测疾病传播的趋势。
在金融领域，AI可以实时监测市场动态，识别潜在的市场风险，并制定相应的风险对冲策略。
AI还可以通过分析借款人的信用记录、收入情况、消费行为等多维度数据，评估信贷风险。当然，AI也可以结合投资者的个人财务情况、风险偏好和收益目标，提供最合适的投资组合建议。
类似的例子实在是数不胜数。在工业制造、教育文旅、商业零售、农林牧渔、公共安全、政府治理等几乎所有领域，AI都已经有了实际的落地场景和案例。
AI正在改变社会，改变我们每一个人的工作和生活。

█ 我们应该如何看待AI？
AI的商业和社会价值，是毋庸置疑的。它的崛起趋势，也是不可阻挡的。
从企业的角度来说，AI能够自动化重复性、繁琐的任务，提高生产效率和质量，同时降低生产成本和人力成本。
对于制造业和服务业来说，这个优势至关重要，直接影响了企业的竞争力，甚至是生存。
从政府的角度来说，AI不仅可以提升治理效率，也能够带来新的商业模式、产品和服务，刺激经济。

强大的AI，也是一种国家竞争力。在科技博弈和国防事业方面，如果AI技术不如别人，可能会带来严重后果。
从个人的角度来说，AI可以帮助我们完成一些工作，也可以提升我们的生活品质。

从整个人类的角度来说，AI在疾病治疗、灾害预测、气候预测、消灭贫穷方面，也可以发挥重要的作用。

但事物都是有两面性的。AI作为工具，既有利，也有弊。

最现实的一个弊，就是可能会威胁到大量的人类工作岗位，导致大量失业。根据麦肯锡的研究，到2030年至2060年之间，大约50%的职业可能会逐步被AI取代，特别是对于知识工作者而言。

图片来自《纽约客》杂志
除此之外，AI被用于发动战争、欺诈（模仿声音或换脸，进行诈骗）、侵犯公民权益（信息过度采集、侵犯隐私）。

如果只有少数公司拥有先进的AI技术，可能会加剧社会的不公平现象。AI的算法偏见，也可能导致不公平。
AI变得越来越强大，也会让人们产生对AI的依赖，失去独立思考和解决问题的能力。AI的强大创造力，有可能让人类失去创造的动力和信心。
围绕AI的发展，还有安全（数据泄露、系统崩溃）、道德伦理等一系列问题。

所有这些问题，我们目前都没有靠谱的解决方案。所以，只能在发展AI的过程中，一点点去探索、思考和解决。对于AI的警惕和防范之心，是一定要有的。
作为我们普通人，目前最现实的做法，就是先了解它、学习它。先学会使用常见的AI工具和平台，帮助自己提升工作效率，改善生活品质。
有句话说的好：“未来，淘汰你的不是AI，而是掌握了AI的人”。与其焦虑，不如勇敢面对和积极拥抱，尽早掌握主动权。

好啦，以上就是今天文章的全部内容。对于一个普通人来说，知道这些AI常识，就是拥抱AI的第一步。至少和别人聊天的时候，谈到AI，就不会一头雾水了。

感谢大家的耐心阅读，我们下期再见！

2025年12月30日
什么是AI

人工智能（Artificial Intelligence），英文缩写为AI。是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等^[128]。

人工智能大模型带来的治理挑战也不容忽视。^[39]马斯克指出，在人工智能机器学习面具之下的本质仍然是统计。^[33]营造良好创新生态，需做好前瞻研究，建立健全保障人工智能健康发展的法律法规、制度体系、伦理道德。^[39]着眼未来，在重视防范风险的同时，也应同步建立容错、纠错机制，努力实现规范与发展的动态平衡。^[39]

2024年，“人工智能”当选为汉语盘点2024年度国际词^[59]。当地时间2025年1月13日，美国发布《人工智能扩散出口管制框架》^[63-64]。1月14日，中国外交部发言人郭嘉昆表示：坚决反对美方在AI领域也搞“三六九等”^[65]。2025年10月，《生成式人工智能应用发展报告（2025）》发布。报告显示，截至2025年6月，中国生成式人工智能用户规模达5.15亿人，较2024年12月增长2.66亿人，用户规模半年翻番；普及率为36.5%。^[217]2025年11月，同安、集美等地上线多款AI智能化环卫设备。^[238]12月1日，中国香港领先的AIGC公司来画推出的“全国首家支持1000秒AI漫剧生成平台”将进行内测。^[240]

截至2025年11月，中国网信部门已累计清理相关违规信息8700余条，处置仿冒公众人物账号1.1万余个。

2025年12月30日