作者: flyfarther_xcx2

  • 32岁宝妈靠AI写短故事3个月变现2.1w!带娃赚钱两不误!我把操作全写出来啦!!!

    32岁宝妈靠AI写短故事3个月变现2.1w!带娃赚钱两不误!我把操作全写出来啦!!!

    作为一个被边缘化的二胎宝妈,为了赚点家用试过很多兼职副业,搞到最后90%都没成,微商囤货压了一堆货卖不动、刷单被骗2800、手工DIY作品卖不出去…折腾来折腾去,钱没赚到,材料设备搭进去一大堆…

    后来才明白,对于我们大多普通人来说,只有实打实的技术才能稳定赚钱!比如我现在在做的AI写短故事,借助AI技术,3个月稿费收益2.1w+!带娃搞钱两不误!日子也渐渐好起来了~

    「AI写短故事」听着高级,其实简单到离谱!只需要给AI输入主题就能生成故事框架,会电脑就能上手,两小时就能写出平台抢着要的万字稿件!更重要的是!现在市场需求大到吓人!短剧、漫剧、有声书都贼缺短故事,连我这种0基础小白都能薅到稿费!现在进场跟捡钱似的!!!

    最爽的是不用囤货、发货、投资,时间自己说了算,孩子一哭随时停,比上班爽多了!

    是我们在家搞钱的好机会!!!

    不知道咋整没关系,知乎知学堂就有「AI写短故事全套教程」,AI网文大佬手把手教你AI小说搞钱,最简单的语言,讲最”干”的操作!从「AI写故事实操」到「投稿变现」给你包圆儿了!咱直接对着操作复制黏贴就ok!!!

    领取入口放下面了,感兴趣的友友戳卡自取就ok!

    大厂出品,没有套路!大家可放心使用!我知道现在每个人的时间都很宝贵,我放这个教程卡片就是为了让大家快速了解AI写故事全套操作、快速上手!!!

    教程说的很实在,从AI创作黄金开篇到投稿变现全覆盖!

    咱直接按图索骥就ok!对宝妈小白超级友好~

    听完记得领「电子版资料」!

    尤其是圈出来的那个「如何拆解他人的故事变成自己的」!

    部分资料

    举个例子:

    就这导语,编编还夸我网感好!

    其实全是AI写的嘻嘻 ₌・֊・₌

    不要以为我会玩AI就觉得我很牛啥的,其实我刚开始写的时候也是两眼一抹黑,只会对着AI只会说写个故事,出来的东西干巴巴的自己都看不下去。

    按教程系统地学了一把子才知道:得说清楚主角是谁、在哪种场景、想要啥情绪的故事等等,从AI工具大模型、故事题材、到给AI喂的爆款大纲,都是有顺序和讲究的~

    具体为啥我也不懂,但是管他呢!咱直接无脑复制就完了!

    我就靠这招,让我用AI写的短故事从「无人问津」到现在「10投9中」!

    稿费也水涨船高,再也不用为工作和孩子焦虑的睡不着觉了。

    「详细版视频教程」放下面了,需要的uu戳卡自取:

    说句实话,有这成果不是我个人能力有多强,而是教程靠谱+市场需求大!!!

    不仅有视频教程可以无脑复制,还有各大平台签约模版和电子版资料!尤其是各大平台投稿模版!建议人手一份!

    毕竟会用AI写故事是基础,懂得投稿变现才是重点!!!

    AI发展到今天,用AI写短故事早已不是虚像,而是一个需求巨大、前景广阔、能实实在在创造价值的黄金赛道!!!

    尤其是「AI短故事」!

    现在各大内容平台都在疯狂抢稿,像番茄小说的超短篇保底稿费已达80-500元/千字!

    中短篇更是高达100-700元/千字,爆款作品单月分账甚至能突破200w!!!

    说白了咱普通人要搞钱,最重要的就是「顺势」!!!

    当年直播带货刚火时,拿手机瞎聊都能卖货赚钱;后来短剧风口,那群拍短剧的,单集分成就比我工资高。现在轮到AI短故事了——200w的盘子,平台疯狂扶持,简直老天爷赏饭吃!

    以前写一个短故事得多久?门槛有多高?

    现在我这种0基础小白都能用AI写故事赚钱,这就是AI给的势!!!

    就像当年抖音给素人推流一样,等大家都入场了就卷起来了。

    风口这玩意儿,一辈子遇不上几次。

    趁现在风口正盛,有靠谱教程,咱干就完了!别等大家卷起来了再后悔!!!

    最后,附下「AI写故事」全套教程,想快速搞钱的友友自取:

    文章来源于互联网:32岁宝妈靠AI写短故事3个月变现2.1w!带娃赚钱两不误!我把操作全写出来啦!!!

  • 2026 搞钱新思路!AI 视频变现,普通人也能上手的保姆级经验分享

    2026 搞钱新思路!AI 视频变现,普通人也能上手的保姆级经验分享

    2025 年末,互联网被一群会说话的 AI 萌宠席卷:YouTube 上,马尔济斯犬 “大麦” 用 10 个月 145 条视频圈粉 8.5 万,单月广告收入达 11 万元;比熊犬 “云朵” 仅靠 22 条内容,两个月斩获超 423 万播放量…..普通人靠 ChatGPT 写脚本、Midjourney 生图、剪映剪辑,十几分钟就能出片,无需专业技能,AI 把创作门槛拉到最低,也打开了流量变现捷径。

    转眼马上进入 2026 年,AI 技术的普及让这场流量红利愈发汹涌。当做号依然是最大众化的变现路径,当 AI 从工具升级为创作合伙人,普通人如何抓住这波趋势,将 AI 生成的视频转化为稳定收入?今天 AdsPower 这篇文章就来告诉你!

    普通人如何 AI 视频变现?

    第一步: 找准定位

    2026 年的 AI 视频赛道,流量稀释已成必然,泛娱乐内容的变现效率大幅下滑,唯有垂直领域 + 实用价值的组合,才能实现高效转化。以下三个高潜力赛道,兼顾门槛低、溢价高、可持续性强的特点,特别适合普通人切入。

    (1)AI 知识漫剧

    将晦涩难懂的专业知识,通过 AI 转化为视觉冲击力强、节奏紧凑的漫剧形式,解决用户学习难的痛点,又符合短视频的观看习惯。

    AI 知识漫剧的高价值选题可覆盖金融、历史、心理学等垂直领域,实操中需坚持选题小而深,避开大而全的模糊定位,同时保持风格统一,强化账号辨识度。

    (2)AI 虚拟博主(UGC)

    虚拟人无需真人出镜、没有档期限制,且人设稳定、风格可控,尤其受美妆、穿搭、生活方式类品牌青睐。明确 三维人设:性格 + 视觉标识 + 内容切口;可以给给虚拟人加记忆点标签打造反差感,比如 “带重庆方言的美妆博主”。

    (3)全球化翻译号

    利用 AI 的实时翻译、嘴型对位技术,将国内已经验证的爆款内容,快速适配海外市场,实现一份内容,多平台变现。

    图源网络,侵删

    第二步:掌握提示词驱动 workflow

    2026 年的 AI 视频生产,已彻底告别复杂建模和漫长渲染,核心是 “用精准提示词指挥工具链”,从脚本到成片,全程 AI 辅助,普通人也能实现批量高质量产出。

    (1)脚本生成

    脚本生成的核心工具可选择逻辑更严谨、支持多风格适配的 DeepSeek 或 ChatGPT,关键在于跳出笼统描述的误区,用 “场景 + 风格 + 语气 + 细节” 构建反直觉指令,让 AI 精准捕捉创作方向。也可以让 AI 帮忙拆解爆款视频进行复制同类型脚本,让脚本更贴合爆款逻辑。

    (2)视觉生成

    视觉生成的核心是兼顾内容质感与风格统一性,这也是提升账号辨识度的关键。生图环节的核心技巧是运用 “主体 + 风格 + 细节 + 画质 + 种子词(–seed XXXX)” 的精准提示词公式,且同一账号需始终沿用相同的 “种子词 + 核心风格描述”,避免人物五官、场景风格出现突兀变化。视频生成则要聚焦提示词的精准度,需明确画面动作、背景、光影等要求,同时将分辨率设为 1080P、帧率 30fps 以适配主流平台,生成后预览如果发现动作不自然,就补提示词进行优化,不用逐帧改。

    生图核心工具:Midjourney 、Nano Banana Pro 、DALL-E 3 等;

    视频生成工具:Kling 、Luma Dream Machine等。

    (3)音频与克隆

    音频是 AI 视频打造差异化、强化记忆点的核心,关键技巧在于兼顾适配性与独特性。可以根据内容风格选择 “自然口语”“搞笑幽默”“专业解说” 等预设语气生成配音,建议将语速调整为 1.2 倍速,更贴合短视频快节奏传播需求。也可以通过录制方言或特色语气的样本音频,克隆专属配音,让账号在同类 AI 视频中快速脱颖而出,形成独特标签。

    AI 音频工具:ElevenLabs、Whisper X(OpenAI)、讯飞听见 AI 配音、Play.ht、Massive Voice Clone(Meta)、Deepgram、Descript等

    (4)一键合成

    一键合成的核心是借助 AI 工具构建 “素材导入 – 智能适配 – 自动化处理 – 细节微调” 的轻量化流程,无需专业剪辑技能即可实现高效批量出片。

    一键合成 AI 工具:剪映、AuroCut 、FastMix AI 、VidMind 、Magikut AI 等

    第三步:变现

    AI 视频的变现核心是流量匹配场景,2026 年的变现路径更多元、更直接,无需漫长积累,新手也能快速起盘,以下是梯度变现方案。

    (1)平台流量奖励

    核心逻辑是靠平台广告分成赚取基础收入,同时积累粉丝,为后续高价值变现铺路。其中YouTube AdSense 是不可错过的高收益赛道,利用汇率差赚取的美金收益,比国内平台分成高出 20%-30%,但这条赛道的门槛恰恰在于海外账号的运营。

    新账号注册要面对设备指纹、网络环境、行为模式等多重风控检测,稍不注意就会被封禁,前期投入的 AI 视频内容和运营时间全部白费;特别是如果想要放大收益,还需要运营多个账号布局不同垂类内容是关键,但同一设备登录多个账号极易触发关联风控,这成了很多创作者的变现卡点。

    这个时候 AdsPower 就能帮大家解决这些难题,它能为每个 YouTube 账号创建独立的浏览器环境,再搭建海外IP ,有效防止 WebRTC 泄露真实 IP,从根源上规避多账号关联封禁的风险,让创作者可以放心布局多个垂类账号,批量发布 AI 知识漫剧、虚拟博主等内容。

    不仅如此,AdsPower 还支持 RPA 自动化、窗口同步等功能,能帮助创作者高效养号,逐步提升账号权重,解决新账号 0 观看、粉丝积累慢的问题。

    对于小团队来说,成员管理和分组权限功能更是刚需,不同运营人员可以在不同设备上一键登录对应账号,无需频繁切换和输入密码,大幅提升了多账号运营效率。

    借助 AdsPower 的子成员功能,还能模拟多坐席使用各类海外营销工具,大大降低按坐席计费的工具成本,特别适合初创团队和个人创作者控制变现投入。

    除了 YouTube,INS 、抖音的流量分成也适合高频产出萌宠、资讯、解压类内容的账号,搭建 AI 变现矩阵账号,扩大收益渠道。

    (2)私域转化和带货

    核心思路很简单,用 AI 视频引流,卖高毛利的产品和课程,一次创作就能多次变现。做私域课程的话,直接把 AI 视频的创作流程打包成工具包和教程,用低价引流、高价进阶的路子,引导用户私信领资料进私域成交。

    带货就按视频类型搭商品,萌宠视频挂宠物用品,虚拟博主视频挂服饰配饰,关键是把商品自然融进内容里,别搞硬广。

    (3)定制服务

    给本地商家、中小企业做 AI 视频定制,需求旺、客单价高还能反复接单。基础业务瞄准餐饮、奶茶店等,有一定创作能力的还可以接企业 AI 内容代运营,一个人就能服务 3-5 家客户。要是涉及多平台多账号分发,就用 AdsPower 去高效管理客户账号矩阵,批量发定制视频,直接提升服务的效率和专业度。

    写在最后

    2026 年的 AI 视频变现风口,从来不是专业团队的专属。找准垂直赛道,用提示词玩转 AI 工具,再靠平台分成、私域带货、B 端定制等变现渠道,普通人也能分得一杯羹。

    而 AdsPower 这样的工具,更是帮你打通海外多账号运营的关键。 避开风控封禁的坑,高效养号涨粉,还能降低团队协作和工具使用的成本,让变现之路走得更稳更快。

    与其站在原地观望,不如现在就动手选一个赛道,打磨出第一条 AI 视频。红利期的每一步行动,都是在为自己的稳定收入铺路。

    文章来源于互联网:2026 搞钱新思路!AI 视频变现,普通人也能上手的保姆级经验分享

  • 建议收藏!2025年最好用的17个免费AI工具,包括DeepSeek、腾讯元宝、豆包、ima……

    建议收藏!2025年最好用的17个免费AI工具,包括DeepSeek、腾讯元宝、豆包、ima……

    AI一天,人间十年。这句话虽然有点夸张,但是,身处在AI这个领域,时时刻刻见证着AI的更新迭代速度之快,确实是让人感觉到吃惊。

    目前我正在尝试做一个小小的AI博主,主要是分享一些普通人也能拿来就用的AI教程。

    因为我也是从小白一路走过来,踩过很多坑,也更清楚哪些工具更适合小白入手。

    今天夏至要为大家介绍一些2025年值得去用的AI工具。关键是免费!

    以下这些方便大家在日常的学习、工作、生活、创作和育儿中,能够利用这些AI工具为自己提速增效,解放时间。

    话不多说,马上开始!

    1、豆包

    官方网址:

    使用方式:

    手机APP、电脑网页端、电脑客户端。

    功能亮点:

    作为字节跳动旗下用户量突破1亿的国民级AI工具,豆包深度融合抖音生态实现短视频脚本智能生成与带货文案创作,其特色在于通过”场景化智能体”覆盖育儿指导、心理按摩等20+生活场景,配合语音对答功能让用户感受拟人化交互。

    2024年新增音乐生成功能可基于歌词自动创作BGM,2025年上线的视频生成内测支持输入文案生成动态分镜,最新推出的图片理解功能可解析表情包深层含义并生成幽默回复。

    教育领域表现尤为突出,英语学习助手可模拟真实对话场景纠正发音,育儿模块能根据儿童年龄推荐适龄故事并生成睡前语音。

    2、夸克

    使用方式:

    电脑网页端、电脑客户端、APP。

    功能亮点:

    全面开启深度思考,搜经验、做攻略、解难题,随时搜一搜。输入指令,复杂问题轻松解决,文字、图文、视频、表格,都能快速理解。

    夸克的桌面AI助手方便随时提问找答案,划词工具栏可以随时解读、翻译、润色文本。快捷键截屏,还支持截屏搜题、搜索等。

    3、飞书

    使用方式:

    电脑网页端、电脑客户端、APP

    功能亮点:

    飞书是字节跳动推出的企业级协同办公平台,以“All in One”为目标,整合即时通讯、文档协作、项目管理、数据分析等功能,提供一站式解决方案。

    其核心功能包括支持文字、语音、视频会议,消息传递实时性强,适用于跨地域团队协作。在飞书接入deepseek之后,也可实现通过设置多维表格,可单次批量处理上百条内容,完成短视频脚本、文案的批量制作。

    4、扣子

    使用方式:

    电脑网页端

    功能亮点:

    AI智能体种类非常丰富,支持一句话生成一个智能体,工作流功能非常强大,目前扣子现已推出满血版 Deepseek 全家桶,支持免费体验 R1、V3 模型。

    除此之外,扣子支持 DeepSeek 思维链(Chain-of-Thought,CoT)和 Function Calling 能力,为制作智能体添加私有知识和多种技能,拓展智能体的能力边界,一键满足多种场景需求。

    5、讯飞星火

    使用方式:

    电脑网页端、APP、小程序

    特色功能:

    依托科大讯飞27年语音技术积累,星火V4.0版本在医疗法律领域实现92%高精度问答,独家AI口语陪练系统可实时评估发音准确度并生成纠错报告。

    2025年更新的”启发式对话”功能支持构建虚拟人格,用户可自定义AI助手的知识背景与沟通风格,特别适合教师创建学科专属辅导机器人。

    多语言实时互译覆盖60+语种,会议记录功能可自动生成带时间戳的摘要,并标记关键决策点。

    6、通义千问

    使用方式:电脑网页端、APP

    功能亮点:

    具有语音实时记录、一键AI总结、上传音视频分析功能,非常适合上班工作的相关场景使用。

    7、Kimi

    使用方式:手机APP、电脑网页端、电脑客户端。

    功能亮点:

    Kimi尤其擅长长文本处理和专业领域的深度分析。它能够一次性处理高达200万字的文本信息,这在AI领域中处于领先地位。

    同时KIMI也能用来一键生成PPT,功能免费使用特别友好。模板也挺多。建议有这个需求的小伙伴可以去试试。

    8、秘塔AI搜索

    使用方式:手机APP、电脑网页端、小程序

    功能亮点:

    采用无广告纯净搜索模式,直接抓取政府官网、知网等权威信源,搜索结果自动整理为思维导图与对比表格。

    2025年集成DeepSeek-R1满血版模型后,输入复杂问题如”长三角新能源政策影响”可自动生成带数据可视化的分析报告。

    9、腾讯元宝

    使用方式:电脑客户端、电脑网页端、手机APP、小程序。

    功能亮点:

    深度融合微信生态的内容创作神器,可优先抓取10万+公众号爆文生成自带传播基因的推文。

    2025年接入DeepSeek-R1模型后,在逻辑推理任务中正确率提升40%,输入模糊需求如”制定三个月产品计划”可自动拆解为甘特图。隐私保护通过国家等保三级认证,聊天记录本地加密存储,适合处理敏感商务对话。

    10、文心一言

    使用方式:网页端/APP

    功能亮点:

    文心一言是百度推出的一款AI工具,特别擅长中文语境下的语言处理和内容创作。它依托百度强大的搜索引擎和海量数据,具备出色的知识增强和检索能力。

    文心一言在文学创作、商业文案创作等方面表现出色,能够提供高质量的文本生成和灵感支持。此外,它还支持多模态输入,能够处理文本、图片、音频等多种形式的内容。

    11、DeepSeek

    使用方式:电脑网页端、手机APP。

    功能亮点:

    在GRE数学题测试中达到89%正确率的逻辑专家,可展示完整推理过程帮助用户理解解题思路。

    2025年开源的R1模型价格仅为同行1/50,企业API调用成本降低90%。也由于它的开源,国内AI工具纷纷跟进,也嵌入了DeepSeek的R1深度思考模式。

    12、即梦AI

    使用方式:电脑网页端、APP

    功能亮点:

    2025年新增”动作模仿”功能可让静态图片模仿参考视频的肢体动作。今年也推出了数字人功能,对嘴型非常好用。

    同时也专注于AI绘画领域,提供了丰富的艺术风格选择和简单直观的操作体验。它对中文提示词的理解相当准确,适合各类设计素材的制作。

    13、智谱清言

    使用方式:

    电脑网页版、电脑客户端、APP、小程序。

    特色功能:

    智谱清言是一款由智谱AI公司开发的AI工具,专注于中文环境下的写作和对话,它对中文表达的理解相当准确,响应速度快,特别适合国内用户的使用习惯。虽然在某些专业领域的知识深度上还有提升空间,但在日常写作和内容创作方面已经相当实用。

    与其他AI工具相比,能够更好地适应中文用户的语言习惯。此外,智谱清言的智能体功能也非常丰富,用户可以根据自己的需求创建个性化的智能体,这使得它在特定应用场景中更具灵活性。

    使用方式:

    橙篇支持电脑浏览器、客户端、APP使用。

    特色功能:

    橙篇是一款由百度开发的AI工具,特别擅长长文本生成和处理。橙篇在长文本生成方面具有明显优势,能够生成长达10万字的专业文档,并提供多格式跨模态内容的深度编辑功能。

    此外,橙篇还具备强大的文献知识检索能力,依托百度文库和百度学术等资源,能够快速获取实时专业资料。

    15.可灵AI

    使用方式:

    电脑网页端、APP

    功能亮点:

    在视频创意效果方面独树一帜,特别是在人像处理和特效制作方面有出色表现。它提供了多样的创意玩法,虽然部分功能的稳定性和学习曲线还需改善,但在创意视频制作领域具有独特优势。

    16、Get笔记

    使用方式:

    电脑网页端、APP、小程序

    Get笔记是一款由得到APP的技术团队开发的AI笔记软件,特别擅长语音识别和文本润色。它能够实时将语音转换成文字,并通过智能算法去除口语中的冗余词和纠正发音不标准的英文,使笔记更加流畅和专业。

    与其他AI工具相比,Get语音的优势在于其便捷性和高效的文本处理能力。作为微信小程序,它无需下载即可使用,非常适合习惯使用微信的用户。Get语音还支持跨平台同步与导入,方便用户在不同设备间管理和使用笔记。

    17、ima知识库

    使用方式:电脑客户端、小程序、手机APP(仅安卓手机)

    功能亮点:

    个人知识库管理的好帮手。同时也接入 DeepSeek R1 深度思考模型,整个界面非常简洁,方便又好用。

    文章来源于互联网:建议收藏!2025年最好用的17个免费AI工具,包括DeepSeek、腾讯元宝、豆包、ima……

  • 写给小白的AI入门科普

     到底什么是AI?
    AI,是artificial intelligence的缩写。
    Artificial,很多同学认字认半边,会以为是艺术(art)的什么形容词。其实不然,artificial的意思就是“人工的、人造的”,和natural(天然的)是反义词。
    Intelligence,这个不容易认错,是“智能”的意思。英特尔(Intel)公司的名字,就是基于这个词的前五个字母。
    结合起来,AI,就是“人工的、人造的智能”,用人为的手段,创造智能。


    关于AI的定义,行业里有很多种说法。比较学术化的一种,是这么说的:
    AI,是研究、开发用于模拟、延伸和扩展人的智能行为的理论、方法、技术及应用系统的一门综合性科学。
    这个定义很拗口,看得都头大。
    其实,对于AI,我们可以拆解来看。

    首先,AI的本质属性,是一门科学,是一个技术领域。
    它涉及到了计算机科学、数学、统计学、哲学、心理学等多种学科的知识,但总体上,归类于计算机学科之下。
    其次,AI的研究目的,是让一个“系统”具备智能。
    这个“系统”,可以是一套软件程序,也可以是一台计算机,甚至是一个机器人。
    第三,什么样的水平,才叫做真正的智能。
    这是问题的关键。目前看来,能够像人一样感知、理解、思考、判断、决策,就是实现了人工智能。
    配合机器人、机械臂等物理载体,AI也可以实现行动能力。
    综合以上三点,理解AI的定义就比较容易了。

     AI和普通计算机有什么区别?
    AI,目前仍然是基于计算机的基本玩法,采用的是半导体芯片技术(所以经常会被称为“硅基”),以及计算机的一些体系和平台。
    那么,它和传统的计算机程序,有什么区别呢?

    传统的计算机程序,就是一个规则的集合。程序员通过代码告知计算机规则,计算机根据规则,对输入数据进行判断和处理。
    例如经典的“if……else……(如果……否则……)”语句——“如果大于65岁,就退休。否则,继续上班”。
    然后,计算机程序会根据这个规则,对所有输入年龄数据进行判断和处理。
    但是,在现实生活中,很多要素(例如图像和声音)是极为复杂和多样的,我们很难给出固定的规则,让计算机实现高准确率的判断和处理。
    例如,判断一只狗是不是狗。
    狗有很多品种,每种狗有不同的颜色、体型、五官特征。狗在不同的时间,也有不同的表情、姿势。狗还会处于不同的背景环境下。

    所以,计算机通过摄像头捕捉到的狗的影像,是无穷尽的。很难通过有限数量的规则,去帮助计算机做出判断。
    想要让计算机实现像人一样的智能,不能采用简单的规则驱动,而是应该像教孩童一样,不断输入数据和答案,让他自行总结特征,形成自己的判断规则。
    换言之,在经典的程序设计中,人们输入的是规则(即程序)和数据,系统输出的是答案。

    而AI的计算过程,分为两个步骤:
    第一个步骤,输入的是数据和预期得到的答案,系统输出的是规则。
    第二个步骤,将输出的规则应用于新的数据,然后再输出答案。

    第一步,我们可以称之为“训练”。第二步,才是真正“干活”。
    这就是传统计算程序和现在主流AI技术的一个典型区别。(注意,我说的是“现在主流AI”。有一些“历史AI”和“非主流AI”,玩法不一样。不能一概而论。

     AI,有哪些类别?
    前面说了,人工智能是一个非常庞大的科学领域。
    从1950年代正式诞生以来,围绕人工智能,已经有很多科学家进行了大量的研究,也输出了很多非常了不起的成果。
    这些研究,根据思路方向的不同,被分为了很多种学派。比较有代表性的,是符号主义学派、联结主义学派、行为主义学派。
    这些学派并没有对错之分,相互之间也有一些交叉融合。
    早期的时候(1960-1990),符号主义(以专家系统、知识图谱为代表)是主流。后来,从1980年开始,联结主义(以神经网络为代表)崛起,一直到现在,都是主流。


    将来,也许有新的技术崛起,形成新的学派,也不一定。
    除了方向路线之外,我们也可以从智能水平以及应用领域等方面对AI进行分类。
    按智能水平,可以分为:弱人工智能(Weak AI)强人工智能(Strong AI)超人工智能(Super AI)
    弱人工智能只专精于单一任务或一组相关的任务,不具备通用智能能力。我们目前就处于这个阶段。

    强人工智能更厉害一些,具有一定的通用智能能力,能够理解、学习并应用于各种不同的任务。这个还处于理论和研究阶段,还没落地。
    超人工智能当然是最强的。它在几乎所有方面都超过人类智能,包括创造力、社交技能等。超人工智能是未来的终极形态,我们假设它能够实现。
    关于按应用领域的AI分类,我们待会再说。

    █ 什么是机器学习?

    其实我们前面介绍规则总结的时候,其实已经提到了机器学习。
    机器学习的核心思想,是构建一个可以从数据中学习的模型,并利用这个模型来进行预测或决策。
    机器学习不是一个具体的模型或算法。它包括了很多种类型,例如:
    监督学习:算法从带有标签的数据集中学习,即每个训练样本都有一个已知的结果。
    无监督学习:算法从没有标签的数据集中学习。
    半监督学习:结合了少量的带标签数据和大量的未带标签数据进行训练。
    强化学习:通过试错的方式,学习哪些行为可以获得奖励,哪些行为会导致惩罚。

     什么是深度学习?
    深度学习,具体来说,是深度神经网络学习。
    深度学习是机器学习的一个重要分支。机器学习底下有一条“神经网络”路线,而深度学习,是加强版的“神经网络”学习。
    神经网络是联结主义的代表。顾名思义,这个路线是模仿人脑的工作原理,建立神经元之间的联结模型,以此实现人工神经运算。

    深度学习所谓的“深度”,是神经网络中“隐藏层”的层级。
    经典机器学习算法使用的神经网络,具有输入层、一个或两个“隐藏层”和一个输出层。
    深度学习算法使用了更多的“隐藏层”(数百个)。它的能力更加强大,让神经网络能够完成更困难的工作。
    机器学习、神经网络和深度学习的关系,通过下面的图可以看出:

     什么是卷积神经网络、循环神经网络?
    神经网络从1980年代开始崛起之后,就形成了很多的模型和算法。不同的模型和算法,有着各自的特性和功能。

    卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN),是1990年代左右诞生的比较知名的神经网络模型。
    它们的具体工作原理比较复杂。反正大家记住:

    卷积神经网络(CNN)是一种用于处理具有类似网格结构的数据(例如图像和视频)的神经网络。所以,它通常用于计算机视觉中,可以用来图像识别和图像分类
    而循环神经网络(RNN)是一种用于处理序列数据的神经网络,例如语言模型和时间序列预测。所以,它通常用于自然语言处理和语音识别

     什么是transformer?
    transformer也是一个神经网络模型。它比卷积神经网络和循环神经网络更加年轻(2017年由谷歌研究团队提出),也更加强大。
    作为非专业人士,不需要去研究它的工作原理,只需要知道:
    1、它是一种深度学习模型;2、它使用了一种名为自注意力(self-attention)的机制;3、它有效解决了卷积神经网络和循环神经网络的瓶颈(局限性)问题;4、它很适合自然语言处理(NLP)任务。相比循环神经网络,它的计算可以高度并行化,简化了模型架构,训练效率也大大提升;5、它也被扩展到了其他领域,如计算机视觉和语音识别。6、现在我们经常提到的大模型,几乎都是以transformer为基础。

    神经网络还有很多种,我在网上找到一张图,供参考:

     什么是大模型?
    这两年AI火,就是因为大模型火。那么,什么是大模型?
    大模型,是具有庞大参数规模和复杂计算结构的机器学习模型
    参数,是指在模型训练过程中,学习和调整的变量。参数定义了模型的行为、性能、实现的成本以及对计算资源的需求。简单来说,参数是模型内部用来做出预测或决策的部分。
    大模型,通常拥有数百万至数十亿的参数。相对应的,参数少的,就是小模型。对一些细分的领域或场景,小模型也够用。
    大模型需要依赖大规模数据进行训练,对算力资源的消耗极大。

    大模型有很多种类别。通常所说的大模型,主要是指语言大模型(以文本数据进行训练)。但实际上,还有视觉大模型(以图像数据进行训练),以及多模态大模型(文本和图像都有)。

    绝大多数大模型的基础核心结构,都是Transformer及其变体。

    按应用领域,大模型可以分为通用大模型和行业大模型。
    通用大模型的训练数据集更加广泛,覆盖的领域更加全面。行业大模型,顾名思义,训练数据来自特定行业,应用于专门的领域(例如金融、医疗、法律、工业)。

     GPT的本质是什么?
    GPT-1、GPT-2……GPT-4o,等等,都是美国OpenAI这家公司推出的语言大模型,同样都是基于Transformer架构。
    GPT的全称,叫做Generative Pre.trained Transformer,生成式-预训练-Transformer。
    Generative(生成式),表示该模型能够生成连续的、有逻辑的文本内容,比如完成对话、创作故事、编写代码或者写诗写歌等。
    这里刚好提一下,现在常说的AIGC,就是AI Generated Content,人工智能生成内容。内容,可以是文本、图像、音频、视频等。
    GPT系列面向文本,谷歌也推出过竞品BERT。
    文生图,比较有代表性的是DALL·E(也来自OpenAI)、Midjourney(知名度大)和Stable Diffusion(开源)。
    文生音频(音乐),有Suno(OpenAI)、Stable Audio Open(由Stability.ai开源)、Audiobox(Meta)。
    文生视频,有Sora(OpenAI)、Stable Video Diffusion(由Stability.ai开源)、Soya(开源)。图也可以生视频,例如腾讯的Follow-Your-Click。

    AIGC是一个“应用维度”的定义,它不是一个具体的技术或模型。AIGC的出现,扩展了AI的功能,打破了此前AI主要用于识别的功能限制,拓宽了应用场景。
    好了,继续解释GPT的第二个字母——Pre.trained。
    Pre.trained(预训练),表示该模型会先在一个大规模未标注文本语料库上进行训练,学习语言的统计规律和潜在结构。
    通过预训练,模型才有了一定的通用性。训练的数据越庞大(如网页文本、新闻等),模型的能力就越强。
    大家对于AI的关注热潮,主要源于2023年初的ChatGPT爆火。
    ChatGPT的chat,是聊天的意思。ChatGPT是OpenAI基于GPT模型开发的一个AI对话应用服务(也可以理解为GPT-3.5)。
    图片
    通过这个服务,人们才可以亲身体验到GPT模型的强大,有利于技术的宣传和推广。

    事实证明,OpenAI的策略成功了。ChatGPT充分吸引了公众关注度,也成功推动了AI领域的发展热潮。

     AI,究竟能做什么?
    AI的作用,极为广泛。
    概括来说,AI和传统计算机系统相比,能提供的拓展能力,包括:图像识别语音识别自然语言处理具身智能等方面。

    图像识别,有时候也被归类为计算机视觉(Computer Vision,CV),让计算机具备理解和处理图像和视频的能力。常见的是摄像头、工业质检、人脸识别之类的。
    图片
    语音识别,就是理解和处理音频,获得音频所搭载的信息。常见的是手机语音助手、电话呼叫中心、声控智能家居之类的,多用于交互场景。
    自然语言处理,前面介绍过,就是使计算机能够理解和处理自然语言,知道我们到底在说什么。这个很火,多用于创造性的工作,例如写新闻稿、写书面材料、视频制作、游戏开发、音乐创作等。
    具身智能,就是把人工智能搭载在一个物理形态(“身体”)上,通过与环境互动,来获得和展示智能。
    带AI的机器人,属于具身智能。
    斯坦福大学年初推出的“Mobile ALOHA”,就是一个典型的家用具身机器人。它可以炒菜、煮咖啡甚至逗猫,火爆全网。
    值得一提的是,并不是所有的机器人,都是人形机器人。也不是所有的机器人,都用到了AI。
    图片人形机器人
    AI特别擅长对海量数据进行处理,一方面通过海量数据进行学习和训练,另一方面,基于新的海量数据,完成人工无法完成的工作。或者说,找到海量数据中潜在的规律。
    目前AI在社会各个垂直行业的应用,主要是围绕上面的能力进行延展。
    我们举一些常见的例子。
    在医疗领域,AI已经可以用于分析X光片、CT扫描、MRI图像等,帮助识别识别异常区域,甚至做出诊断判断。AI还可以用于识别组织切片中的细胞变异,辅助病理学家进行癌症筛查和其他疾病的诊断。
    AI还可以分析患者的基因组数据,确定最适合的治疗方案。AI也可以根据患者的病史和生理指标,辅助预测病情趋势。
    在药品研发方面,AI可以帮助模拟化学成分的相互作用,缩短新药研发周期。
    发生严重的公共卫生事件时,AI可以分析流行病数据,预测疾病传播的趋势。
    在金融领域,AI可以实时监测市场动态,识别潜在的市场风险,并制定相应的风险对冲策略。
    AI还可以通过分析借款人的信用记录、收入情况、消费行为等多维度数据,评估信贷风险。当然,AI也可以结合投资者的个人财务情况、风险偏好和收益目标,提供最合适的投资组合建议。
    类似的例子实在是数不胜数。在工业制造、教育文旅、商业零售、农林牧渔、公共安全、政府治理等几乎所有领域,AI都已经有了实际的落地场景和案例。
    AI正在改变社会,改变我们每一个人的工作和生活。

     我们应该如何看待AI?
    AI的商业和社会价值,是毋庸置疑的。它的崛起趋势,也是不可阻挡的。
    从企业的角度来说,AI能够自动化重复性、繁琐的任务,提高生产效率和质量,同时降低生产成本和人力成本。
    对于制造业和服务业来说,这个优势至关重要,直接影响了企业的竞争力,甚至是生存。
    从政府的角度来说,AI不仅可以提升治理效率,也能够带来新的商业模式、产品和服务,刺激经济。

    强大的AI,也是一种国家竞争力。在科技博弈和国防事业方面,如果AI技术不如别人,可能会带来严重后果。
    从个人的角度来说,AI可以帮助我们完成一些工作,也可以提升我们的生活品质。

    从整个人类的角度来说,AI在疾病治疗、灾害预测、气候预测、消灭贫穷方面,也可以发挥重要的作用。
    图片
    但事物都是有两面性的。AI作为工具,既有利,也有弊。

    最现实的一个弊,就是可能会威胁到大量的人类工作岗位,导致大量失业。根据麦肯锡的研究,到2030年至2060年之间,大约50%的职业可能会逐步被AI取代,特别是对于知识工作者而言。

    图片来自《纽约客》杂志
    除此之外,AI被用于发动战争、欺诈(模仿声音或换脸,进行诈骗)、侵犯公民权益(信息过度采集、侵犯隐私)。

    如果只有少数公司拥有先进的AI技术,可能会加剧社会的不公平现象。AI的算法偏见,也可能导致不公平。
    AI变得越来越强大,也会让人们产生对AI的依赖,失去独立思考和解决问题的能力。AI的强大创造力,有可能让人类失去创造的动力和信心。
    围绕AI的发展,还有安全(数据泄露、系统崩溃)、道德伦理等一系列问题。

    所有这些问题,我们目前都没有靠谱的解决方案。所以,只能在发展AI的过程中,一点点去探索、思考和解决。对于AI的警惕和防范之心,是一定要有的。
    作为我们普通人,目前最现实的做法,就是先了解它、学习它。先学会使用常见的AI工具和平台,帮助自己提升工作效率,改善生活品质。
    有句话说的好:“未来,淘汰你的不是AI,而是掌握了AI的人”。与其焦虑,不如勇敢面对和积极拥抱,尽早掌握主动权。

    好啦,以上就是今天文章的全部内容。对于一个普通人来说,知道这些AI常识,就是拥抱AI的第一步。至少和别人聊天的时候,谈到AI,就不会一头雾水了。

    感谢大家的耐心阅读,我们下期再见!

  • 什么是AI

    人工智能(Artificial Intelligence),英文缩写为AI。是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人语言识别图像识别自然语言处理专家系统 [128]

    人工智能大模型带来的治理挑战也不容忽视。 [39]马斯克指出,在人工智能机器学习面具之下的本质仍然是统计。 [33]营造良好创新生态,需做好前瞻研究,建立健全保障人工智能健康发展的法律法规、制度体系、伦理道德。 [39]着眼未来,在重视防范风险的同时,也应同步建立容错、纠错机制,努力实现规范与发展的动态平衡。 [39]

    2024年,“人工智能”当选为汉语盘点2024年度国际词 [59]。当地时间2025年1月13日,美国发布《人工智能扩散出口管制框架 [63-64]。1月14日,中国外交部发言人郭嘉昆表示:坚决反对美方在AI领域也搞“三六九等” [65]。2025年10月,《生成式人工智能应用发展报告(2025)》发布。报告显示,截至2025年6月,中国生成式人工智能用户规模达5.15亿人,较2024年12月增长2.66亿人,用户规模半年翻番;普及率为36.5%。 [217]2025年11月,同安、集美等地上线多款AI智能化环卫设备。 [238]12月1日,中国香港领先的AIGC公司来画推出的“全国首家支持1000秒AI漫剧生成平台”将进行内测。 [240]

    截至2025年11月,中国网信部门已累计清理相关违规信息8700余条,处置仿冒公众人物账号1.1万余个。