当我试图和媳妇讲大语言模型(LLM)和DeepSeek
本文灵感来自我和媳妇讨论大模型的谈话,并由 DeepSeek 提取重点转录为幽默对话,如有事实错误,敬请指出。
Part 0:媳妇的灵魂拷问
媳妇(开场暴击):
“所以豆包、ChatGPT、文心一言、DeepSeek… 这些大模型到底谁才是真学霸?它们是怎么生出来的?它们这么厉害是不是背着我偷偷上补习班了?这么厉害的 AI 一定很花钱吧?”
Part 1:大模型家族大盘点——谁在AI界C位出道?
我(掏出小本本):
• 国际顶流:
• ChatGPT(OpenAI家,擅长写小作文,行业领军)
• Claude(Anthropic家,道德标兵,编码高手)
• Gemini(谷歌亲儿子,搜索基因拉满)
• 顶流在咱们家都不能直接使用,需要魔法。
• 国产学霸:
• 通义千问(阿里云)
• 豆包(字节跳动)
• 文心一言(百度)
• DeepSeek(专注“低成本高智商”的叛逆少年,新晋的国际顶流,目前的 C 位)
• 开源课代表:
• LLaMA(Meta家,江湖人称“AI界的Linux”)
• Mistral(法国黑马,小而美代言人)
• Qwen(阿里巴巴)
• DeepSeek
媳妇(犀利总结):
“懂了,AI圈就像娱乐圈——有自费出道的,有带资进组的,还有靠‘开源人设’圈粉的!”
我(呆住)
“我觉得你更懂娱乐圈,但比喻很形象,不过现在能训练出大模型的公司,都在烧钱。”
Part 2:学霸是怎样炼成的?
媳妇(略带疑惑):
这些大模型怎么这么聪明?他们是怎么做到的?
我(敲黑板):
它们原理就是——用海量数据训练算法,让机器学会像人一样唠嗑。
训练三件套:
1. 喂数据:塞给它全网文本(从《红楼梦》到贴吧神帖),相当于让学霸读遍“全宇宙”的课本+闲书+小广告。
2. 搞预训练:用Transformer架构(一种“注意力超集中”的算法)让它学会“猜下一个字”,比如“宫廷玉液酒”后面接“一百八一杯”。
3. 微调人设:教它遵守规则(比如不说脏话)、适应场景(比如当客服要温柔,当码农要暴躁)。
媳妇(举一反三):
“这不就是人类幼崽的成长路径吗?小时候乱啃书,青春期学规矩,长大后被迫‘职业化微笑’!,进入社会就干一行爱一行适应力极强”
我(略带欣慰)
“你说的太对了,你得把 AI大模型 当人看,只是 AI 模型是一组人类想要复刻自己的算法程序+数据集合,训练就是受教育,有的时候还得专项深造,毕业了就是发布模型了,而且每一届都有状元,这些状元开始可能有同样的学习方法,但总有一些状元自成一派”
Part 3:烧钱的艺术——训练成本能买多少爱马仕?
媳妇(掏出计算器):
“训练这学霸贵不贵?够买几个包?”
我(痛心疾首):
“烧钱程度约等于咱们给全小区装空调,不过现在DeepSeek这类模型用‘低成本高智商’路线,相当于清北学霸去拼多多砍了n刀……”
硬核数据:
• 硬件:训练GPT-4需上万块A100显卡,相当于把深圳华强北所有显卡店搬空。
• 电费:单次训练耗电≈一个小县城全年用电量,马斯克看了都想卖股票。
• Deepseek的绝杀技:用更聪明的算法(比如MoE架构)把成本砍到1/10。
媳妇(恍然大悟):
“难怪你头发越来越少,人家用GPU算力,你用脑力——结果还没人家准,赶紧买包去!”
Part 4:大模型的脑回路——为何总爱“胡说八道”?
核心原理(精简版):
• 底层逻辑:概率游戏!每个回答都是“根据上文,哪个词出现的概率最高”。
• 致命缺陷:它不懂“对错”,只懂“像人话”。所以能流畅解释量子力学,也会坚称“太阳绕着地球转”——只要训练数据里有足够多民科贴。
• 灵魂比喻:像用10000本《五年高考三年模拟》喂大的鹦鹉,能模仿学霸答题,但永远不知道自己在说啥。
媳妇(秒懂):
“明白了,就像你用ChatGPT写的周报——看起来专业严谨,实际你都不知道‘赋能垂直赛道’是啥意思!”
我(红温):
“不要岔开话题,认真听讲,我正在给你赋能”
Part 5:应用VS模型——谁才是真·大佬?
经典关系链:
• 模型:沉默的学霸,埋头学知识,只负责考试(生成答案)。
• 应用:社交达人,负责包装学霸成果。比如:
• 加“记忆功能”(用数据库存聊天记录)
• 搞“知识库外挂”(塞给它公司内部资料)
• 玩“联网技能”(偷偷百度答案假装自己会)
媳妇(精准吐槽):
“这不就是你和你们老板的关系吗?你吭哧吭哧写代码,他拿PPT吹牛融资!”
Part 6:业界骚操作大赏——AI如何假装“记性好”?
记忆的真相:
• 初级版:应用直接存储聊天记录(像你手机里的“最近搜索”),下次直接翻旧账,AI 每次都收到这些聊天记录再回复。
• 进阶版:用向量数据库把对话压缩成“关键词密码”,比如“媳妇生气=红色+包+火锅”,理解你的人话再找到对应的记录交给 AI 进行润色输出。
• 终极版:微调(Fine-tuning)(给学霸开小灶),把用户偏好刻进AI 的 DNA,从此一见你就说“亲爱的你今天真美”。
媳妇(警觉):
“所以豆包如果记得我说过‘再买包就剁手’,会不会在我浏览淘宝时自动弹窗‘检测到危险行为’?”
我(笑死):
“还没那么先进,最多清空你的购物车”
Part 7:联网功能——AI如何“偷偷百度”?
操作流水线:
- 1. 用户提问 → 2. 召唤搜索引擎 → 3. 抓取前3条结果 → 4. AI假装淡定总结 → 5. 一旦翻车就甩锅“贴吧神贴”
媳妇(看穿一切):
“这不就是我查‘如何让老公做家务’的流程吗?区别是AI不会像百度一样推荐‘男性专科医院’广告!”
我(😂)
…
Part 8:Deepseek的逆袭——凭啥让大佬们瑟瑟发抖?
颠覆性三连:
1. 低成本:同等智商(智商≈GPT-4o1)下,训练成本打1折,直接让“算力霸权”破防。
2. 开源:把代码和模型甩出来说“拿去卷”,逼得大厂连夜改战略。
3. 垂直领域暴击:金融、法律等专业场景表现逆天,从此“AI律师”比你老公更懂离婚怎么分财产。
媳妇(终极暴击):
“建议你跳槽去Deepseek,毕竟他们的模型比你更懂——如何用最低成本哄老婆开心。”
我
我也想…
「后记」
这场科普以媳妇下载“DeepSeek”和“腾讯元宝”告终,下次不问你了,下次我问它们。而我终于认清现实:
打败人类的不是AI,是媳妇用 AI 大模型生成的《老公绩效考核表》——内含“科普生动性”“洗碗及时率”“私房钱隐匿指数”等维度,并支持实时联网更新。接下来日子不好过了!
新增Part 9:关于“AI搞钱课程”的夫妻互怼实录
媳妇(刷手机突然暴怒):
“老公!这推送说‘用DeepSeek三天变现 10万元’,学费只要998!这不比你去公司写代码来钱快?”
我(瞄了一眼,冷笑):
“这课我熟!内容大概是教你用AI生成《致富圣经》,然后复制粘贴发小红书,最后坐等流量起飞,广告主找上门,或者直接让你发展下线拉进去学 AI 变现的财富密码”
媳妇(半信半疑):
“可人家说学员晒了收款截图!有个‘宝妈带娃月入3万’……”
我(战术拆台):
“哦,那个截图生成器叫PS,不是AI。他们还会教你用DeepSeek写《如何用PS伪造收入截图》——这叫‘生态闭环’。”
媳妇(恍然大悟):
“懂了!这课的核心技术是‘用AI忽悠人买AI课’,跟传销唯一的区别是——他们用DeepSeek写洗脑文案!”
我(补刀):
“而且这些‘导师’可能上周还在卖‘元宇宙房产投资课’,上个月教‘ChatGPT养蟑螂致富’。他们的职业技能只有两个:
• 快速蹭热点
• 把百度百科,官网文档,软件安装包放到网盘(实际上官网就能用),包装成‘独家秘籍’。”
媳妇(突然兴奋):
“那我们也去割韭菜!你写代码搞个‘AI搞钱神器’,我直播喊‘家人们,今天拼多多价199,明天恢复998’!”
我(痛心疾首):
“醒醒!这行竞争太激烈了。昨天有个课叫《用AI教AI课》,今天就有《用AI举报AI课》——他们连‘韭菜的觉醒’都能做成付费内容!”
附:AI课程乱象的人间真实
- 1. 课程内容:
• 99元《DeepSeek神级提示词》≈ 把官网说明书和公开的提示词模板分段加表情包。
• 1999元《AI百万副业课》≈ 教你群发“在吗?我是你AI创业导师”。
- 2. 导师人设:
• “前大厂总监”= 在字节跳动食堂打过饭。
• “AI变现第一人”= 唯一变现方式是卖课。
- 3. 终极真相:
• 唯一稳赚不赔的,是开课平台抽成30%的“AI税”。
• DeepSeek官方声明:我们没开班,别信!你们韭菜的命也是命,但我们可能救不了您!
媳妇(终极觉悟):
“所以这些课就像你送我的情人节礼物——宣传图是爱马仕,打开是拼夕夕同款,还硬说是‘AI定制限定版’?”
我(含泪点赞):
“精辟!但区别是——你退货还能退款能怼客服,他们退课会拉黑你然后钱不会给你。”
本文标题:当我试图和媳妇讲大语言模型(LLM)和DeepSeek
文章作者:AwesomeYang
发布时间:2025-02-25
最后更新:2025-05-01
原始链接:https://awesomeyang.com/2025/02/25/what-is-llm-and-deepseek/
版权声明:未经允许禁止转载,请关注公众号联系作者