【大白话系列 #3】大白话聊 ChatGPT（Sarah & 王建硕）

倍速播放下载节目

00:00

02:17:51

节目详情

欢迎各位收听 Traders’ Talk 大白话系列的第 3 期。

这次建硕和我聊的是一个充满未知和想象力的话题——ChatGPT。就在今天凌晨（2023/3/15），OpenAI 发布了多模态预训练大模型 GPT-4，它比之前的产品更加可靠、更有创意，能处理更细微的指令。

在本期节目中，建硕科普了 ChatGPT 的定义和原理，澄清了关于它的常见误解，并从创业者的角度出发畅谈了 ChatGPT 的应用前景和创业机会。最后，我们还探讨了与 AI 相关的隐忧。

感谢各位的收听，我是 Sarah，让我们开始本期节目吧！

———以上文本由 ChatGPT 生成———

【相关文稿及视频】

本期播客逐字稿（未精校）https://d58hixvcd6.feishu.cn/minutes/obcnyme2oqv67s82sct87997

完整视频直播逐字稿（精校）：https://d58hixvcd6.feishu.cn/docx/HfMEds7Z1ov37wxqM19czTBinWg

如何收看视频直播详见下图�

【嘉宾简介】

王建硕，

百姓网创始人、董事长

公众号：王建硕

【Timeline】

一、ChatGPT 定义及原理

00:02:58 ChatGPT 首先是一个产品，其次才是一个大语言模型

00:04:23 自然语言处理 NLP 的两大分支：大语言模型 VS 特定语言模型

00:08:30 GPT-3.5 中的 3.5 编号是怎么来的？

00:10:36 ChatGPT 中 G、P、T 三个字母以及微调的含义

00:18:26 特德·姜的文章比喻：ChatGPT 是人类知识模糊的 JPG

00:21:18 人工智能幻觉 AI Hallucinations 是怎么产生的，需要规避吗？

二、澄清关于 ChatGPT / LLM 的迷思

00:30:41 为什么 ChatGPT 是数学很差的文科生？它在做的不过是文字补全

00:34:41 近两年大语言模型的突破性进展：涌现、思考链路，但依然算不上通用人工智能

00:40:52 ChatGPT 敲开了自然语言用户界面 LUI 的大门

00:45:09 建硕经历的四次历史上的惊叹时刻，其中浏览器时刻与 ChatGPT 时刻极为相似

00:49:48 Web3 现在还相当于互联网的 1979 年，有改变人类世界的能力、但还未到火候，在行业里等待可能是危险的

00:53:51 中国有必要再做一个类似 ChatGPT 的大语言模型吗？

00:59:51 ChatGPT 与搜索引擎的关系和区别

01:01:33 ChatGPT 有没有自我 / 意识 / 人格？

01:13:14 如何看待杨立昆 Yann LeCun 教授的评价：ChatGPT 所应用的技术并无多大创新，只是在工程设计上非常优秀？

三、创业视角看 ChatGPT

01:15:36 ChatGPT 可能被应用的领域有哪些？

01:19:34 基于同一套 GPT 模型 API 开发的产品该如何进行产品差异化、构建竞争壁垒？

01:22:38 ChatGPT 这一次浪潮究竟是谁的机遇，产业链的价值捕获最终会落在何处？

01:28:43 国内外创业者在这条路上时间差吗？各有什么风险和机遇？

01:35:31 ChatGPT 会让人失业吗？

01:39:50 会用 AI 的人和不会用 AI 的人之间会形成更大的不公平吗？

四、AI 隐忧

01:42:13 ChatGPT 生成的内容（包括 AI 作图的作品）应该受版权保护吗？

01:44:45 ChatGPT 背后的语料是否可能涉及侵犯隐私或非授权的数据爬取？

01:49:48 未来互联网会不会充斥着 AI 生成了大量同质化 / 平均水平的语料，进而让未来的一代成为「迷失的一代」？

01:59:48 ChatGPT 不仅不会像抖音算法那样割裂世界，反而给人类一个世界大同的可能性

五、其他

02:10:07 AI 教育的重要性，以及建硕在实践的瀛海威互联网分享精神的传承

【名词解释】

1. ChatGPT 的核心是大型语言模型（详见第 4 点），及《ChatGPT 中，G、P、T 分别是什么意思？》。

2. 微调（Fine-Tuning）：这部分训练是在预训练之后进行的。该程序接受一项任务，然后针对更具体的数据在更小、更具体的任务上进一步训练它。

3. OpenAI 各代产品：GPT-1、2、3、4 、InstructGPT 与 ChatGPT

2018 年 GPT-1（开源）：首次让人工智能像人类一样「理解文字」、写出文字

2019 年 GPT-2（开源，1.5 billion 参数）

2020 年 GPT-3（未开源，175 billion 参数，45T 文本）

InstructGPT：专注于让其听懂指令

ChatGPT（GPT-3.5，500G 文本）：基于对话场景以及安全边界等进行加强，是 GPT-3 模型上进行微调的产物。

2023/3/2 GPT-3.5 API 开放：人人可用、接入门槛低

2023/3/15 GPT-4 上线，拥有多模态能力，可接受图像输入并理解图像内容

4. 自然语言处理（Natural Language Processing，简称 NLP）：是 AI 领域的一个子领域，旨在让计算机能够理解、处理、生成自然语言。

大语言模型（Large Language Model，简称 LLM）：是自然语言处理领域中的一种技术。LLM 可以基于深度学习算法构建的模型，通过学习大量的文本数据，可以对文本数据进行学习和预测。“大”指的是参数多、语料多。

特定语言模型（Specific Language Model）：是一种针对特定语种和领域的自然语言处理模型。它在大语言模型的基础上，使用特定领域的文本数据进行训练和优化，以提高模型在该领域中的预测和生成能力。

意图检测（Intention Detection）：是 NLP 领域的一种技术，旨在识别和理解用户在一段文本中的意图。在应用中，意图识别通常与语音识别和语音合成等技术相结合，以实现智能对话和交互。

实体检测（Entity Detection）：同样是 NLP 领域的一种技术，旨在从文本中识别出具有特定意义的实体，例如人名、地名、组织机构、日期、数字等。

5. 提示词（Prompt）：一种文本片段，包含了对输入数据进行处理的指令或提示，系统可以根据 Prompt 生成相应的输出。通常用于生成文本、回答问题等任务中。

6. 人工智能幻觉（AI hallucinations）：人工智能系统在生成输出时，所产生的一些错误或不合理的结果。这些结果通常是由于模型在训练过程中，所接受的数据不足或不平衡所导致的。

7. 涌现（Emergence）：从简单的算法、模型或数据中出现的意想不到的结果或行为。当神经网络的复杂性和训练样本的多样性超过一定规模后，就会有抽象的推理结构在神经网络里自发地涌现出来，这个过程是非线性的，量变导致质变。

8. 思维链路（Chain of Thought，简称 CoT）：用于描述神经网络中的信息流动和计算过程。这一概念试图复现慢思考模式的过程。

9. 通用人工智能（Artificial General Intelligence，简称 AGI）：与目前大多数人工智能系统只能解决特定领域的问题不同，AGI 可以具有类似人类的智能，能够在多个领域中学习和应用知识，处理和理解不同类型的信息，并具备自我学习和自我改进的能力。AGI 被认为是人工智能领域中最具挑战性和最具科学意义的目标之一。

10. AIGC（Artificial Intelligence Generated Content）：由人工智能自动生成的内容，这些内容可以是文字、图像、音频、视频等。

11. Yann LeCun 杨立昆教授：Meta AI 首席科学家，2018 年图灵奖获得者，CNN 卷积神经网络之父，是世界上最有影响力的人工智能研究人员之一。

12. BUI、TUI、CUI、GUI、GIUI、LUI：https://mp.weixin.qq.com/s?__biz=MjM5NzI0Mjg0MA%3D%3D&mid=2652376369&idx=1&sn=488d996d44e4d01a7c7d00d7892702f6&chksm=bd305f868a47d690bba06466c7e93df8c817169ab0cd4ea734e83f1df1433d3e046eb9a935ff&scene=21#wechat_redirect

13. 乔布斯与 GUI：1979 年，在一次对施乐的帕洛阿托研究中心（Palo AltoResearch Center）的拜访过程中，史蒂夫·乔布斯（Steve Jobs）发现了 GUI 的设计图纸和鼠标。随后便将它运用于 Apple Macintosh 的开发过程中。

14. DNS（Domain Name System）：一个用于将域名转换为 IP 地址的分布式数据库系统。

Netscape Navigator：第一个广泛使用的商业化 Web 浏览器，由美国公司 Netscape Communications Corporation 开发并于 1994 年发布。

15. 图灵测试（Turing Test）：一种测试人工智能是否具有智能的标准之一，由英国计算机科学家图灵在 1950 年提出。

16. HTTP 协议、HTML 协议、FTP 协议、Telnet 协议、Mailto 协议、Gopher 协议、NNTP 协议（大家感兴趣的话自行查定义哈……后台不让放这么多字于是我删掉了）。

17. 阿帕奇（Apache）：一款开源的 Web 服务器软件。它以高性能、稳定性、灵活性和安全性著称，可以满足各种 Web 应用的需求。

18. 红旗浏览器：中国自主研发的一款浏览器软件，由中国红旗软件股份有限公司开发，它是国内第一款支持 IPv6 协议的浏览器。

19. AI 军备竞赛 The AI Arms Race Is On：2023 年 2 月，Google 推出 Bard；微软推出 New Bing。国内百度类 ChatGPT 聊天机器人项目名字确定为「文心一言」（ERNIE Bot）；中国初创公司元语智能首发 ChatYuan。

20. 巴别塔：《圣经·创世纪》中的一个故事，讲述了人类曾经想要建造一座高耸入云的巨塔，以便让自己的名字传遍全世界，但被上帝惩罚，使得人类的语言不同，无法相互理解，于是他们停止了建造，分散到世界各地。这个故事被认为是对人类的骄傲和自大的警示，同时也是对人类语言多样性的认识和尊重。

【相关链接】

1. 建硕公众号中关于 ChatGPT 的文章（文末）

2. ChatGPT Is a Blurry JPEG of the Web（ChatGPT是网上所有文本的模糊图像），《降临》原作者、科幻小说家 Ted Chiang（特德·姜）发布于 The New Yorker 的文章。

3. 木遥《涌现》《涌现（续）》

4. A Conversation With Bing’s Chatbot Left Me Deeply Unsettled，出自《纽约时报》专栏作家、 Hard Fork 播客主播 Kevin Roose，他讲述自己花了两个小时体验 New Bing，得到了一场非常诡异的被 AI 示爱的体验。

5. “ChatGPT is 'not particularly innovative,' and 'nothing revolutionary', says Meta's chief AI scientist”，《Meta首席AI科学家：ChatGPT并无特别的变革创新》，Yann LeCun 杨立昆教授认为，与其说 ChatGPT 是一个科学上的突破项目，不如说它是一项成功的工程实践。

6. A16z《Who Owns the Generative AI Platform?》，这篇文章将 ChatGPT（或 AIGC）产业链玩家分为了以下几种：

实体基础设施供应商可能是迄今为止这个市场上最大的赢家，捕获了大部分的价值，占据了流经此的大部分资金。如底层的芯片等硬件制造商、云服务商（基本无创业公司机会）。

上层的 AI 模型开发公司，也就是创造最大价值的公司——即训练生成式 AI 模型并将其应用于新应用程序——并没有获得大部分价值。

终端的纯调用模型 API 的应用开发公司的收入增长非常快，但往往在留存率、产品差异化和毛利率方面苦苦挣扎。

7. 斯坦福大学心智理论论文：Theory of Mind May Have Spontaneously Emerged in Large Language Models

8. 百姓网 AI 教育负责人 ElfeXu 文章：《因 AI 而强大》《如何在遍布 AI 的世界里游刃有余地生活》

9. Hung-yi Lee 关于 ChatGPT 的原理剖析视频系列

10. 老华《关于 ChatGPT 的一些问题和思考》分享：王建硕视频号-直播回放-3月4日 ChatGPT 应用畅想小聚（00:11:00-01:50:25）。

11. 《ChatGPT 与人类未来：AI 茧房、安全漏洞与未知的社会形态》，来自硅谷 101 公众号文章，提到创新工场 CTO 王咏刚在朋友圈中写到：「悲观情况是：因为人类的极度懒惰，互联网被AI生成的、错误率普遍高于人类知识工作者的『灌水内容』占领，我们的孩子成为『迷失的一代』」。

12. 《AI 作图的版权属于作者吗？》 by 刘飞 Lufy

剪辑：二琳

制作：Sarah、我不跑调

展开

大家都在听

科技新视界：探索未来的无限可能

科技新视界：探索未来的无限可能

欢迎来到《科技新视界：探索未来的无限可能》！这是一个带你走进前沿科技世界的专辑，涵盖人工智能、生命科学、量子计算、航天探索、新能源、新材料等前沿领域。从人工智能如何重塑未来生活，到生命科学对人类发展的重要作用，再到量子计算带来的技术突破，以及航天技术如何推动人类探索宇宙等等，这里将为你一一解读。无论是AI生成内容的创新，还是低轨卫星星座的全球通信，我们用通俗易懂的方式，带你领略科技的魅力，开启智慧生活的大门。快来一起探索未来的无限可能吧！

耶格系统-悦享听书友会-汪广辉-领导力

耶格系统-悦享听书友会-汪广辉-领导力

1、悦享听书友会-一所免费的没有围墙的大学 2、英特莱德国际企业(中国)市场咨询顾问(18750六二0192) 3、耶格系统汪广辉团队 “一个人活不出他认知以外的样子，人生最大的风险，就是学错东西!” 我们的使命: 第一、影响一亿人读书学习; 第二、帮助1000户家庭实现财务自由。第三、帮助1000万人拥有健康观念。

有树Trees

用声音记录生命的档案，自然、生活、艺术互相观照与参悟，做生活的艺术家。随时随地随心更新。

卢飞的读书和生活分享

卢飞的读书和生活分享

读书收获和生活感受分享哈 ~ 主要包括：生活，哲学，历史，教育，工作，休闲等。录制这个专辑的初衷是因为听了一本名人名言的有声书叫《句透人生》，感觉很好。她说：“人生像一场剧，不到最后，没有人知道接下来会发生什么。所以书名句透，它的本意是让充满人生只会的句子透露出我们想要的答案。为什么道理都懂，还是过不好这一生呢？这也说明了，富有哲理的句子不是用来教育的，而是用来提醒的。” 于是便有了这个专辑的录制。

富太太穷太太

富太太穷太太

这档专为中年女性打造的财商提升节目，我们追求的不只是搞钱，更是富足通透的人生状态。我们对谈超强个体，拆解成功路径，深挖可复制的实战经验。这里既有打破认知壁垒的财商思维，也有落地可行的财富驾驭方法，更有与金钱好好相处的系统性方案。不焦虑、不盲从在这里，让我们一起稳稳变富！

亏钱指南

分享的「千奇百怪亏钱姿势」，帮你避坑，少亏钱，也给你精神上的抚慰。项目没做好、买房亏了钱、交了冤枉钱、被骗、股权不合理散伙，都算

不白来

谁拿烂梗当名字啊。哦，是我们仨。三流主播做二本播客给一流听众，这无处释放的表达欲终于找到了出口。期望我们带来的内容丰富、多样、不太精致、但可能有用。为啥有用？每次“不白来”的背后，是精挑细选、充分准备、激情开麦和深夜剪辑。但愿不辜负自己，也不辜负大家。总之，初心不变，希望和大家成为天下第一好的互联网朋友。联系我们，VX：wncbubailai 订阅《不白来》，都不白来嗷。

少生病的老年：唤醒你的健康长寿基因

少生病的老年：唤醒你的健康长寿基因

《少生病的老年》是一本揭示健康长寿秘诀的生活方式指南，由世界医学专家卡米洛·里科迪(CamilloRicordi)撰写，受到2007年诺贝尔奖获奖者，世界干细胞峰会再生医学基金会主席、执行董事等来自全世界的科学专家推荐。作者以自己的研究和故事为线索，向读者展示了如何通过改善生活方式、饮食和保护分子来预防和逆转衰老，延长健康寿命，并对抗21世纪的三大流行病：非健康衰老、自身免疫性疾病和新型冠状病毒感染。这本书将讨论导致我们易患与年龄相关的慢性退行性疾病、病毒和自身免疫性疾病的危险因素，制定个性化的健康寿命干预措施，并评估此类策略对恢复活力或至少减缓生物衰老的有效性。并且，这本书深入探讨了衰老的机制，时光倒流不再是科幻小说中的假设，而是现实的目标。不变老是可能的，我们每个人都是健康长寿的缔造者。在本书中，健康长寿被总结成一套规则，遵循这些规则可以保护我们的身体免受细胞老化、炎症和免疫弱点的损害。本书是一本具有国际视野和前沿观点的健康长寿读物，既有引领性和启发性，又有可读性和普适性。本书的翻译水准也很高，原汁原味地保留了作者的语言和表达风格，同时也考虑了中国读者的阅读习惯和文化背景。本书适合所有关心自己和家人健康长寿的读者阅读，也适合所有对医学和科学感兴趣的读者阅读。本书希望能够帮助读者唤醒自己的健康长寿基因，过上少生病、更幸福、更长寿的生活。

我是妈妈，更是自己——活出丰盛人生的10堂课

我是妈妈，更是自己——活出丰盛人生的10堂课

《我是妈妈更是自己：活出丰盛人生的10堂课》通过写给妈妈的10堂自我管理课，不仅分享了“回归生活、持续成长” 的人生态度，也为她们提供了一个完整的成长路径——懂自己、爱自己、发展自己、成为自己。书中还提供了“幸福日志” “时间统计法” “布置餐桌” “引入减压阀” “记红账” 等便于操作的小练习、小工具，帮助妈妈们学习接纳滋养生命的外在环境，持续践行幸福生活的行动工具，重启丰盛自我的内在能量！

致命合作：蒋少情深似海

致命合作：蒋少情深似海

我是贪官的女儿我爸跳了楼，我妈失了踪，我弟白血病躺在床上生死未卜可，我生了癞蛤蟆想吃天鹅肉才有的野心就想成为《艳宠》投资人蒋守冬的女人他冷漠我、嘲讽我、挖苦我……让我从谷底跌入更深的腹地我恨他入骨，却在生死交界听到他怒吼： ——“苏桐，你若死，我便生不如死！”

评论(0条)

快来抢沙发吧！

打开蜻蜓查看更多

打开APP，高品质·离线听

沪ICP备06026464号-4 网络文化经营许可证

沪网文[2014]0587-137号

信息网络传播视听许可证：0911603

©2011-2019 qingting.fm ALL Rights Reserved.

应用名称：蜻蜓FM | 开发者：上海麦克风文化传媒有限公司

版本号：9.5.0 | 应用权限 | 隐私协议