这期聊大模型的开源和闭源,听起来有点技术宅的话题,其实是未来科技圈的大热门。请来了投资界的Spike,一起探讨了开源大模型是不是真那么“开放”,以及Meta为啥要开源它的LLAMA模型。还八卦了一下阿里和字节,他们是怎么在这个开源和闭源的游戏中找到自己的赚钱路子。
最后,我们还聊了聊国内大模型社区的热闹事儿,以及那些想在AI领域大展拳脚的创业公司们。这期节目,就是想带你一探究竟,在AI的世界里,开源和闭源到底怎么玩。
本期涉及专业词汇较多,可提前看shownote食用。
🎙 主播团队
嘉宾 Spike:一个对大模型技术充满热情的早期投资人。
Patric:身兼多职的投资界工作者,热爱智能硬件和小家电。
Eric:硬核博士,投资世界的探索者和挑战者。
圣冰:前华为、特斯拉等科技大厂员工,出海、硬科技长期顾问。
⌛️ 内容索引
- 00:03 开场与嘉宾介绍
- 00:26 Spike分享投资视角下的开源闭源重要性
- 01:05 讨论开源闭源对商业模式的影响
- 02:49 传统软件开源与大模型开源的区别
- 04:16 业界对开源大模型的真实性和透明度的讨论
- 05:54 判断模型开源的标准
- 07:54 从使用角度讨论开源与闭源的安全感
- 10:33 论文发布与模型透明度的关系
- 11:50 影响公司开源决策的因素
- 13:40 Meta开源策略的背后逻辑
- 15:10 开源是否能成为行业标准
- 18:04 技术进步的可持续性问题
- 20:04 OpenAI的免费策略与商业策略
- 21:19 大模型社区的现状与参与门槛
- 23:47 国内大模型社区的发展
- 25:34 国内大模型的备案问题
- 27:58 阿里的开源与闭源并行策略
- 29:12 阿里云的商业闭环
- 31:19 360的大模型联盟策略
- 33:42 字节跳动的AI应用与数据优势
- 36:17 字节跳动在AI领域的海外尝试
- 37:47 字节跳动使用的底层大模型
🧲 本期相关
- 大模型(Large Models):指规模较大的人工智能模型,通常需要大量数据和计算资源进行训练。
- 开源(Open Source):指软件或模型的源代码对公众开放,允许任何人自由使用、修改和分发。
- 闭源(Closed Source/Proprietary):与开源相对,指软件或模型的源代码不公开,由特定公司拥有和控制。
- Meta(Facebook):社交媒体公司Facebook的母公司,也是大模型技术的重要参与者。
- LLAMA:Meta开发的一个大型语言模型。
- 阿里云(Alibaba Cloud):阿里巴巴集团的云计算业务,提供包括大模型在内的多种云服务。
- 摩搭(ModelScope):阿里云推出的AI模型分享平台。
- 算力(Computational Power):指进行计算任务的能力,通常与硬件性能相关。
- API(Application Programming Interface):应用程序接口,允许不同软件之间进行交互。
- 模型训练(Model Training):使用大量数据来训练人工智能模型,使其能够执行特定任务。
- 数据污染(Data Pollution):指在模型训练过程中,由于数据集中的偏差或不当使用导致的模型性能问题。
- 多模态(Multimodal):指能够处理和理解多种类型数据(如文本、图像、声音等)的模型。
- token:在自然语言处理中,指文本中的一个元素,可以是单词、字符或其他语言单位。
- GPT(Generative Pre-trained Transformer):一种由OpenAI开发的预训练语言模型。
- DeepMind:Alphabet(Google的母公司)旗下的人工智能公司,以开发先进的AI模型而知名。
- 模型部署(Model Deployment):将训练好的模型应用于实际应用中的过程。
- AI人才储备(AI Talent Pool):指公司或组织拥有的人工智能领域的专业人才。
- 字节跳动(ByteDance):一家中国的科技公司,拥有TikTok(国际版抖音)等流行应用。
- 高斯(Gaussian):字节跳动推出的一款AI应用,可能与数学或教育相关。
- 模型天花板(Model Ceiling):指模型性能达到的上限,难以进一步显著提升。
📚 栏目介绍
在高流动性的噪声世界,成为一个优秀的滤波器,屏蔽生活中的噪声,找到你生命中的信号。
《信号& 噪声》是一档分享前沿的产品、技术和思考的泛科技播客。从作战一线的投资和产品视角,希望通过准确、长期、系统的追踪科技,与科技爱好者、创业者、投资人一起探索新变化,启发新可能。
🔍 关注我们
微博/小红书/抖音/公众号/B站:@信号&噪声
欢迎在评论区留言/小红书分享你的听后感,对于节目话题的更多观点,获取更多未呈现观点的拓展阅读,欢迎添加信号&噪音听众群参与讨论。
👥 制作团队
策划制作:Patric、Eric、圣冰
剪辑:Patric