EP 54. 深度对谈顶尖AI开源项目：大模型开源生态, Agent 与中国力量

倍速播放下载节目

00:00

03:19:06

节目详情

聊到生成式AI的发展，开源绝对是最关键的话题之一。这次的嘉宾，可以说涵盖了大模型开源领域最值得关注的公司：从顶流社区Huggingface, 到全球开源社区都关注的阿里通义千问 Qwen 大模型，堪称行业标准的 LLM 推理框架 vLLM, 还有最近最火的软件开发 agent 项目 OpenDevin. 真的是黄金阵容！

这一期节目也发布得很应景：就在今天凌晨，阿里发布了最新的通义千问 Qwen 系列模型！Qwen2-72B 的表现甚至全面超过 SOTA 的 Llama 3，大家赶紧去关注！

首先跟大家汇报一下，上周日我们在北京举办的 OnBoard! 第一次线下听友会真是超预期！开放报名4天就250多人报名，周日从上午9点到下午3点，从机器人到AI，创业投资和软件出海，100人的场地，直到最后都几乎座无虚席！真的是非常感谢大家的支持~我们正在努力整理精华文字稿，也请期待我们更多活动！

Hello World, who is OnBoard!?

回到这一期播客，我们将深入探讨大模型的开源生态。

在生成式AI飞速发展的一年多时间里，开源无疑是一个不可忽视的话题。开源模型的迅猛发展，从 Meta 的 Llama 3 到 Mistral 的最新模型，它们对闭源大模型如 GPT4 的追赶，不仅令人惊艳，更加速了 AI 场景下产品的实际应用。而围绕大模型的生态系统，从推理加速到开发工具，再到智能代理，技术栈的丰富程度，虽然已经孕育出了像 Langchain 这样的领军企业，但这一切似乎只是冰山一角。

特别值得一提的是，随着阿里千问系列、Deepseek、以及 Yi 等中国团队主导的模型在国际舞台上崭露头角，我们不禁思考，除了模仿和追赶，中国在大模型领域的发展是否还有更多值得我们关注和自豪的成就。

今天，Monica 有幸邀请到了几位极具代表性的重磅嘉宾，来自 Huggingface 的开源老兵，有通义千问 Qwen 的开源负责人（他也是 Agent 领域最受关注的项目 OpenDevin 核心成员），还有最具国际影响力的开源项目 vLLM 主导人。真是涵盖了大模型开源生态的各个领域的最一线视角！

嘉宾们都太宝藏了，我们的话题延伸到大模型的各个方面，录了近4个小时！我们前半部分聊了很多infra的创新，以及最近很火的、以OpenDevin 为代表的软件开发agent 背后的技术和生态等话题。下半部分，我们回到大模型开源的主题，畅谈了：

底层基础大模型的开源闭源生态，未来可能有怎样的演进？
开源模型商业化跟过去我们在大数据时代看到的databricks 之类开源商业模式有哪些异同？
如何做一个有国际影响力的开源项目？

还有数据、评测等等大模型领域的核心话题，真的非常全面，又不失一线从业者的深度。

索性就不分成两部分了，大家可以对着 show notes 里面的时间戳，直接跳转到你感兴趣的话题（虽然我觉得每个话题都很好！）

介绍了这么多，还要声明一下，节目里面重点聊到的开源社区 Huggingface，还有几个开源的项目，包括阿里千问、OpenDevin, Deepseek, 零一万物的 Yi，vLLM 等，都没有收取任何广告，完全是嘉宾走心分享，全程无广！当然，如果你们或者其他AI公司考虑赞助一下我们用爱发电的播客，我们当然也是欢迎的！

三小时硬核马拉松开始，enjoy!

嘉宾介绍

Tiezhen Wang, Huggingface 工程师，他可以说是中国与世界开源 AI 生态的桥梁，更是从 Google TensorFlow 时代到 Huggingface 早期员工，对中国和世界的开源 AI 生态都有极深的洞察。
Junyang Lin, 通义千问开源负责人，作为 Qwen 在全球开源社区的主要代言人，他不仅见证了开源的发展历程，还是目前备受瞩目的 Agent 开源项目 OpenDevin 的核心团队成员。
李卓翰，UC Berkeley PhD，他所主导的项目更是大名鼎鼎，就是已经成为行业标准的大模型推理框架 vLLM！他所在的 Sky Lab 被誉为开源基础设施的摇篮，从估值百亿美元的 Databricks 到 Anyscale（开源计算框架 Ray 的商业化公司）。他还深度参与了 Chat Arena, Vicuna 等多个国际知名开源项目，对大模型周边生态和 infra 的不仅有国际一线经验，更是有很多有技术理想的干货！
OnBoard! 主持：Monica：美元VC投资人，前 AWS 硅谷团队+ AI 创业公司打工人，公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻：莫妮卡同学

我们都聊了什么

05:28 嘉宾自我介绍，有意思的开源 AI 项目

18:37 vLLM 如何开始的，如何成为全球顶尖项目，为什么我们需要一个大模型推理框架？

30:24 Agent framework: OpenDevin 这样的负责 agent 会带来怎样的推理挑战？

40:37 做好一个编程 Agent，还需要哪些新的工具？多模态会带来怎样的变化？

56:16 我们需要怎样的 Agent Framework？为什么最适合开源社区来做？Framework 会收敛吗？

67:46 什么是 Crew AI? 如何看待 Multi-agent 架构？

73:11 借鉴前端框架的发展历史，如何理解一个框架如何成为行业标准？

77:54 Huggingface 上开源LLM现状，过去一年多有哪些重要进展？有哪些不同的开源方式？泽娜要给你看待一个开源模型的流行程度？

94:27 如何理解不同架构的开源大模型生态？Qwen 如何通过架构演进打造更好的开源生态？

104:59 中国的大模型开源项目有哪些创新？大模型架构有哪些变化？

112:17 为什么说新的模型架构可能会带来商业化的新机会？我们能从以前的开源商业化中学到什么？

119:22 我们看到现有大模型架构的天花板了吗？什么是一个新的架构？

128:03 Zhuohan 从参与最早的开源 LLM 之一 Vicuna 的经历学到什么？学术界和业界在大模型生态上如何分工？

140:48 用于大模型的数据集领域有哪些值得关注的进展？

149:42 Mistral 为什么这么快爆火？打造一流国际开源项目有什么可借鉴的经验？vLLM 有什么道和术上的心得？

166:13 Chatbot Arena 是如何开始的？为什么模型的评测那么重要？还有哪些挑战和可能的进展？

180:49 Zhuohan 对于 vLLM 商业化方式有什么思考？未来推理成本还有哪些下降空间？

188:17 快问快答：过去一年生成式AI发展有什么超出预期和不及预期的地方？未来还有什么值得期待？

我们提到的公司和重点名词

Qwen, Qwen-2
OpenDevin: opendevin.github.io
vLLM: github.com
Yi (Github), 零一万物
Chatbot Arena: huggingface.co
AutoGPT: github.com
crew AI: www.crewai.com
autoAWQ: github.com
LLM.c: github.com
Flash attention: github.com
Continuous batching：一种数据处理技术，用于将连续的数据流分批处理，以提高效率和可扩展性。
KV cache：键值对缓存，一种存储结构，通过键快速访问数据值，常用于提高数据检索速度。
Page attention：页面注意力机制，一种在处理长文本时，使模型集中注意力于当前页面或段落的技术。
Quantization：量化，将数据表示的精度降低到更少的比特数，以减少模型大小和提高计算效率。
Direct Preference Optimization (DPO): Your Language Model is Secretly a Reward Model
Google Gemini: deepmind.google
Adept: www.adept.ai
MetaGPT: github.com
Dolphinan open-source and uncensored, and commercially licensed dataset and series of instruct-tuned language models based on Microsoft's Orca paper
Common crawl: commoncrawl.org

参考文章

欢迎关注M小姐的微信公众号，了解更多中美软件、AI与创业投资的干货内容！

M小姐研习录 (ID: MissMStudy)

欢迎在评论区留下你的思考，与听友们互动。喜欢 OnBoard! 的话，也可以点击打赏，请我们喝一杯咖啡！如果你用 Apple Podcasts 收听，也请给我们一个五星好评，这对我们非常重要。

最后！快来加入Onboard！听友群，结识到高质量的听友们，我们还会组织线下主题聚会，开放实时旁听播客录制，嘉宾互动等新的尝试。添加任意一位小助手微信，onboard666, 或者 Nine_tunes,小助手会拉你进群。期待你来！

展开

大家都在听

世界这七天

世界这七天

《世界这七天》每周带来全世界在过去七天最值得关注的消息，致力于打破信息壁垒，带你跟上全球的信息步伐。【主播简介】 Fay，前国内一线电视台记者、导演，现移居海外，任海外华语媒体新闻主播。

东京脱线时间

东京脱线时间

一段基于东京的日常观察和过时信息，毫无章法聊天的对话录音。如果你对日本的鸡毛蒜皮感兴趣，但是想不严肃地了解，无论你身在日本，或者不是，都欢迎你来听且吐槽我们。我们的对话内容可能经不起推敲，欢迎随时来信反驳。又名： tokyodametime（东京没用时间）

拾一话：思辨性单口播客

拾一话：思辨性单口播客

拾一话是一档来自民间的思辨性单口儿播客风格极简不拖沓，内容独特接地气，观点有趣不含糊虽是来自寻常百姓家，但也能用故事给你启发因为再伟大的思想家也离不开柴米油盐酱醋茶

灵感成都

成都首档专注于文化创意领域的播客节目，由you成都、创意人冯伟、万物FM联合创制的文化分享类对谈节目，每周二18:00更新。今天人们谈论成都，离不开大熊猫、美食等传统符号，但“成都创造”在不断涌现，并且逐步在全国蔓延开来，这些创造背后，离不开人、方法、洞察以及城市生态，我们将之形而上为“灵感”。将从音乐艺术、现代时尚、传媒影视、创意设计、动漫游戏、会展广告等八大文化创意行业展开一季（16期）的声音灵感碰撞。

听起来不错！

听起来不错！

一档探索声音世界的创意节目，每期都会精心制作：从一个声音聊起，讲述它背后的故事，听听它如何融入我们的生活…… 我是这档节目的制作人迪卡普里鑫，一个关心声音的人，一名资深的播客制作人和声音设计师，也是一个小小作曲师和吉他弹奏者。相比于故事，我更关注声音本身，我相信中文播客需要更有「精良」的制作，更「专业」的声音设计，以及更「好听」的艺术效果。所以这档节目是我对以上内容的尝试，希望可以还原真实的听感、易被忽略的细节，以及它们触发的幻想。期待给你带来 Sounds good 时刻，或许偶尔也能带来一丝灵感 2026年正在努力持续更新中，争取双周更，谢谢你的收听，一定记得要订阅和关注…

【以文会友2】三月三歌圩

【以文会友2】三月三歌圩

“三月三”是我国南方各民族的传统节日，一个洋溢着浓郁民族风情的传统节日。它不仅属于壮族人民，更是中华民族多元文化璀璨星河中的一颗明珠。“三月三歌圩”是“三月三”节日活动项目之一，在本期节目中我们将通过文章朗诵来一起认识这一活动。

101个心理治疗难题书本内容与讨论

101个心理治疗难题书本内容与讨论

天南地北几位咨询师一起读书，探索《101个心理治疗难题》的奥秘。一念：国家二级心理咨询师、国家社会工作师观心空间儿童青少年专职心理咨询师；映雪：国家二级心理咨询师心理评估师；裘建萍：精神科主任医师，国家二级心理咨询师，中级心理治疗师；阿华田；卓玛：应用心理学硕士在读；

知否PRO

「知否Pro」是「BeyondPod 超声播」旗下一档和知乎MCN知否Pro合作的同名播客节目，旨在以知乎平台为中心，邀请各个领域的知乎答主（Power User）以及各行各业的专家，共同讨论知乎平台的热门问题和高赞回答，分享更多黑科技、冷知识以及有趣、有用的生活和职业建议。知否Pro作为一家专业的知乎MCN机构，和知乎平台各个领域的创作者都有非常紧密的合作，也为数码家电、健康食饮、美妆时尚等各个行业的国内品牌和国际品牌提供基于知乎平台的内容营销和兴趣电商解决方案。

科技新视界：探索未来的无限可能

科技新视界：探索未来的无限可能

欢迎来到《科技新视界：探索未来的无限可能》！这是一个带你走进前沿科技世界的专辑，涵盖人工智能、生命科学、量子计算、航天探索、新能源、新材料等前沿领域。从人工智能如何重塑未来生活，到生命科学对人类发展的重要作用，再到量子计算带来的技术突破，以及航天技术如何推动人类探索宇宙等等，这里将为你一一解读。无论是AI生成内容的创新，还是低轨卫星星座的全球通信，我们用通俗易懂的方式，带你领略科技的魅力，开启智慧生活的大门。快来一起探索未来的无限可能吧！

泰度Voice

来自最前沿的声音，助你洞察先机。我们定期邀请来自华泰证券的分析师、投行专家、投资人、技术专家，与您共同探索真正的长期价值。

评论(0条)

快来抢沙发吧！

打开蜻蜓查看更多

打开APP，高品质·离线听

友情链接：

沪ICP备06026464号-4 网络文化经营许可证

沪网文[2014]0587-137号

信息网络传播视听许可证：0911603

©2011-2019 qingting.fm ALL Rights Reserved.

应用名称：蜻蜓FM | 开发者：上海麦克风文化传媒有限公司

版本号：9.5.0 | 应用权限 | 隐私协议