#120 从考场到职场|AI智能体的新摩尔定律

00:00
41:41
主播信息
Ian言

Ian言

人人都是蜻蜓主播,欢迎关注Ian言
关注
科技慢半拍
1871
科技慢半拍是一档以科技话题为主,采用对话和讲述多种形式的播客节目,会涉及到最新的科学技术,信息化数字化前沿信息,以及对各个行业的洞察和发现,但是不追风、不赶热点,而是以慢半拍的节奏,用自然轻松的方式为听众带来新鲜的听觉体验。每周一更,敬请期待!
科技慢半拍
59
科技慢半拍是一档以科技话题为主,采用对话和讲述多种形式的播客节目,会涉及到最新的科学技术,信息化数字化前沿信息,以及对各个行业的洞察和发现,但是不追风、不赶热点,而是以慢半拍的节奏,用自然轻松的方式为听众带来新鲜的听觉体验。每周一更,敬请期待!
APP内查看主播
节目详情
【节目介绍】
别再盯着那个大模型榜单了!当所有AI都在榜单上刷出惊人高分,我们该如何判断,谁才是真正能解决问题的“智能体”?AI评估的战场,正从静态的“考场”移向动态的“职场”。一场关于“任务地平线”的竞赛已经开始——衡量标准不再是“知道多少”,而是“在没有人类干预下,能独立、可靠地工作多久”。这场评估中,我们发现了一条属于AI智能体的新摩尔定律。这不仅仅是一次技术指标的更替,它正在重新定义工作的边界,并悄然拆解我们熟悉的职业阶梯。本期节目,我们将穿透分数的迷雾,直抵AI能力演进的核心战场,探寻那条决定我们与AI如何共生的关键曲线。
【时间线】
01:03 现有的AI评估方法
11:46 METR的“任务地平线”测评
14:20 任务成功率的半衰期
22:57 “马拉松”式的职场模拟器
24:30 AI智能体的新摩尔定律
26:36 智能体能力提升的三大引擎
33:22 对人类职场的影响
...去小宇宙查看完整单集简介
在小宇宙查看该单集文稿
展开
大家都在听
评论(0条)
快来抢沙发吧!
打开蜻蜓 查看更多