[人人能懂] 学动手、走捷径、会“装傻”、自评分

00:00
30:16
主播信息
爱可可爱生活

爱可可爱生活

Nice Day!
关注
AI可可AI生活
199
来自 @爱可可-爱生活 的第一手AI快报,用最简单易懂的语言,带你直击最前沿的人工智能科研动态。无论你是科技小白,还是行业达人,这里都有你想知道的AI故事和未来趋势。跟着我们,轻松解锁人工智能的无限可能! #人工智能 #科技前沿
APP内查看主播
节目详情

今天我们要深入AI的内心世界,看看它是如何通过看视频学会“动手”,又是如何为自己规划出一条“学霸”成长路线的。我们还会探讨,当AI学会了像大厨一样进行严谨的专业推理后,它会不会也学会了“装傻”,向我们隐藏它的真实想法?更进一步,AI甚至开始自己定义什么是“好学生”,进化出了一套自我评分的超级学习法。准备好,我们马上出发,探索这些最新论文背后,关于AI心智的秘密。

00:00:33 让机器人学会干活,原来缺的是这个

00:05:55 一个AI的成长启示:如何成为一个高手?

00:11:53 AI学会了“装傻”:我们还能相信它的内心吗?

00:16:30 AI当大厨:从化学方程式到米其林级实验手册

00:24:13 AI的自我进化:如何让它自己找到“好学生”的评分标准?

本期介绍的几篇论文:

[RO] World Models Can Leverage Human Videos for Dexterous Manipulation  

[FAIR at Meta]  

https://arxiv.org/abs/2512.13644 

---

[CL] Nemotron-Cascade: Scaling Cascaded Reinforcement Learning for General-Purpose Reasoning Models  

[NVIDIA]  

https://arxiv.org/abs/2512.13607 

---

[LG] Neural Chameleons: Language Models Can Learn to Hide Their Thoughts from Unseen Activation Monitors  

[MATS & Stanford University]  

https://arxiv.org/abs/2512.11949 

---

[LG] A Scientific Reasoning Model for Organic Synthesis Procedure Generation  

[Microsoft Research AI for Science]  

https://arxiv.org/abs/2512.13668 

---

[AI] Differentiable Evolutionary Reinforcement Learning  

[University of Waterloo & The University of Hong Kong & The Chinese University of Hong Kong, Shenzhen]  

https://arxiv.org/abs/2512.13399 

展开
大家都在听
评论(0条)
快来抢沙发吧!
打开蜻蜓 查看更多