他们给机器人造大脑,OpenAI红杉抢着投5亿

还记得曾经火遍全网的ALOHA家务机器人吗?最近,该项目的导师、斯坦福大学计算机科学和电气工程教授切尔西·芬恩(Chelsea Finn)在《X》杂志上宣布,她已经正式与其他几位伯克利丹尼尔学者和谷歌DeepMind科学家一起创业,为机器人构建智能大脑。

腾讯路宝盒子下架了吗

新公司的名字叫物理智能,简称Pi。目标是开发一套“为各种机械设备添加高级智能的软件”,最终建立一个通用的AI模型,可以控制任何机器人执行任何任务。

Chelsea Finn解释说,这实际上非常具有挑战性,它需要整合机器人的跨平台策略,从视觉和语言模型中转移学习,并通过模仿学习掌握灵活的技能。

联合创始人兼首席执行官凯罗尔·豪斯曼也对该项目将收集空前规模的机器人数据、改进算法和训练超大型模型以及解决将人工智能引入物理世界所需的所有技术感到兴奋。为此,他们组建了一支“世界级团队”,并迫不及待地开始了这场新的冒险。

公开资料显示,成立不到一个月,Pi已被包括OpenAI及其早期投资者Khosla Ventures、红杉资本和Lux Capital在内的多家风险投资机构提前锁定,并获得7000万美元的高额融资。这不仅是因为该公司在机器人赛道的技术前景极其乐观,也是对创始团队实力的信心押注。

十个人的团队,每个人都有一个大神和一个中国成员。

Pi的官方网站页面是这样介绍自己的:

“物理智能是一家将通用人工智能带入物理世界的新公司。

我们是一群工程师、科学家、机器人专家和公司创始人,我们正在开发基本模型和学习算法,以驱动今天的机器人和未来的物理设备。现在还在起步阶段,欢迎感兴趣的小伙伴加入!”

目前只列出了十个成员:

虽然展示方法“过于简单”,但团队阵容实际上相当豪华,几乎人均一个神。在加入Pi之前,他们都有自己的研发成果,其中有几个是业内知名的名字。

首先必须介绍的是除切尔西·芬恩和凯罗尔·豪斯曼之外的另一位联合创始人谢尔盖·莱文。

Sergey Levine目前是加州大学伯克利分校电气工程和计算机科学系的助理教授,主要研究自主智能体通过学习获得复杂行为的通用算法,专注于机器学习决策和控制领域。他还制定了端到端深度神经网络训练策略,并带领团队与谷歌共同开发了RT-X机器人项目,该项目被认为是强化学习领域的领军人物之一。

然而,让这个人出名的是他“学术狂人”的名号。谢尔盖·莱文在学术上被引用超过13万次。同时,他在顶级国际会议和期刊上发表了大量研究论文,他的接待量长期处于前列,他经常在排行榜上占据主导地位。

例如,在NeurIPS 2019年和2020年,他分别收到了12篇论文,在NeurIPS榜单中排名第一。2019年,收到的ICML论文数量并列第二。2022年,他向ICML贡献了30篇论文,并以16篇论文的收入登上了悬崖之巅——这简直是令人恐惧的“论文收割机”!

此外,谢尔盖·莱文也是伯克利颇受欢迎的“教授网络名人”,教育成就突出。他开设的深度学习课程(代号CS285)非常热情,深受学生欢迎。在线视频可以在石油管道和哔哩哔哩观看,而且传播范围很广。

在这份为新公司Pi撰写的“创业宣言”中,他表示希望为机器人领域带来类似“用于自然语言处理的大型语言模型”的通用解决方案。

“在过去,我们已经多次看到,机器学习在大规模数据集和小数据集上面临的问题是非常不同的。我们的研究具有很大的实用价值,我相信这也将为基础研究的突破打开大门。”

开头提到的切尔西·芬恩也是联合创始人之一。从麻省理工学院毕业后,她在伯克利获得了博士学位,其介绍元学习算法的毕业论文获得了2018年ACM博士论文奖。当时的教官是谢尔盖·莱文。

目前,Chelsea Finn是斯坦福大学计算机科学和电气工程助理教授,专注于通过学习和交互开发机器人和其他智能体的广泛智能行为。例如,端到端视觉感知和机器人控制,从收集的经验中自学通用技能,以及用于快速学习新概念和行为的元学习算法,谷歌引用了超过49,000次。她还在谷歌大脑担任了5年的研究科学家,开发了一个机器人深度预测模型。

Pi的首席执行官凯罗尔·豪斯曼是谷歌大脑的高级研究科学家和斯坦福大学的兼职教授。他的研究兴趣集中在使机器人能够在最少监督的情况下在现实世界中独立获得通用技能,他因“对可扩展机器人学习算法做出重大贡献”而获得2023年IEEE机器人和自动化学会行业职业奖。徐洪福 上海

豪斯曼在《X》中的自我介绍非常有趣:“我喜欢机器人、人工智能、NBA、哲学、足球和杏仁。”

除了这三位之外,球队还集结了布莱恩·伊切特;,前谷歌研究科学家,擅长机器人运动规划和基本模型;杰出的巴基斯坦工程师,前特斯拉自动驾驶和硬件专家(设计了Model X独特的上翻式猎鹰门),现就职于Anduril Industries,高级副总裁兼电气工程负责人;切尔西最喜欢的学生苏拉吉·奈尔;,丰田研究所机器学习、机器人和计算机视觉研究科学家;以及支付公司Stripe的前高管、著名科技投资人拉奇·格鲁姆等行业巨头。

引起我们注意的是,在这份名单中还有一位中国成员Lucy Shi。这位来自人大附中的女孩获得了南加州大学计算机科学学士学位,现在她是斯坦福大学的学生研究员,接受切尔西·芬恩教授的指导。他曾与英伟达高级研究科学家、通用身体智能研究团队负责人朱(Yoke Zhu)和高级经理范(Jim Fan)合作。

最近,她刚刚宣布了“对你的机器人大喊”(YAY Robot)项目,该项目是斯坦福大学和伯克利大学的合作项目,展示了机器人根据人类口头反馈从语音纠正、学习和持续改进到执行灵巧操作任务的实时改进的研究成果。

露西·施(Lucy Shi)高兴地在个人页面上分享了她作为“第一个实习生”加入物理智能的消息。

她在自我介绍中写道:“我对机器人学习有广泛的兴趣。研究目标是创造一种通用机器人,它可以无缝地执行我们日常生活中复杂和长期的任务…我坚信人类的创造力和人工智能的潜力。在未来的20年里,我希望成为一名大学教授,并建立新一代的贝尔实验室——一个将改变世界的创新思想工厂。这让我们很高兴看到又一位既有智慧又有理想、前途无量的年轻学者。”

智能机器人的大脑创造者迎难而上

在很长一段时间的科幻小说和电影中,人们总是梦想拥有一个真正理解他们需求的机器人。它可以思考,有情感,和我们在一起,帮助解决生活中的各种问题,像人类朋友一样多才多艺。然而,尽管现实中的机器人可以在工厂和清洁家庭中搬运重物,但与日益普及的聊天机器人相比,它们可以执行的任务范围相对有限。

Chatbot和LLM的兴起得益于互联网语料库中的海量数据。OpenAI和谷歌可以通过输入数十亿人类语言样本来训练大型语言模型。然而,从现实世界中收集类似规模的数据极其困难,这也限制了人工智能近年来在物理机器人领域的进展。

物理智能公司认为,现在是采用新方法推广通用机器人的时候了。

图01通过接入ChatGPT实现了人形机器人的智能“看、听、说”交互,让人看到了大模型与机器人结合的巨大潜力。Pi还希望将语言建模的先进技术与自己的机器控制和指令技术相结合,创建一个通用的人工智能系统,该系统可以在任何硬件和任何平台上使用,并具有广泛的任务执行能力。2020年双十一成绩

该团队表示,Pi并不专注于特定类型的机械臂或工业机器人,而是计划开发可应用于多种类型机器人的软件。他们不会制造自己的硬件。创业后的第一步是解决工程问题,建立模型,并购买各种机器人并在其上进行训练,目的是积累迄今为止最大的机器人数据。

在一次公开采访中,凯罗尔·豪斯曼强调该团队应该开发一个通用模型,将人工智能从计算机带到现实世界。“它可以为任何应用的任何硬件设备供电。“

而这显然不仅仅是Pi的愿景。除了面临Figure AI和特斯拉等制造人形机器人的公司的竞争外,几十年来人们一直在努力改进驱动机器人的软件。

就在圆周率公布的同一周,拥有7年历史的协变公司(Covariant Company)推出了基本模型RFM-1,为机器人提供类似于ChatGPT的语言理解和生成能力。该公司由著名人工智能科学家彼得·阿贝耳(Pieter Abbeel)和他的三名中国博士生创立经过通用互联网数据和丰富的真实世界交互数据的联合训练,RFM一号可以使机器人理解自然语言指令并生成相应的动作,并可以处理一些意外情况,赢得了很多好评。

如今,已经联手并正式加入战场的Pi已经来总结团队多年来积累的优秀成果了。再加上OpenAI背后的支持,我们能否集齐龙珠召唤神龙,推动通用机器人领域进入新时代?

“我们的目标是将人类的基本能力带给机器。”拉奇·格鲁姆说:“我认为制造人形机器人非常酷。但从根本上使人类变得有趣的是大脑,而不是我们的硬件——我们是最终的多面手。”

未经允许不得转载:科技让生活更美好 » 他们给机器人造大脑,OpenAI红杉抢着投5亿