当前位置:周记财经 > 资讯 > 正文内容

AI大战进入实体化阶段 谷歌刚发布的PaLM-E模型有哪些亮点?

更新时间:2026-06-28 02:33:08 资讯3年前 (2023-05-18)54
  本周老牌AI大厂谷歌与柏林工业大学的研究人员联合发布PaLM-E视觉语言模型,通过同时处理图像和语言文本,解锁人类与机器人交互的新篇章。  顾名思义,PaLM-E模型源自于谷歌的大型语言模型PaLM,E指的就是具象化。  研究人员介绍称,PaLM和ViT的结合,使得PaLM-E的参数量最高可达5620亿组,也是全球已知的最大视觉语言模型。  首先,具备视觉属性的AI模型将拥有解读图片并进行思维推理的能力。但随着PaLM-E模型赋予机器思考如何执行人类指令的能力,工业应用和工业设计上的突破也指日可待。  值得一提的是,作为AI大战的老对手,微软也已经在“图像+语言模型”的路数上有所布局。

  财联社3月8日讯(编辑 史正丞)过去几个月里,由ChatGPT引发的AI热潮向人类展现了通用语言模型的生产力前景。就在聊天机器人逐渐变成生产力工具之时,利用通用语言模型驱动真正的机器人也已经提上日程。

  本周老牌AI大厂谷歌与柏林工业大学的研究人员联合发布PaLM-E视觉语言模型,通过同时处理图像和语言文本,解锁人类与机器人交互的新篇章。

  顾名思义,PaLM-E模型源自于谷歌的大型语言模型PaLM,E指的就是具象化(Embodied)。通过将通用语言模型与视觉转换模型ViT相结合,PaLM-E成功实现让AI同时具备“理解文字”和“读懂图片”的能力,不仅能够输出文字,还能输出指令使得机器人的智能化跃上一个新的台阶。

AI大战进入实体化阶段 谷歌刚发布的PaLM-E模型有哪些亮点?

  研究人员介绍称,PaLM和ViT的结合,使得PaLM-E的参数量最高可达5620亿组,也是全球已知的最大视觉语言模型。

  回归到资本市场最关心的问题,这个听上去很厉害的AI模型,到底能干什么事情呢?对此研究人员也给出一系列案例,帮助外界理解这个模型的妙处。

  首先,具备视觉属性的AI模型将拥有解读图片并进行思维推理的能力。例如可以通过一张禁行交通标志(除自行车外)的图片,来解答“我能否在这条马路上骑自行车”;通过OCR识别餐馆的手写菜单,能进行账单的计算;或是通过识别一系列烘焙材料的照片,向机器人传达“制作蛋糕胚”的流程。

  在AI模型与机器人结合的实验演示中,机器人得到“从抽屉里拿出米饼”的指令后,能够顺利地从十多个开放式抽屉中找到米饼,拿给研究人员。

  在后续的实验中,研究人员还要求机器人“将所有色块按颜色堆放到不同角落”的指令,以及将“绿色色块推到乌龟旁边”的指令,即便机器人之前没有见过这只乌龟摆件,也能顺利地完成任务。

  虽然从演示视频中来看,受限于演示机器人较为简单的设计,执行指令的时候仍显得“笨手笨脚”。但随着PaLM-E模型赋予机器思考如何执行人类指令的能力,工业应用和工业设计上的突破也指日可待。或许在不久的将来,就会出现一款风靡全球的智能机器人硬件。

  值得一提的是,作为AI大战的老对手,微软也已经在“图像+语言模型”的路数上有所布局。在今年2月底发表的研究中,微软就展现了如何使用ChatGPT为大疆Tello无人机编写“找饮料”程序的案例。

相关文章

华尔街“大空头”看好中概股 大举增持阿里、京东

华尔街“大空头”看好中概股 大举增持阿里、京东

财联社5月16日讯(编辑 刘蕊)美东时间周一,美国证监会刊登的13F报告显示,华尔街知名“大空头”基金经理迈克尔?巴里(Michael Burry)在今年第一季度大举押注中国科技股,大幅提高了对京东和...

佳云科技(300242)盘中异动 股价振幅达7.67% 跌6.88% 报3.52元(05-16)

佳云科技(300242)盘中异动 股价振幅达7.67% 跌6.88% 报3.52元(05-16)

摘要:2023年05月16日佳云科技(300242)股价大幅跳水6.88%,该股报3.52元/股,振幅7.67%。 2023年05月16日13时01分,佳云科技(...

国脉文化(600640)盘中异动 股价振幅达7.04% 跌6.61% 报12.86元(05-16)

国脉文化(600640)盘中异动 股价振幅达7.04% 跌6.61% 报12.86元(05-16)

摘要:2023年05月16日国脉文化(600640)股价大幅跳水6.61%,该股报12.86元/股,振幅7.04%。 2023年05月16日13时01分,国脉文化...

华银电力(600744):MACD指标DIF线上穿0轴-技术指标上后市看多(05-16)

华银电力(600744):MACD指标DIF线上穿0轴-技术指标上后市看多(05-16)

资金流向数据,主力资金净流入398.19万元, 占总成交额9%, 其中超大单净流入123.60万元, 大单净流...

锦富技术(300128):重视气凝胶模切业务的困境反转机会

锦富技术(300128):重视气凝胶模切业务的困境反转机会

非经常性损益对利润的影响金额预计在5000 万至10000 万元。2019 年泰兴高新区管委会通过旗下主体以协议受让股份方式取得公司实际控制权。  从光电材料模切进军宁德时代气凝胶材料模切业务空间可观...

塔吉特Q4业绩好于预期 2023财年指引不及预期

塔吉特Q4业绩好于预期 2023财年指引不及预期

周二,塔吉特公布了强劲的2022年第四季度业绩,但对2023年的财务预测较为谨慎,因为市场对非必需商品的需求存在不确定性。数据显示,塔吉特2022年第四季度营收为314亿美元,同比增长1.3% ,好于...