3 月 8 日消息,周一,来自谷歌和柏林工业大学的一组人工智能研究人员推出了史上最大的视觉语言模型 ——PaLM-E,参数量高达 5620 亿(GPT-3 的参数量为 1750 亿)。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
PaLM-E 是迄今为止已知的最大 VLM(视觉语言模型)。作为一种多模态具身 VLM,它不仅可以理解图像,还能理解、生成语言,执行各种复杂的机器人指令而无需重新训练。它还展示出了强大的涌现能力(模型有不可预测的表现)。
据谷歌称,当得到一个高级命令,如“把抽屉里的米片拿给我”,PaLM-E 可以为带有手臂的移动机器人平台(由谷歌机器人公司开发)生成一个行动计划,并自行执行这些行动。
PaLM-E 通过分析来自机器人摄像头的数据来实现这一目标,而无需对场景进行预处理。这消除了人类对数据进行预处理或注释的需要,使机器人控制更加自主。
PaLM-E 还很有弹性,能够对环境做出反应。例如,PaLM-E 模型可以引导机器人从厨房里拿一袋薯片,由于 PaLM-E 集成到了控制回路中,它对任务中可能发生的中断有了抵抗力。在一个视频例子中,一名研究人员从机器人手中抓起薯片并移动它们,但机器人找到了薯片并再次抓起它们。
另外,PaLM-E 模型也可控制机器人自主完成原需人类指导的复杂任务。除了机器人技术外,谷歌研究人员还观察到使用大型语言模型作为 PaLM-E 核心的几个有趣效果,其中一个是
PaLM-E 能表现出“正向转移”,这意味其可将从一个任务中学到的知识和技能转移到另一个任务中,相较单任务机器人模型能有更好的表现。
谷歌研究人员计划未来将探索 PaLM-E 在现实世界中有更多应用,例如家庭自动化或工业机器人,也希望 PaLM-E 能够激发更多关于多模态 AI 的应用。
IT之家曾报道,身为谷歌 AI 劲敌的微软近期也发表了「ChatGPT for Robotics」的论文,以类似的方式结合视觉数据和大型语言模型来控制机器人。
# 人工智能
# chatgpt
# 薯片
# 多模
# 几个
# 给我
# 一名
# 出了
# 还能
# 之家
# 中有
# 也可
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
网络优化91478 】
【
技术知识72672 】
【
云计算0 】
【
GEO优化84317 】
【
优选文章0 】
【
营销推广36048 】
【
网络运营41350 】
【
案例网站102563 】
【
AI智能45237 】
相关推荐:
数据集中化:提升AI效率,节省企业时间与成本的终极指南
通义万相AI绘画怎么用_通义万相AI绘画使用方法详细指南【教程】
AI CRM集成:提升客户关系管理效率的关键
Midjourney怎样加参数调细节_Midjourney参数调整技巧【指南】
OpenAI Codex最强攻略:提升AI编码效率的秘诀
提升效率:使用AI代理自动生成视频标题的实用指南
怎么用AI帮你解读复杂的学术论文?快速抓住核心论点和证据
服务合同模板:起草、签署和管理指南,提升业务效率
如何用AI帮你设计调查问卷?科学提问,精准收集反馈
AI视频播客制作终极指南:告别繁琐编辑,轻松发布!
百度输入法怎么去除ai模块 百度输入法纯净版安装教程
135编辑器AI排版怎样快速上手_135编辑器AI排版新手入门与功能介绍【教程】
Kling 2.0终极指南:AI视频创作秘籍,告别低质量
Vizeo AI视频生成器:无需技术,轻松打造营销利器
AI标语生成器:轻松打造品牌口号,提升品牌价值
ChatGPT怎么设置中文界面_ChatGPT中文设置步骤【方法】
Zapier MCP:AI赋能工作流,释放Claude强大潜能
解锁 Gemini Gems 高级用法:打造专属 AI 专家助手
ChatGPT怎样一键生成PPT_ChatGPT生成PPT方法【步骤】
N8N工作流:自动化知识管理与智能问答解决方案
AI如何一键生成PPT大纲_利用AI工具制作演示文稿方法【教程】
面试成功秘诀:如何巧妙回答常见面试问题
去哪旅行ai抢票助手怎样提升抢票速度_去哪旅行ai抢票助手加速包与多通道使用【技巧】
如何用AI帮你创建自定义表情符号(Emoji)?聊天斗图更有趣
AI卡通视频制作终极指南:轻松打造百万流量
DiagramMagic:AI驱动的在线图表生成器终极指南
ChatGPT 4o 辅助学生复习 GRE 词汇的方法
热门科技新闻:BetterHelp、Photoshop AI、AMD CPU及NVIDIA显卡
MAKA AI排版怎样设置动画效果_MAKA AI排版动画添加与参数调整【技巧】
OpenAI 播客精选:技术内幕、育儿经与AI未来
Depseek能否批量生成部门总结_Depseek多部门总结批量生成步骤【方法】
Mootion AI视频生成器:一键创作动画故事!
使用ChatGPT快速生成专辑封面:AI艺术创作指南
构建AI工作流:利用BuildShip低代码平台赋能Gemini和Google Cloud
文心一言怎么一键生成会议纪要_文心一言纪要生成与重点提取【指南】
2025年冷邮件营销:技巧、工具和成功案例分享
Vidu AI:使用Q1模型轻松创建电影级短片
通义千问怎么找新功能入口_通义千问新功能查找【攻略】
掌握写作技巧:小说情节设计的核心要素解析
VisualGPT: 免费AI图像生成、编辑及室内设计工具详解
颠覆认知!《小丑回魂》幕后:用爆笑台词颠覆你的恐怖想象
AI合同提取指南:利用智能实现高效采购和节省成本
AI症状自检:最佳AI症状检查器,告别网络庸医!
电脑硬件升级指南:旧电脑的回收利用与性能提升
豆包AI的发现页面有什么功能_探索热门智能体与话题
唇语解读的界限:名人的隐私与公众的好奇心
AI简历生成器:提升求职效率的智能工具
免费涨粉秘籍:Instagram快速提升技巧,告别粉丝流失
百度APP搜索框ai怎么关 百度APP搜索框ai图标去除
打造AI Jarvis:停止功能、联网、中文与人脸集成
2023-04-11
南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。