FlexiAct— 清华联合腾讯推出的动作迁移模型


FlexiAct是什么

flexiact是由清华大学与腾讯arc实验室共同开发的新型动作迁移模型。该模型能够在提供目标图像的情况下,将参考视频中的动作准确地转移到目标主体上,即使在空间结构差异显著或跨域的异构场景中,也能实现精确的动作匹配和外观一致性。flexiact通过引入轻量级的refadapter模块和频率感知动作提取(fae)模块,克服了现有方法在布局、视角和骨架结构差异方面的局限性,同时保持了身份的一致性。该模型在人物和动物的动作迁移方面表现优异,具有广泛的应用潜力。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

FlexiAct的主要功能

  • 跨主体动作迁移:支持将动作从一个人转移到另一个人,或从人转移到动物。
  • 保持外观一致性:在转移动作的同时,确保目标主体的外观(如服装、发型等)与原始目标图像保持一致。
  • 灵活的空间结构适配:即使参考视频和目标图像在布局、视角和骨架结构上存在差异,也能实现动作的自然转移。

FlexiAct的技术原理

  • RefAdapter(空间结构适配器):RefAdapter是一个轻量级的图像条件适配器,主要用于解决参考视频和目标图像之间的空间结构差异问题。在训练过程中,随机选择视频帧作为条件图像,以最大化空间结构的差异性。这使得模型能够适应不同的姿态、布局和视角,同时保持外观的一致性。通过注入少量可训练参数(如LoRA模块),在CogVideoX-I2V的MMDiT层中实现灵活的空间适配,避免了传统方法中的严格约束。
  • 频率感知动作提取:FAE是一个创新的动作提取模块,直接在去噪过程中完成动作提取,不依赖于独立的时空架构。FAE观察到在去噪的不同时间步中,模型对运动(低频)和外观细节(高频)的关注程度不同。在早期时间步中,模型更关注运动信息;在后期时间步中,模型更关注外观细节。FAE基于动态调整注意力权重,优先在早期时间步提取运动信息,在后期时间步关注外观细节,从而实现精准的动作提取和控制。

FlexiAct的项目地址

  • 项目官网:https://www./link/feafb280b99f47d2e75d6008f73c15a3
  • GitHub仓库:https://www./link/d42d69e7f0bd978777cca54687d3f1b7
  • HuggingFace模型库:https://www./link/6de1de23aac1b51733a0c789de180879
  • arXiv技术论文:https://www./link/26f442e45f3939150bec252fdc0f6466

FlexiAct的应用场景

  • *制作:快速生成逼真的角色动作,降低拍摄成本。
  • 游戏开发:为游戏角色生成多样化的动作,提升游戏体验。
  • 广告营销:生成虚拟代言人的动作,增强广告的吸引力。
  • 教育培训:生成教学和康复训练的动作,辅助学习和恢复。
  • 娱乐互动:支持用户创作有趣的视频,提升娱乐体验。


# git  # 架构  # github  # http  # 是一个  # 也能  # 转移到  # 过程中  # 后期  # 清华大学  # 是由  # 互动  # 腾讯  # 主要用于 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: PixianAI抠图怎么修复瑕疵_PixianAI瑕疵修复与手动涂抹工具【步骤】  小米汽车OTA冬季大版本升级:新增和优化共计9项功能  Decart Lucy 14B:颠覆AI视频生成领域的革命性模型  2025年最佳AI流程图工具:效率提升秘籍  Google AI 在教育领域个性化学习路径的构建  孩子作文写不出来?教你用AI引导孩子构思,写出优秀范文  2025年QA工程师必备:五款AI自动化测试工具深度解析  AI营销软件Top 5:提升业务的终极指南  百度AI助手直接入口 一键直达官网入口  斑马AI怎样设置专注模式_斑马AI专注时段与干扰屏蔽【指南】  通义万相IP形象设计怎么用_通义万相IP形象设计使用方法详细指南【教程】  kimi如何收藏回答_收藏功能使用方法【技巧】  P&ID图完全解析:符号、应用及绘制指南  Sora AI:颠覆视频创作?OpenAI最新文生视频模型深度解析  怎么用AI帮你进行头脑风暴并分类?5分钟输出结构化创意清单  豆包Ai官方网页版入口地址_豆包Ai官网在线使用入口  Midjourney怎样写风格化提示词_Midjourney风格提示词写法【教程】  使用 Claude 4 和 n8n 实现 AI 工作流自动化  普通人如何用DeepSeek月入过万?2026最新赚钱路径全解析!  批改网AI检测工具怎么关联班级学生_批改网AI检测工具班级绑定与学生管理【步骤】  tofai官方网站入口 tofai在线网页版登录  如何用AI设计一个Logo?5个步骤教你打造专属品牌标志  AI Lead Generation: 解锁未来增长引擎,营销新纪元  提升房地产业务:AI语音助手赋能房地产经纪公司  AI赋能科研探索:Google Research创新加速科学发现  AI Excel公式生成工具有哪些_一键生成函数公式的AI工具推荐  Google AI Studio 中的提示词微调实验教程  Logic Pro 11更新全面解析:免费升级、AI功能与音乐制作流程  Google Gemini 在跨时区团队管理中的应用技巧  Notion AI整理笔记怎么用_Notion AI整理笔记使用方法详细指南【教程】  电脑硬件升级指南:旧电脑的回收利用与性能提升  简历没回改:利用AI润色让你的文字更专业  AI在建筑行业的革命:提升效率与优化流程  AI任务管理器终极评测:找到最适合你的效率神器  宝可梦朱紫:如何高效刷闪异色宝可梦,提升游戏体验  老电脑焕新:i5-2400搭配FirePro V5900 打造复古游戏利器  解密AI时尚摄影:打造完美形象的终极指南  GitHub Copilot CLI:终端中的 AI 编码助手  Vidu AI:使用Q1模型轻松创建电影级短片  研究学者如何利用现有资源提升学术影响力  AI视频创作新纪元:CogVideoX Flash模型深度解析  lumen5怎样从新闻稿生成社交视频_Lumen5新闻稿转社交视频步骤【社媒】  如何通过 DeepSeek 进行深度神经网络超参数搜索  AI赋能软件测试:自动化、智能化与未来趋势  利用AI自动化生成电子书:Make.com的终极教程  ChatGPT 处理非结构化数据并转换为 JSON 格式  Django与React构建AI音乐推荐:数据库集成实战指南  VideoInu AI 动画制作:教程、功能与Pro账户赠送  雷小兔ai智能写作如何优化语句_雷小兔ai智能写作语句润色技巧【攻略】  轻松生成二维码:免费AI工具终极指南 

 2025-05-09

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.