生成式 ai 的上限在哪里?这个问题的答案或许在短时间内都不会有答案,至少现在生成式 ai 似乎又征服了一个新的领域。此前,生成式 ai 的工作范凑主要集中在文字处理、绘画、声音处理等方面,但是生成式 ai 的能力显然远不止于此。
近日,开源生成式 AI 公司 Stability AI 正式发布了 Stable Animation SDK,以及备受关注的 Stable Diffusion 模型(以下简称 Stable)也正式公布新版本,现在用户可以更好的控制 AI
生成的 3D 模型,并且对特定参数进行修改。
或许很多人看到这个消息的想法是:"3D 模型?是指方块、长条之类的东西?",毕竟在多数人看来,真正的 3D 建模复杂性恐怕是普通 AI 难以处理的。不过,生成式 AI 的魅力就在这里,通过对数据的处理与分析,配合对自然语言的理解,如今的 AI 可以根据描述生成更加复杂、完善的模型,并不仅限于简单的方块模型。
不仅仅是 2D 变 3D
在此之前,Stable 就因为可以将 2D 画面、描述直接转换成 3D 模型而引起了许多关注,Stable 生成的 3D 模型在精细度上虽然比不上专业人员花长时间搭建的模型,但是考虑到生成所需的时间,也足以带给大家不小的震撼。
而在 Stability AI 公布的最新演示视频中,Stable 的 3D 模型已经不仅限于静物,即使是一直在运动的人物形象,也可以轻松转变为 3D 模型,并且运动的幅度、姿势都与原版十分接近。类似的技术在动画制作中其实经常被用到,一些动画为了让画面、物体显得更具有立体感时,就会通过 2D 转 3D 的方式来制作这段画面,凸显画面的张力
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
图源:Stability AI
而在传统的动画行业里,想要将 2D 画面转为 3D,需要不少工作人员忙碌一段时间,而在 Stable 的帮助下,只需要将 2D 画面输入模型中,即可获得高质量的起始 3D 模型,大幅度降低建模所需的时间与成本。
当然,如果只是这样,或许也就从业者会高兴,对于广大网友来说,Stable 又有什么用呢?关键就在于 Stable 的 3D 模型生成并不需要精细的引导,即使只是简笔画,Stable 也可以生成出大差不差的 3D 模型,比如这幅如图幼儿园小孩般的涂鸦,经过 Stable 的 " 润色 " 后就变成了一个还算能看的 3D 画面。
图源:YouTube
Stable 渴望和追求的目标是让你的所有绘画作品和文字都能够栩栩如生地呈现出来。所以,Stability AI 的所有成果都是直接公开,以开源的方式提供给网友使用,对于广大二次元爱好者来说,或许这是让他们的 " 纸片老婆 " 们动起来的最简单方法。
而且从 Stable 的 3D 动态模型生成能力中,我们也可以看到一些未来的应用场景,比如更低廉、便利的动作捕捉系统,理论上只要算力足够,就可以通过摄像头捕捉的画面实时生成对应的 3D 模型动作。
除此之外还有什么妙用呢?不知道大家是否有看过近日的一个热闻,海外网红 Caryn Marjorie 通过与 AI 团队合作,用 GPT-4 复制了一个数字版的自己,然后将数字版的使用权以每分钟一美元的价格出售给自己的粉丝。
在短短的一周里,Caryn Marjorie 就以此获得了 7.1 万美元的收入,而她提供的仅仅是语音对话闲聊服务。作为视觉生物,我们对于声音的敏感度其实要低于画面,如果 Stable 也被应用到相关领域,是否可能打造出真正意义上的 AI 女友呢?可动、可聊,足以抚慰你空虚的内心。
咳咳,好吧,这个话题先打住,至少在目前的模型效率和算力规模下,个人想要实现实时且高规格的 3D 动态模型生成,恐怕还十分困难,但是考虑到半导体行业的进步速度,或许这一天离我们并不遥远。
全新的生产力工具
Stable 此前最大的问题在于只能根据描述或图像来生成 3D 模型,如果生成的效果不好,只能重新调整图像或文字信息来重新生成,根据显卡的性能不同,3D 模型的生成时间也会有所区别,相较于 ChatGPT 等传统问答式 AI,Stable 的时间成本高很多。
所以,虽然 Stable 的 3D 模型生成效果远优于以往的类似应用,使用场景却十分受限,仅仅是能够给社区爱好者提供一个简单便利的 3D 模型生成工具。一直以来,社区用户都希望 Stability AI 就可以给 Stabel 增加参数调整功能,这样就可以对不满意的模型细节进行修改。
Stability AI 给出的回应就是 Stable Animation SDK,该接口可以被加载到 Stabel 的模型中,用户在使用 Stabel 生成 3D 模型后,可以通过接口直接输入对应的参数,调整或增加模型的细节,让模型更符合用户的要求。
从接口的描述文件来看,支持修改的参数非常多,从基础的颜色、形状、大小、纹理到动作姿势等都可以进行调节,而且调节过程并不需要输入专业数据或是名词,只需要如图生成 3D 模型时一样输入文字信息即可。
比如你生成了一只小狗的 3D 模型,然后觉得小狗身上的花纹不太满意,只需要从接口输入你想要的花纹描述,Stabel 就会根据描述对模型进行修改并重新渲染相关图层。
除此之外,Stable Animation SDK 还支持动作命令的输入,可以让静态的 3D 模型直接执行你的动作指令,比如你渲染了一只飞龙,然后输入指令 " 让龙飞起来喷火 ",Stable 就会开始对 3D 模型进行动作渲染。
而且 Stable 还提供摄影功能,用户可以调整拍摄机位、照明效果、背景等一系列的参数,对 3D 模型进行静态和动态的录像。是的,大家估计都猜到了,3D 建模、3D 动画等与 3D 建模有关的行业,都将会感受到来自 AI 的 " 温暖 "。
部分网友认为,结合Stable平台和虚拟现实设备,有可能为虚拟现实设备的生产力带来飞跃式提升。大家应该都看过漫威电影《钢铁侠》,电影主角史塔克就拥有一个高级人工智能程序 " 贾维斯 ",在史塔克制造钢铁侠铠甲时给予了许多帮助。
其中一个片段就是史塔克通过对话直接生成了一个零件的 3D 模型,然后对其进行调整并应用到铠甲上,这套流程听起来是不是有点耳熟?没错,某种意义上这就是 Stable+ChatGPT 的未来版本,通过对话直接创造出 3D 模型,让设计师可以在虚拟现实设备中直接检视物品的外观、使用效果等。
将这个过程放到现实生活照,就相当于将产品设计中最耗时的打样、调整过程简化,实质性的提高产品从设计到落地的整个流程效率。此外,设计师可以通过利用虚拟现实设备的功能,提前使用和体验自己的产品。
当然,现在的产品设计流程中,其实就已经广泛利用类似的 3D 模型软件来渲染场景,但是 Stable 的优势在于生成的速度,本来需要数小时甚至数天进行调整渲染的模型,如今只需要十分之一或更短的时间即可生成,背后所带来的效率提升不言而喻。
随着生成式 AI 的遍地开花,可以看到 AI 对我们的社会、生产等方面会造成十分深远的影响,今天是 3D 模型,明天又会是什么?我非常期待。
来源:雷科技 Ieitech
# 而在
# 可以看到
# 可以通过
# 所需
# 等方面
# 就可以
# 一只
# 只需要
# 自己的
# chatgpt
# 就会
# gpt
# stable diffusion
# gpt-4
# 人工智能
# animation
# 接口
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
网络优化91478 】
【
技术知识72672 】
【
云计算0 】
【
GEO优化84317 】
【
优选文章0 】
【
营销推广36048 】
【
网络运营41350 】
【
案例网站102563 】
【
AI智能45237 】
相关推荐:
lovemo手机网页版 lovemo官方入口地址
百度ai助手快捷键怎么关 百度ai助手快捷键取消设置
AI如何一键生成PPT大纲_利用AI工具制作演示文稿方法【教程】
AI视频制作教程:从图像到病毒式Vlog全攻略
AI简历泛滥:虚假技能与企业衰落的深度剖析
怎么用ai制作表情包 AI个性化动态表情包教程【方法】
文心一言如何做本地生活探店文案 文心一言内容种草指南
百度AI助手官方入口 文心一言网页版登录入口
AI如何变革法律行政助理角色?未来发展趋势分析
Logic Pro 11更新全面解析:免费升级、AI功能与音乐制作流程
如何用 ChatGPT 快速生成短视频分镜脚本
Feelin聊天网页版地址 Feelin AI官方网站首页
百度输入法全感官ai怎么关 百度输入法全感官皮肤关闭
批改网AI检测工具怎样开启实时检测_批改网AI检测工具实时检测开启与延迟设置【指南】
豆包AI帮你写代码注释 豆包AI编程辅助教程
Replika AI:情感慰藉还是虚拟危机?深度剖析与用户反馈
ChatGPT一键生成PPT怎么加目录_ChatGPTPPT目录添加【步骤】
秀米AI智能排版怎样生成节日专题模板_秀米AI智能排版节日模板调用【技巧】
Base44 AI应用构建器深度评测:Wix 8000万美元收购的秘密
AI UGC生成器深度测评:四大工具横向对比分析
正确安装梁托:终极指南与常见错误规避
百度浏览器ai对话怎么关 百度浏览器ai聊天窗口隐藏
AI加持:2025年最佳人工智能潜在客户生成工具
RPGGO AI:颠覆传统!2D游戏创作新纪元
告别噪音:使用Adobe Podcast提升录音质量
泰米尔电影猜谜游戏:挑战你的电影知识极限!
音乐天赋自测:你天生拥有绝对音感吗?15个问题揭晓
VideoGen教程:AI视频生成器,无需拍摄快速制作视频
如何用AI设计一个Logo?5个步骤教你打造专属品牌标志
ChatGPT图像生成器完全指南:文化影响、伦理挑战与商业变革
机器学习赋能AI生产力工具:提升效率与智能决策
如何用AI帮你制定个人OKR?目标管理从未如此简单
使用Autogen框架进行业务分析和执行报告生成
轻松制作圣经视频:无需露脸也能赚钱的教程
服务合同模板:起草、签署和管理指南,提升业务效率
ChatGPT怎样一键生成PPT_ChatGPT生成PPT方法【步骤】
文本分类与聚类:网络安全中的自然语言处理应用
ASUS Armoury Crate深度评测:最新功能与个性化定制
Gemini 辅助进行博物馆数字化藏品分类建议
ChatGPT怎样用提示词设上下文_ChatGPT上下文设置技巧【方法】
AI赋能软件测试:自动化、智能化与未来趋势
怎么用AI帮你写一份有说服力的加薪申请?
AI营销软件Top 5:提升业务的终极指南
135编辑器AI排版怎样快速上手_135编辑器AI排版新手入门与功能介绍【教程】
即梦AI怎样生成产品描述_即梦AI产品描述生成与卖点提炼【实操】
普通人如何用DeepSeek月入过万?2026最新赚钱路径全解析!
智谱AI创意设计怎么用_智谱AI创意设计使用方法详细指南【教程】
文心一言怎么一键生成会议纪要_文心一言纪要生成与重点提取【指南】
AI赋能保险销售:提升邮件营销效果的终极指南
Gemini怎样写描述型提示词_Gemini描述提示词编写【攻略】
2023-05-26
南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。