太好了是开源 3D 模型,我们有救了!

发布日期:2024-11-13 17:23

来源类型:优影酷剧 | 作者:佳那晃子

阅读提醒: 内容编辑丨特工女巫 排版审核丨特工少女 还记得在 23 年,女巫有一个遗憾。当时参与一个 AI 项目,想用 GenAI 能力让用户个性化地创作 IP 形象的玩偶、模型,或者包...
【2024新澳门】 【新奥天天免费资料单双】 【2024新澳精准资料免费】 【2024新澳精准资料免费提供下载】 【新澳开奖记录今天结果】 【新澳天天彩免费资料大全特色】 【澳门六开彩天天正版免费】 【7777788888新澳门正版】 【新澳正版资料免费提供】 【二四六澳门免费全全大全】 【新奥正版全年免费资料】 【澳门一码一肖一特一中管家婆】 【2024新奥资料免费精准051】

内容编辑丨特工女巫

排版审核丨特工少女

还记得在 23 年,女巫有一个遗憾。当时参与一个 AI 项目,想用 GenAI 能力让用户个性化地创作 IP 形象的玩偶、模型,或者包装盒的立体效果图。

但与团队讨论,结论是,由于市面上还没有很好的开源的 3D 模型可以用,其他技术方案开发成本又比较高,生成 3D 内容的想法于是作罢。

转眼一年不到,惊喜地发现混元上了个 3D 模型,可以轻松实现当年的预期效果了。

光说不做假把式,腾讯混元 3D 生成大模型已经与腾讯内部业务场景结合落地了,如 UGC 3D 创作、商品素材合成、游戏 3D 资产生成等。

此前,腾讯地图就利用混元 3D 大模型,上线了「自定义 3D 导航车标」功能。用户可以创作个性化的 3D 导航车标。

腾讯混元 3D 大模型,相比传统方案,使 3D 车标生成速度提升了 91.1%,生成成功率从 50% 提升至 97.4%,从个性化新意和效率上都提升了用户体验。

此外,元宝里的「3D 角色梦工厂」功能,也正是基于混元 3D 团队的技术。

用户只需上传一张五官清晰的正面头像,选择不同角色模版,就能迅速生成个性化的 3D 人物形象。3D 形象生成完成后,用户可以对形象从 360 度随意查看,也可以选择把形象分享公开,将 UGC 曝光到平台。

此前吴恩达在一次线上采访交谈中( 吴恩达,对 Agentic Workflow 持续兴奋 ),也表示了他对于 AI 业内开源闭源争议的看法。

吴恩达认为更多的开源会让世界变得更好,让很多人过得更好;闭源实际上是非常危险的,这不利于创新,不利于融入世界 LLM 的供应链中;开源带来的好处远大于闭源造成的伤害。

业内已经看到的如国内的通义、国外的 Llama 系列模型热衷开源步调,腾讯混元大模型也正在加速开源节奏。

自从上次 5 月 14 日混元将其文生图大模型对外开源,成为业内首个中文原生的 DiT 架构文生图开源模型。

就在今天 11 月 5 日,特工们注意到,混元宣布了最新的 3D 生成模型「Tencent-Hunyuan3D-1.0」正式开源,包括模型权重、推理代码、模型算法的全面开源;开发者可在 Huggingface、GitHub 等技术社区直接下载。

据悉, Tencent-Hunyuan3D-1.0 又是业界首个同时支持文生 3D、图生 3D 的开源模型?

论文地址:https://3d.hunyuan.tencent.com/hunyuan3d.pdf

3D 模型是 GenAI 多模态内容生成的关键,使模型生成能力更加接近现实世界真实立体事物的生产。

对于一个 3D 模型,可以从生成内容的质量、速度、泛化性角度考察。

1. 质量方面,经过多个维度测评,在两个公开的 3D 数据集 GSO 与 OmniObject3D 上, Tencent-Hunyuan3D-1.0 效果优于主流开源模型,并且生成质量上全面超过了 SOTA 开源模型,整体能力属于国际领先水平。

2. 速度方面,据官方公开披露,Tencent-Hunyuan3D-1.0 最快仅需 10s 即可生成一个 3D 作品,缩短的时长对用户来说是友好且效率的。

3. 泛化性方面,混元 3D 生成大模型可构建各类尺度、形态、场景的物体,大型如建筑楼宇,细微如花草动物。

为了提升上述提及的过往 3D 生成模型在生成速度和泛化能力上的不足,混元团队采用了两阶段生成方法,既保证基础的生成的质量和可控,又能加快生成速度。

第一阶段,腾讯混元采用的是一种轻量级的多视角扩散模型,它可以在约 6 秒内高效生成多视角图像。这一步的作用在于,将一个整体的复杂 3D 生成任务,通过不同视角捕捉的 3D 资产的纹理和几何特征,从单视角重建转化为难度更低的多视角重建任务。就好像一个美术生,对一个复杂立方体,先分别观察其各个面的细节。

第二阶段,腾讯混元引入了一种快速的重建大模型,利用上一阶段生成的多视角图像,这个模型能够在大约 3 秒内快速而准确地重建 3D 资产。重建模型的强大之处在于,它可以学习处理多视角扩散引入的噪声和不一致性,并利用条件图像中的可用信息高效恢复 3D 结构。最终,该模型可以实现输入任意单视角生成 3D 资产。就像上述美术生观察完各面后,还会主动学习思考如何更好处理各面的质量,最终制作一个 3D 作品。

总体来说,此次腾讯混元开源的 Tencent-Hunyuan3D-1.0,相较于过往的 3D 模型,在生成速度和泛化能力上有较大提升;不难想象,这样一款更强的 3D 生成大模型,可以帮助设计师、创作者、艺术家等自动化生产 3D 资产;在玩具手办、3D 打印、广告舞美等行业,用于数字或实物商品的制作,激发个性化创意,提高生产效率。

除此之外,在大语言模型方面,特工也关注到腾讯还开源了更强大的 MoE 开源大语言模型——「腾讯混元Large」,它具有以下几点特质。

1. MoE 混合专家结构:每一层都包含多个并行的同构专家,一次 token 的前向计算只会激活部分专家,是一种稀疏的网络结构,因而推理成本远低于同等参数的稠密模型,这使得混元 Large 可以在保证模型推理速度的同时,显著提升模型的参数量进而提升模型性能。 Large 模型还创新了路由策略,提出随机补偿的路由方式,有效提升模型内专家的利用率和稳定性,从而提升模型性能表现

2. 参数量和上下文长度:模型总参数量 389B,激活参数量 50B,上下文长度达 128k, 是当前业界参数规模最大、效果最好的开源 MoE 模型。(根据公开的测评结果,腾讯混元 Large 在 CMMLU、MMLU、CEval、AGIEval 等多学科综合评测集、中英文 NLP 任务、代码和数学等 9 大维度全面领先,超过 Llama3、Mixtral 等国外一流的开源大模型)

3. 高质量训练数据:LLM 的进步与数据密不可分,混元 Large 模型在天然文本语料库的基础上,利用大语言模型构建了高质量、高多样性、大量级的合成数据,提升了模型在长文、数学和代码等各个领域的性能。

4. 开发者友好:同时,混元通过技术优化,将 Large 模型变得更适配开源框架的精调和部署,对开发者来说很实用。

目前,腾讯混元大模型 PaaS 平台已开放支持包含混元 Large 模型在内的十余种混元 API 服务调用,可以满足企业及开发者对于不同模态(文生文、图生文、文生图)、不同专项(角色扮演、Function-Call、代码等)的模型需求。

1. github(开源模型工具包):https://github.com/Tencent/Hunyuan-Large

2. huggingface(模型卡片&模型上传):https://huggingface.co/tencent/Hunyuan-Large/tree/main

3. huggingface demo 地址:https://huggingface.co/spaces/tencent/Hunyuan-Large返回搜狐,查看更多

责任编辑:

【新奥门资料免费资料大全】 【2024新澳门正版资料大全】 【奥门平特肖】 【2004新澳门天天开好彩大全正版】 【新澳资料免费精准网址是】 【2024新奥精准资料免费大全】 【2024新奥资料免费精准】 【2024新澳资料大全】 【新澳2024正版免费资料】 【2024年澳门资料免费更新吗】 【新澳门彩出特生肖走势】 【新奥天天精准资料大全】 【新澳精准资料大全免费】 【7777788888澳门】
【澳门资料大全正版免费资料】 【2024澳门码今晚开奖结果】 【新澳最新最快资料22码】 【2024新澳免费资料大全】 【澳门2024正版免费资】 【新澳精准资料期期精准】 【新澳门资料大全正版资料查询】 【澳门天天免费精准大全】 【2024正板资料免费公开】 【新澳门出今晚最准确一肖】 【新奥天天免费资料单双中特】 【2024年新澳门正版】 【资料大全正版资料免费】 【777778888王中王最新】

下载中心

视频封面

视频名称:iPhone16低至5折!天猫最后一波政府补贴可叠加双11优惠

大小: 8.4GB 下载:(402793) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:4-0!林诗栋打败林昀儒,杀进决赛!法兰克福站:林诗栋干得漂亮

大小: 1.1GB 下载:(65461) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:以色列球迷被揍了一整夜,的确活该,2000年的流浪,每一步都算数

大小: 3.1GB 下载:(52291) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:泰鸿万立上交所IPO过会 已进入多个汽车架构平台的供应链体系一小学生踩脏地板,接连被语文、数学老师体罚,涉事老师被开除了

大小: 6.8GB 下载:(750497) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:特朗普胜选第二天美联储就降息 是“巧合”还是“别有用心”?天后那英澳门第二场演唱会依旧高朋满座,歌迷们在现场气氛好到爆

大小: 8.5GB 下载:(438463) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:两家“中字头”券商总经理人选敲定:邹迎光回归中信证券、金剑华履新中信建投

大小: 2.9GB 下载:(623683) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:秦安:伊朗要打、美国增兵,巴菲特清仓美股,大选酝酿颠覆性革命集市看到这“4种”东西掉头就走,大多都是假货,别花冤枉钱!

大小: 3.5GB 下载:(276934) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:太空手帐丨一觉醒来神十八乘组回家了 一起回顾这趟太空之旅

大小: 5.6GB 下载:(446509) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:专家分析丨德国执政联盟一夜“垮台” 提前大选或成定局?

大小: 7.6GB 下载:(16156) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:中国人民政治协商会议第十四届全国委员会委员名单

大小: 7.7GB 下载:(914138) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:扎克伯格逃过一劫3年前,宁夏7岁小女孩一笑走红,后拒百万签约,如今怎么样了?

大小: 3.5GB 下载:(280064) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:洪灏:市场目前处于纠结阶段 大家要有耐心有信心|首席对策

大小: 9.2GB 下载:(886429) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:持续更新|巴基斯坦火车站爆炸事件死亡人数升至26人

大小: 5.7GB 下载:(796477) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:评论|王志轩:“电力经验”领跑碳市场

大小: 1.3GB 下载:(14431) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:250年建筑被以军炸成平地 这座黎巴嫩世界文化遗产岌岌可危

大小: 4.3GB 下载:(772203) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:中国仍有较大举债空间!专家热议适合国情的“警戒线”

大小: 7.6GB 下载:(799357) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:迈沐智能完成千万级Pre-A轮融资,道生资本领投

大小: 3.4GB 下载:(815257) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:娱乐圈八卦吃?

大小: 9.2GB 下载:(5713) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:《再见爱人》是如何高开疯走的

大小: 2.1GB 下载:(785456) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:人工智能时代MTI专业创新人才培养论坛在上海财经大学顺利举办

大小: 4.4GB 下载:(915710) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:隔夜要闻 美股再创新高 特斯拉本周大涨29% 马斯克或加入特朗普政府 高盛调整美联储2025预测

大小: 1.7GB 下载:(920819) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:四大行大额存单利率跌破2%,揽储利器失灵?豆渣变身营养小饼,健康美味两不误!

大小: 8.3GB 下载:(100735) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:上班2天后离职,被告知工资抵扣工服…这种操作合法吗?

大小: 8.3GB 下载:(201413) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:纵论天下|崔洪建:中欧关系要行稳致远有五大方面值得关注

大小: 8.5GB 下载:(778842) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:“回到丛林”:大逃杀设定的生存游戏为何流行

大小: 9.8GB 下载:(460037) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:美联储降息靴子落地 各家银行美元存款利率调整不同步42岁男子未婚不愿相亲,被逼急,含泪讲出真相,63岁母亲追悔莫及

大小: 2.1GB 下载:(40414) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:【谭站长之家】2024年1月1日(周一) 和我一起读懂世界

大小: 5.1GB 下载:(928831) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:宅出新花样 8款桌游推荐 和麻将扑克说再见

大小: 7.5GB 下载:(313173) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:高价烘焙又杀回来了!企查查:2023年烘焙相关企业注册量首破3万美国版东鹏特饮:年入300亿,却被中国正主暴揍!

大小: 5.8GB 下载:(761929) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:罗永浩:未来还会带货直播,债主请放心,还债在按部就班进行

大小: 9.4GB 下载:(960557) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)
视频封面

视频名称:WTT冠军赛战报王曼昱4-1战胜陈幸同,晋级决赛锁定一枚奖牌

大小: 2.3GB 下载:(814204) 语言: 中文字幕 最后更新: 2024年11月14日

下载视频 (注:防盗链已开启)

评论

打开APP查看36条评论

乔舒华·鲍曼

4秒前

腾讯混元 3D 大模型,相比传统方案,使 3D 车标生成速度提升了 91.

杨正龙

6分钟前

当时参与一个 AI 项目,想用 GenAI 能力让用户个性化地创作 IP 形象的玩偶、模型,或者包装盒的立体效果图。

徐道营

3天前

2.

发表您的评论: