宇宙链 宇宙链
Ctrl+D收藏宇宙链
首页 > DOT > 正文

一张照片生成 3D 头像!苹果新模型击败 StyleGAN2,表情光线都能调

作者:

时间:1900/1/1 0:00:00

来源:量子位

随便一张照片,就可生成3D头像。而且光线真实,任意角度可调。

这是苹果的最新黑科技生成框架FaceLit。

正如其名,FaceLit的特色就是可以将人脸“点亮”。

“自带光环”的FaceLit在易用性上也不输同类,甚至更胜一筹——

进行3D建模时,需要的照片素材无需专门选择角度,数量上也只需一张。

甚至对表情、发型、眼镜等元素进行调节时,也不需要额外素材。

而传统的头像合成工具或者需要多张图片才能工作,或者对照片角度有刁钻的要求。

正是凭借这一创新,FaceLit获得了3.5的FID评分,较同类产品直接高出了25%。

改进式EG3D合成人像,光线信息单独处理

下面就来看一下FaceLit具体是如何实现头像合成的。

国内第一张数字银行卡已经正式发行:8月15日,国内第一张数字银行卡已经正式发行。经中国人民银行营业管理部批准,百信银行通过虚拟发卡系统发行的首张数字银行卡正式亮相。据悉,这张由中国银联和百度公司、百信公司三方共同推出的银行卡,同时集合了借记卡和贷记卡的功能于一身,申请时就可以获取几千元到五万元不等的额度。由于该银行卡没有实体卡片,完全存在于数字网络中,因此在安全上也采取了更多的防范措施。(财华社)[2020/8/20]

总的来说,苹果采用了将人物本体与光线分别处理再进行叠加的策略。

早期的三维人像合成工具在转换过程中可能产生形变。

而爆火的NeRF通过将场景拆分成具体因素,提高了3D图像合成效果,改善了这一问题。

但苹果团队认为,在可控性方面,NeRF仍存有不足之处。

于是,在EG3D框架的基础上,苹果创造了FaceLit的合成模型。

EG3D通过三平面解码器,赋予了二维卷积神经网络生成渲染3D模型所需深度参数的能力。

苹果团队对标准的EG3D训练方式进行了扩展,并将之转化成了FaceLit框架。

动态 | 第一张基于区块链的数字营业执照、第一张医保电子凭证在济南诞生:当前,济南不断推进“一次办成”改革提质增效,打造“在泉城 全办成”品牌,为人民群众带来更好的政务服务体验。济南高新区把区块链作为核心技术自主创新重要突破口,构建整体性数字政府,持续推进流程再造,在全国首创“政务服务智能自动化流水线”模式,创新打造“区块链+政务”服务系统,创造了“企业开办”仅需47分钟的全国最快速度,比承诺时限压缩75%,中国第一张基于区块链的数字营业执照、第一张医保电子凭证在济南诞生。高新区管委会办公室陈波介绍,“区块链用共识机制,密钥算法等,保证上链数据传输、传递、使用的安全和可信,上链数据使用,必须由数据所有者授权,真正实现了“我的资产我做主”。高新区“区块链+”智能政务服务模式,开启了全省乃至全国在政务服务领域应用区块链技术的先河,达到了国内领先水平。(舜网)[2019/12/24]

△FaceLit与传统EG3D渲染流程对比图

标准的ED3G使用相机位置p参数作为基本输入参数。

在建立GAN2操作时,苹果在EG3D的基础上加入了光照参数l。

动态 | 全国港口第一张区块链电子发票在招商港口蛇口集装箱码头(SCT)上线:据航运交易公布微博, 4月26日上午,招商港口在蛇口集装箱码头(SCT)举行全国港口第一张区块链电子发票上线仪式。10点50分,SCT副总经理姚胜兰宣布仪式启动。10点58分,货主代表劦福公司总经理曾杰办理提货办单手续并完成微信支付后,全国港口第一张区块链电子发票顺利生成。[2019/4/28]

不同p(左→右)与l(上→下)值下的初始图像

苹果选择了经过球形谐波方式简化后的Phong反射模型作为处理光源的物理基础。

光照参数l就是在这一基础之上独立处理得到的。

在自然界中,反射包括镜面反射和漫反射两种形式。

△不同镜面反射率条件下的效果对比

因此,苹果在ED3G模型中加入了镜面反射解码器和漫反射解码器。

声音 | 哈佛经济学家:比特币不过是一张“彩票”:据CCN报道,前IMF首席经济学家、现任哈佛大学(Harvard University)经济学和公共政策教授肯尼斯?罗格夫(Kenneth Rogoff)认为,目前比特币和其他加密货币不过是“彩票”而已。罗格夫周一在《卫报》撰文称,尽管一些人认为加密货币已经风光不再,而且正在不可逆转地下滑,但实际上很难说它们的价值真的会跌至零。[2018/12/11]

它们替代了可以直接得到颜色c、密度σ数据的三平面解码器。

△反射解码器流程示意图

通过对GAN2产生的数据进行再次解码,可以得到镜面反射率ks和漫反射率kd。

然后再通过两种反射着色器得到颜色c,密度σ则由漫反射解码器计算得出。

最终,FaceLit以与三平面解码器相同的参数渲染图像,并进行分辨率优化。

动态 | 招商银行开具银行业第一张区块链电子发票:据财经网消息,今日,招商银行深圳分行在为客户办理贵金属购买业务后,通过系统直联深圳市税务局区块链平台,成功为客户开出了首张区块链电子发票。这标志着,招商银行成为首批通过系统直接接入深圳市区块链电子发票平台的机构,也成为全国首个区块链电子发票的试点银行。[2018/11/1]

有的放矢设计训练策略,数据无需人工标注

生成框架已有,那就来到训练阶段,其特点在于训练过程中无需人工标注。

方法论层面,在训练时,团队使用了FFHQ、MetFaces和CelebA-HQ数据集。

对于不同的数据集,苹果使用了不同的训练方式。

FFHQ包含了7万余条人脸数据,其训练分为两个阶段:先在较低的分辨率下训练,再提高分辨率再次进行。

对于包含2万数据量的CelebA-HQ,训练不需要分阶段进行。

而对于更小的MetFAces,则只需要通过ADA扩容的方式,使用预训练的FFHQ进行优化调整即可。

定性地看,训练结果在机位、光源和反射高光等方面都有出色的表现,图中的细节也有所增强。

△FaceLit生成的头像唇齿部位的细节进行了明显重构

定量结果同样表明,FaceLit在FID、KID等指标上均优于包括标准EG3D在内的传统生成方式。

在使用FFHQ作为训练集的条件下,各生成方式的表现如下表,不难看出FaceLit拥有最低的FID和KID值。

而相比于英伟达的StyleGAN2,FaceLit的表现依旧出色:

光线准确度方面,FaceLit在使用三种不同训练数据集的情况下,与人工设定的标准值平均均方误差均低于0.01。

网友:人们低估了苹果AI

消息发出后,便有网友认为“这是对更重磅产品的预热”。

更有网友直接推测,FaceLit的出现标示着人工智能将进军AR和VR领域,苹果的混合现实将最终实现商用……

也有网友认为,FaceLit不会商用,否则苹果才不会以论文的形式发表。

针对FaceLit本身,也有网友表示,除了LLM,其他都是浮云,他们如果不开发LLM,就没有未来。

但这位网友同时也说,苹果可能已经在做了。

相应的,也有网友称人们“低估了苹果在AI领域的深度”。

所以各位网友对苹果在AI领域还有什么样的期待呢?

论文地址:https://arxiv.org/abs/2303.15437

GitHub地址:https://github.com/apple/ml-facelit

参考链接:https://twitter.com/AlphaSignalAI/status/1648361623004774400

标签:CELFACEACEELITCelebrityCoinNOFACE价格trace币怎么样ELIT币

DOT热门资讯
改變遊戲規則,區塊鏈技術和Crypto市場如何在體育市場中引領未來?

Crypto公司开始将自己与体育赞助联系起来,希望他们的名字出现在球队的球衣上或场边,从而带来更多的品牌知名度,并最终吸引新用户。以下是这些合作伙伴关系迄今为止的进展情况.

1900/1/1 0:00:00
Beosin | 深度剖析零知识证明zk-SNARK漏洞:为什么零知识证明系统并非万无一失?

随着数字资产和区块链技术的快速发展,数字隐私保护和安全性成为了越来越受关注的话题。在这个背景下,一种名为"零知识证明"的技术正在逐渐崭露头角.

1900/1/1 0:00:00
談談Layer2的激勵機制:Fiat-Shamir heuristic在FOX的又一次妙用

撰文:孟铉济,FoxTech首席科学家;康水跃,FoxTechCEO 前言 Layer1作为一种分布式系统,为了达成共识需要高昂的通讯代价,并且大量的计算也会消耗昂贵的gas.

1900/1/1 0:00:00
Bitget全球加密资产持有率调查研究:千禧世代是加密资产爱好者的主要群体

近期,Bitget进行了一项关于人口年龄层变化与不同世代周期,对于加密资产持有率发展进程的研究.

1900/1/1 0:00:00
明星公链陨落,Helium是如何把一手好牌打烂的?

原文作者:Jaleel、Leo,BlockBeats4月20日,Helium宣布已正式完成向Solana网络的迁移,然而社区反应却是一片唏嘘.

1900/1/1 0:00:00
金色早报 | PEPE市值突破15亿美元 24小时交易量近17亿美元

头条 ▌BRC-20代币过去24小时交易量突破450万美元金色财经报道,数据显示,比特币铭文代币Ordi现报6.73美元,24小时涨幅78.51%,当前总市值已达1.41亿美元.

1900/1/1 0:00:00