宇宙链 宇宙链
Ctrl+D收藏宇宙链
首页 > TUSD > 正文

万字长文讲透AI艺术:缘起、意义和未来(上篇)

作者:

时间:1900/1/1 0:00:00

前言

今年 AI 艺术热潮源于海外 AI 技术在图像生成领域的革命性进步,以 Disco Diffusion、Stable Diffusion、Midjourney 等为头部代表的扩散模型(Diffusion Model)开始在数字艺术领域大放异彩!以其惊人的艺术效果和可绘制“万事万物”的无限性,在短短半年时间里,吸引了来自全世界数千万注册用户的实际参与、以及数亿人的关注与谈资。

时代洪流再度来袭,只不过这次的主角给予了 AI 技术。我们可以去质疑一种新的商业模式或者消费场景的市场有限性,但却无法不去敬畏一种新技术革新所带来的未来无限性,那是一场绝对的“无限游戏”!

缘起:细数几大模型

2022 年初,由独立开发者 Somnai 开发的 Disco Diffusion(简称 DD)在谷歌 Colab 云服务上正式对世界开放使用,4 月份开始在国内经很多设计与开源领域的大 V 传播至热,引发全民参与热潮,不限于如何使用这种 AI 生产力工具、AI 艺术与人类艺术之争、版权问题,乃至对现有各种视觉相关行业的冲击几何,纷繁复杂,不一而足,好不热闹。

紧随其后的是一个更为强大的 AI 艺术工具 Midjourney(简称 MJ)开始在 Discord 上建立全球第一个集中式的 AI 创作者社区,在短短两三个月内,仅靠这种自发的人人传播,社区规模便突破了一百万人,成为 Discord 有史以来规模最大的社区频道,蔚为壮观。

Coinbase:英国有能力成为全球数字和金融服务转型中心:金色财经报道,据Coinbase分享的最新消息,英国拥有令人印象深刻的创新基础设施,包括主要研究型大学和仅次于美国的金融科技投资水平。这“为英国成功孵化和接纳一些欧洲最大的科技公司做出了贡献。

鉴于需要依靠尖端技术来保持这一领先地位,英国政府现在正在就加密资产监管进行咨询,未来金融服务监管制度将针对加密资产进行咨询。该框架将“提供监管清晰度并帮助推动创新,并以消费者保护为核心。[2023/3/21 13:17:43]

2022 年夏天,众多科技巨头纷纷涉足 AI 艺术领域,以 OpenAI、谷歌、微软、百度最为积极,分别推出了 Dall·E 2、Imagen、Nuwa、文心一格。巨头成?还是社区成?成为这个夏天 AI 艺术发展进程中最瞩目的商业鏖战。

但这些都尚不足以将 AI 艺术带入到一个千亿乃至万亿级的消费市场中,一种技术只有具备建立超级大生态的能力才会被历史所辅证、被当下所青睐、被未来所铭记,就像曾经的 Linux、云计算、安卓、以太坊等在用生态来承载人类数字技术发展的 30 多年征途。而它们的继承者今天也逐渐崭露头角——Stable Diffusion(简称 SD)。

SD 自今年 8 月份面世以来,秉承“大开源”的精神和宗旨,不仅在短短两个月时间内让其背后公司实体一跃成为市值高达十几亿美金的独角兽,更吸引了全球数百万乃至上千万人积极参与其生态的建设,这场如火如荼的“去中心化运动”引爆了海内外的创业与投资热潮,因此其意义之深远远超对自身的影响,其福泽被于世界与万民。

瑞士银行家协会:稳定币在瑞士金融体系中的渗透率有限:金色财经报道,瑞士银行家协会发布了一份关于瑞士银行如何支持该国数字经济发展的白皮书,瑞士法郎“联合”存款代币是该小组确定的解决方案。

白皮书中称,稳定币在瑞士金融体系中的渗透率有限,即使端到端数字化在商业模式中变得越来越普遍,而且公众无法获得瑞士稳定币。作者建议使用各种稳定币,即“由受监管和充分监督的中介机构发行”的存款代币,通过智能合约发行和赎回,并以瑞士法郎计价。代币可以设计为基于分类账的证券,而不是一组指令,以提供最大的潜力。

此前2月消息,摩根大通发布研究报告称,银行发行的存款代币比稳定币更具优势,可用于DeFi和跨境支付。(Cointelegraph)[2023/3/17 13:09:31]

而所谓的“大开源”,包括开放核心 AI 算法模型(Latent)、开放核心训练数据集(LAION)、开放 AI 生成图片的版权(CC0)。这种三位一体的开源模式,让全世界所有普通人、极客、创业者、商业团体可以随心所欲地完成对 SD 的部署、运行、改进和商业化,且大胆使用全世界人利用 SD 所无私贡献的 AI 生成式图片,而不必受制于版权的束缚,大胆地去创新,让 AI 技术在视觉生成领域能够零摩擦地大跨步向前,不必受制于商业的条条框框而固步自封。

MakerDAO社区通过取消RENBTC-A金库的民意投票,12月7日后将启动清算程序:11月25日消息,MakerDAO发推称,MakerDAO治理部门通过取消RENBTC-A金库类型的民意投票,所有抵押率低于5000%的renBTC-A头寸将在12月7日投票确认后被清算。

Ren曾由Alameda与Ren前领导层合作收购,但由于Alameda的破产,Ren开发团队将禁用Ren 1.0铸造,并在30天后关闭Ren 1.0网络。根据风险核心小组的建议,禁用铸造意味着renBTC有可能脱钩,而禁用销毁意味着MakerDAO在有限时间内下架抵押品,以减少未来的潜在风险。MakerDAO治理部门批准一系列清算参数,在投票通过前,用户仍有机会避免清算。

据此前报道,11月21日,资产跨链协议Ren Protocol发推称,由于Ren 1.0网络将在30天内关闭,强烈建议用户尽快将其Ren资产(例如renBTC)桥接回原生链。Ren Protocol还表示,其目标是尽快推出完全由社区控制的网络Ren 2.0。

此前Ren表示,Alameda与Ren前领导层合作收购Ren,但由于Alameda破产,提供给Ren开发团队的资金仅持续到第四季度。目前Ren正在与投资者谈判以继续推动发展,并计划比预期更早地推出Ren 2.0。网站也将托管在IPFS上,并将控制权转移至RenDAO。[2022/11/25 12:34:37]

风靡国内外的 AI 艺术工具

路透社:截至11月20日FTX现金余额总计为12.4亿美元:11月22日消息,据外媒报道,根据周一提交给法院的文件,截至11月20日,已申请破产的加密交易所FTX的现金余额总计为12.4亿美元。文件称,到12月23日,FTX的现金流将从11月25日的4.79亿美元减少2000万美元,至4.59亿美元。

此前11月20日消息,FTX欠前50名最大无担保债权人共31亿美元。(reuters)[2022/11/22 7:56:12]

时至今日,DD 虽然在商业化上无法体现效率、边际成本、规模效应的优势,但其对 AI 艺术开源运动的引领地位被广泛认可,依然是更多新人入场所能够首先免费享受到的 AI 艺术体验,对于教学与用户教育的意义依然存在且无法被替代。

在美学角度,DD 对于色彩的大胆绘制往往令人“心驰神往”,但其并不注重逻辑性,具有极为强烈的“AI 风格”,这种纯粹追求对视觉的冲击效果也经常被壁纸类创作者所青睐,因此在抖音、小红书等社交媒体上经常会看到由 DD 所创作的“色彩美学”作品。几乎所有的国产 AI 艺术产品和工具都会首先集成 DD,是对开创者的致敬,也是对其独特美学体验的认可,这种风格不因技术的进化而过时,也许会历久而弥新,传承为 AI 艺术最初始的模样,愈发不可替代,则弥足珍贵!

Transfero CEO:FTX事件损害巴西人对CEX和行业的信心,但不会影响加密货币跨境支付:11月20日消息,法币入金服务提供商Transfero Group首席执行官Thiago César表示,FTX事件打击了人们对中心化交易所(CEX)和加密货币的信心。然而其影响不会影响巴西普通公民,他们仍然会使用加密货币进行跨境交易。

他还指出,围绕CEX的不确定性导致巴西交易所“大量资金外流”,许多人开始寻求进行自托管——估计迄今为止交易所至少损失20%的交易量。

César表示,FTX的崩溃可能会被当地交易所用作“游说工具”,以推动相关法规。这些加密交易所一直在巴西推动监管,通过取消国际交易所对其全球流动性账簿的访问权,将当地交易所和国际交易所“隔离”。“他们提议,例如,监管将强制执行巴西雷亚尔账簿的流动性与国际账簿分开。”(Cointelegraph)[2022/11/20 22:09:14]

DD绘制的中国二十四节气

AI 艺术领域并非由开源独撑,时至今日商业化最为成功的当属 MJ。而 MJ 不仅完全闭源,还倡导付费模式。这种底气当然来自其核心可控的技术、强大的产品、顶级的算法、不断进化的数据集,使得 MJ 的出图已经进入“大成之境”,不论从逻辑性还是细节都几乎与人类艺术家难解难分。迄今为止,MJ 共发布了四个版本,而每个版本都有其“致命性”的革新,如 v2 版的“美学”、v3 版的“逻辑”、v4 版的“无可挑剔”。每次的新版本发布都无不让全世界为之欢呼和追捧,这种场面不禁令人想到了当初 iPhone 从初代开始的每一场发布。有人戏称,DD 是塞班,SD 是安卓,MJ 则是苹果。戏谑之中,暗藏着历史的重演,未来已在此处,只是分布不均。

靠着不断进化的“深度”,MJ 全年都处于兴盛不衰的状态,是所有 AI 艺术创作者都顶礼膜拜的“冈仁波齐峰”。虽然 MJ 并没有进驻中国消费市场,但凭借着大模型(Big Model)之“大力出奇迹”的精髓,加上 MJ 每天都在扩充自己的训练数据集,这个扎根于海外的产物竟也十分理解中国元素。很多国内用户用它刻画古风、武侠、神兽、古建筑等系列,并燃爆了整个抖音和小红书的公域流量,好的作品点赞量都高达一百多万,比很多粉丝数上亿的头部主播发布的日常状态都高。也许在七八月份的时候,很多用户还能挑出 MJ 出图的各种问题和瑕疵,但今天更多的是折服与认可,随之而来的便是持续的商业化输出。MJ 的创作者群体已经逐渐从一开始的纯兴趣爱好慢慢扩展至使用 MJ 进行商业设计与变现的职业群体,涉及影视制作、游戏设计、UI 设计、原画、插画、壁纸、数字艺术、数字藏品、元宇宙视觉等多个领域数百万人的辐射。

MJ 目前将社群构建在海外社交软件 Discord 之上,从 0 到 100 万人仅仅不到半年时间,而更是在随后的两个月时间内从 100 万干到了近 400 万左右的规模。

可以说 MJ 社群的规模增长速度恰如其分地反映了整个 AI 艺术行业 2022 年的发展轨迹和无尽潜力。作为 AI 艺术皇冠上的明珠,MJ 的存在无疑给了从事这个行业的创作者和创业者更多的信心和鼓舞,因为它在不断证明——AI 艺术的进化是永无止境的!

AI艺术家AIBEN使用MJ创作的科幻作品

在技术基因上,SD 跟 MJ 有着太多相似、相比、相拼之处。比如出图时间都在 1 分钟以内,甚至秒级,这得益于像 SD 利用潜空间(latent space)极大地提升了扩散模型的绘制效率,将原本二维的像素空间画布降维至一维的潜空间,这不仅仅是压缩了时间,更让图像匹配人类描述的精准度大大提升,因此这类模型相比于初代的扩散模型更具商业落地可行性,可满足千万乃至上亿人参与的新消费场景。

时至今日,由 MJ 和 SD 领衔的 AI 艺术消费市场已经在全球突破了一千万用户的大关,并在疯狂地向一亿全球用户的新征程迈进。但 SD 目前在输出图像的艺术水准上相比于 MJ 还存在一些进步的空间,这与我们接下来要讲得息息相关,也是 SD 生态正在努力的方向。

目前 SD 生态由公司实体 StabilityAI 和 RunwayML 共同领衔推进,与此同时一些第三方社区力量也举足轻重,诸如 SD webui 项目、众多二次元改进项目、可用于训练 SD 新模型的 dreambooth 生态、可用于精准控制 SD 画面输出的交叉注意力技术方向等等。百花齐放,生态犹如热带雨林一般,可能每天都有生与死,但生生不息!

更值得注意的是,扩散模型技术大厦的构建更离不开众多上游大技术的鼎力配合,尤其指更精准理解人类语义的大模型技术、文本与图像多模态预训练模型(CLIP)、AI 艺术输出质量最为依赖的大规模训练数据集等。

SD 今天的成就离不开当初对 LAION 数据集的全力支持,其中大名鼎鼎的 LAION-5B 是用于训练下一代图像文本模型的开放式大规模数据集,高达 58.5 亿个图像-文本对,共 80T 数据,是世界第一大规模、多模态的文本图像数据集。

这个数据集的建立并非一朝一夕的工作,它是对互联网发展近 30 年的缩影,要对海量的互联网图片做大量的工作,诸如提供了图片过滤、水印图片过滤、高分辨率图片、美学图片等子集和模型,以供不同方向研究。这就是互联网的视觉 DNA!时至今日则由 CLIP、扩散模型等新一代 AI 技术进行编码演绎,去勾勒出互联网未来的模样——元宇宙时代。随着 LAION 的持续进化,SD 也会输出更加高质量的 AI 艺术作品,就像 MJ 那样。

诚如 StabilityAI 创始人 Emad 所言:“很高兴支持创建这个为下一代模型奠定基础的数据集。甚至更好的数据集正在开发中,它被设计为广泛的、可扩展的。现在我们将向着多样化、专业化和不断提高质量前进。”

SD绘制的“万事万物”

如今人类有了众多开源与闭源的 AI 艺术生产力,这其中有的可以直接进入商业生产,而有的则停留在娱乐体验,因此就产生了付费与免费的用户行为。对于极致水准的图像生成,用户付费的意愿也随之强烈,这便是 AI 艺术这个行业极为明确的发展方向,进化是永恒的使命!

(注:全文超万字,共分三篇,上篇以几大 AI 艺术模型讲述“缘起”,中篇以打破“十二道边界”讲述“意义”,下篇从最新技术动向的角度讲明 AI 艺术尚存在的进化空间,畅想“未来”)

巴比特资讯

个人专栏

阅读更多

金色早8点

比推 Bitpush News

Foresight News

PANews

Delphi Digital

区块链骑士

深潮TechFlow

链捕手

区块律动BlockBeats

DeFi之道

标签:RENIONFTXDAOGlobal Trading XenocurrencyetherdimensionFTX Users' DebtHDAO价格

TUSD热门资讯
细数2022年比特币的十大重要进展

价格暴跌和加密货币的崩溃占据了 2022 年的头条新闻,但仍旧可以认为 2022 年也是比特币取得重大进展的一年.

1900/1/1 0:00:00
一文了解以太坊 L2 生态最新进展

原文作者:Aylo (alpha please)这篇文章是关于以太坊 L2 的,我已尽力总结这个生态发生的事以及当前的景观,但我不可避免地会错过很多东西.

1900/1/1 0:00:00
无Gas的四种签名类型风险性对比

研究种类:Layer1, Gas, Singnature贡献者:Dewei 审核者:DAOctor 原文:Safe Signing 101如果用户能够自由交互而无需支付高额 gas 费.

1900/1/1 0:00:00
为什么Web3需要DeFi原生链?

“DeFi 原生链” 这一名词在 Berachain 和 Sei 初露头角时被市场窥见一隅,Sei 定义自己为第一条真正意义上的 DeFi 专用链,Berachain 也紧随其后抛出了为解决 DeFi 流动性而生的创新共识.

1900/1/1 0:00:00
四个关键事项让AI成就你的企业

为什么企业要向着“AI成就者”而努力?下图是一次针对企业AI成熟度及影响的研究结果,其 从宏观的角度评估了被调研企业在为客户、股东和员工实现更高回报的过程中.

1900/1/1 0:00:00
2022年最生态友好的区块链网络

文:ELIZABETH GAIL今年,加密行业朝着更环保、更节能的区块链方向进行了调整。2022年,随着越来越多的行业公司专注于可持续发展以减少碳排放,绿色加密项目持续推进.

1900/1/1 0:00:00