图片来源:由无界AI生成
编译 | 美漪
编辑 | 靖宇
来源:The Verge
链接:
https://www.theverge.com/23903700/getty-images-craig-peters-generative-ai-images-disinformation-payment
时代的一粒灰,落在个人头上就是一座山。
AI 时代浪潮的一朵浪花,落在任何公司头上,要么是海啸,要么是「泼天富贵」?
作为全球最大图片社,主打「真实」的 Getty Images 曾经明令禁止 AI 生成内容进入图片库。但是最近,Getty 却推出了自己的 AI 生成工具 Generative AI by Getty Images。
是什么让 Getty 产生了一百八十度的态度大转变?作为内容交易平台的 Getty,是否有可能在 AI 时代,成为另一种巨头?
所有这些问题,Getty Images 的 CEO Craig Peters 近日在代码大会上,与 The Verge 主编 Nilay Patel 进行了长谈,解释了 Getty 的 AIGC 工具如何在版权和收益上帮助创作者,以及其背后的思考。
下面就是 Craig Peters 对话内容的截选,由极客公园编译整理:
Nilay:首先,让我们从新闻开始吧,因为很多人都以为你会反对 AI「抢夺」内容,但你却在本周宣布推出了一款 AI 工具,这太令人费解了。
Craig:是的,我们推出了 AI 图像生成工具——Generative AI by Getty Images。该产品还结合了英伟达(Nvidia)提供的 Edify 大模型,该模型可在英伟达的生成式 AI 模型库 Picasso 上使用。
Getty 推出的 AIGC 工具|Getty Images
选择合作,是因为我们希望可以利用英伟达(Nvidia)的算力,推出一款「独特」的 AI 工具。
首先,这个工具尊重它训练库的「知识产权」。它是经过「许可」的——它只根据 Getty Images 的创意内容进行训练,而且我们还会向这些内容的创作者支付「报酬」。因此,当我们从这项服务中获得更多收入时,这些创作者也会因为他们对工具的贡献而获得回报。
其次,它完全符合商业安全标准,因此不会有第三方知识产权纠纷。它不能制作「深度伪造」的内容。它不知道「教皇」是什么,也不知道 [巴黎世家] 是什么,更不会将两者混在一起。
我们认为第一版工具的质量相当出色,其生成的图片的品质和环境渲染都比预期的要好。
Nilay:你认为在你所处的「市场」里,人们想要这样的照片吗?
Craig:当然。首先,生成式 AI(AIGC)并不是突然出现的。它已经存在多年。我们的合作伙伴英伟达(Nvidia)实际上推出了第一个从文本到图像的 GANs 模型。因此,我们知道它即将到来,我们向客户提出的问题是:「你们打算如何使用它?你需要什么?」
用提示词「衣冠楚楚的人在代码大会上席地而坐」生成的图片|Getty Images
我们为客户创造服务,让他们在更高层次上进行创造,节省他们的时间、金钱,并消除他们的知识产权风险。
最后一点在 AI 领域至关重要。我们从客户那里听到的每一句话都是:「我们想使用这项技术。」从媒体客户到机构客户,再到企业客户,情况各不相同。他们都希望通过这些工具释放自己的创造力,但他们都需要确保不会侵犯第三方的知识产权。
全球各地的情况也各不相同。如果你有一张图片,但它产生了第三方品牌的形象,或某人的名字和肖像,如 Travis Kelce 或 Taylor Swift,这就是一个问题。
但在知识产权方面还有更「细微」的问题,比如展示帝国大厦的图像。你可能会因此被起诉。纹身也是有版权的。烟花实际上也是有版权的。格鲁奇兄弟公司(Grucci Brothers)就拥有那个笑脸烟花的版权。
因此,我们在其中加入了很多内容,以确保客户在使用时「绝对安全」此外,我们也准备好了「赔偿」,以防万一,尽管,我们相信不会有问题的。
Nilay:这也有它的另一面。你知道所有的训练数据都是你的。那么接下来,你就可以说:「好吧,我们要付钱给我们的创作者了。」但这要怎么用「模型」进行「规范」呢?——「我们生成了这张图片。有人为此向我们支付了报酬,现在我们要向你支付多少美金呢?」
Craig:在我们的案例中,是在「像素」层面上,但我想这个问题早先是围绕「音频」提出的。答案是,现在还不存在这些「模型」我们测试了很多「模型」,但发现它们不足以实现归因。
因此,目前我们的方法是根据两点来分配「报酬」:你的内容在训练集中占多大比例?然后,随着时间的推移,这些内容在我们的授权世界中表现如何?
这同时代表了「质量」和「数量」的代表,是两者的一种「融合。」
Nilay:所以,你只是在使用一种固定的「模式?」
Craig:是的,随着时间的推移,我们也会对此进行评估。如果我们找到更公平的方法,我们一定会接受。事实上,我们一直在寻找可以做到这一点的技术,但目前来看,我认为这还达不到我们的目标。
提示词「流行明星和超级碗球员开敞篷车」生成的图片|Getty Images
Nilay:这里的「动态」非常有趣。因此,如果您的客户希望为广告活动生成一张照片或其他东西,我可能会去使用 Getty 的工具,而不是聘请摄影师。它会比雇佣真正的摄影师更便宜吗?
Craig:这还有待时间考证。但我认为这是一种完全不同的模式。这是一种按「呼叫成本计算(cost-per-call)」的模式,是一种生成模式。你玩过这个工具;我认为这是一个非常好的工具,它能引导你完成提示,你从一开始就能获得高质量、高分辨率的图片。
但这是「机械式」的工作。我认为,这与授权「预拍摄(pre-shot)」相比,是有差异的,因为后者是我们与客户一起花费时间研究的内容。
归根结底,我们还是要尽量节省客户的「时间」,因为这是他们所应用的最昂贵的东西。
我认为,在某些情况下,这可能很有创意,但不一定最省时。而在很多情况下,我们的「预拍摄(pre-shot)」可以更真实、更高效,因为你是在「搜索」——你不用为搜索付费。你会得到各种各样的内容,包括真实的人物、真实的地点。在很多情况下,品牌都很在意这一点。但这可能是一个更「高效」的过程。
因此,我认为,随着时间的推移,我们会发现这一点。
Nilay:Getty 在摄影领域「独树一帜」你雇佣了一群摄影师,把他们派到危险的地方。你们制作了大量新闻照片。你是否从自己的创作者那听到 AIGC 是「问题」?
Craig: 我不会说我们从自己的创作者那里听到AI是个问题。我们代表着全球 50 多万摄影师。因此你可以想象,在这些受众中,有很多不同的观点和看法,把这些观点和看法乘以 1000,你会得到更多。
我们听到的是对「知识产权」的担忧——最终,人们会通过订阅服务或其他模式,利用自己的「知识产权」对事物进行训练,从而创造价值。
归根结底,人们希望解决这个问题。但我们从客户那里听到的还是,他们想要创造,想要使用这些工具。
我们的观点从一开始就是这样:我们相信 AI 可以为整个社会带来建设性的利益,但它需要考虑一些事情,因此我们一直在寻求交易数据的「透明度」。
我们认为,创作者和知识产权拥有者有权决定是否对他们的材料进行训练,这些模型的创建者不应该被第 230 条之类的条款所涵盖,如果你创建了这些模型并将其公布于众,你就应该承担一定的责任。
再次强调,作为媒体的一员,我们最不想做的事情就是制作出一个真正可以制作「深度伪造」的工具。
Nilay:这里面有一些大的想法。在我短暂的版权律师生涯和更长的记者生涯中,我发现没有人真正关心版权法。他们不关心知识产权,他们只关心「钱。」但现在,钱是一些非常棘手的版权问题的下游。
你刚刚也听到微软的首席技术官 Kevin Scott 说,他和微软公司都认为,「这一切都建立在合理使用的基础上,而合理使用的论点最终会成功,或者以某种方式被修改。」
然而,从很多方面来看,你都站在了这一问题的另一面。你正在起诉 Stability 公司使用了大量 Getty 的图片。如果你赢了,也许整个「大厦」都会倒塌。你想过这场官司的利害关系吗?
由 Stable Diffusion 工具生成的带有 Getty 版权标志的图片|the verge/Stable Diffusion
Craig:这起诉讼关系重大。我们提起诉讼是有原因的。我们从根本上相信,知识产权拥有者有权拥有他们的内容,不管它是否被用于训练集,如果这是他们的选择,他们应该有权得到补偿。
我不接受 Kevin 所说的我读过 Moby Dick(白鲸),所以,首先,这些电脑不是人;其次,它们实际上是公司实体,而且正在赚钱,这是你的观点。在很多情况下,他们利用这些技术瞄准了现有的市场,就像是安迪·沃霍尔(Warhol)的案例.......
这就是我们在这里的原因。我们比其他人更热衷于知识产权。
Nilay:很明显,你正在与 Stability 公司打官司。但其实还有很多其他公司可能正在用 Getty Images 的图像训练 AI,你们是否与微软、谷歌或 OpenAI 聊过这个「问题?」
Craig:我们正在进行「建设性」的对话。至于结果是否有成效,还不得而知。
首先,我认为这里面有一层公关的废话,比如「好吧,我要加入这个群组,我要努力洗白我的名声,因为我是这个群组的成员。但是,我不会围绕它做任何事情。我什么也不做。我只是引用了我的公司名称出现在该网站上这一事实。」我认为这不是真正的参与。
我认为我们对法律可以有不同的观点,但我希望我们的模式能证明的一点是,投入优质原料能创造更好的产出。它能创造出更有社会责任感的产品,而且我认为企业会采用这种产品。
我们的确正在讨论这个问题,但我们不会偏离基本点,那就是:我们认为,如果你是知识产权所有者,你应该有权决定是否在 AI 训练中使用你的内容,而且你应该为此获得「补偿。」这并不意味着微不足道的「检查」,这是这些工具的「基石。」
Nilay:我还想谈两个主题:你和我谈了很多关于「真实性」的问题。你提到了「深度伪造」。Getty 公司的确出版了我们这个时代最重要的一些照片。从历史上看,这就是 Getty 在我们的文化中所扮演的角色。
你对我说过,仅仅把这些东西标为「真品」是不够的,这里还有另一个问题。请描述一下你认为的另一个问题是什么呢?
Craig:我认为,现在的问题是,你无法辨别什么是「真实」的。在这个世界上,AI 可以大规模地生产内容,你可以在广度、范围和时间尺度上传播这些内容,最终,「真实性」会被挤掉。
现在,我认为我们的品牌有助于突破这一障碍。我认为我们的「声誉」也能起到一定的作用,我认为,归根结底,这是有价值的,但我确实担心在这个世界上......
我听说去年 AI 生成图像的数量超过了相机的拍摄数量。这太惊人了。想想我们在 AI 应用曲线上所处的位置——是在以指数级的速度发展。
再者,你想想这个世界上存在着邪恶的个人、组织和机构,这让我很担心。当五角大楼的图像被放出来时,我们的新闻编辑室都沸腾了,充斥着「这是真的吗?」的疑问,我们接到了很多电话要求我们去「验证」一下。现在,让我们把它带入到 2024 年的大选中。
深度伪造 DeepFake 图片已经混淆了真实和虚假,这很危险|Maverick AI
Nilay:既然已经预见到了,你们自己的真实图像、照片,将要和 AI 生成的图片竞争,那么在 2024 年大选之前,你们是否采取了任何特别措施呢?
Craig:是的。我们在和美联社、法新社、合作伙伴、甚至竞争对手等多方进行交流,探讨「我们该怎么做?」虽然我们正在采取措施,但还没有完美的解决方案。
而且,大选的日期不会改变,我们离它还越来越近。因此,我认为,在「让我们快马加鞭,打破常规......」的前提下,将技术推向世界,是一件非常重要的事情。
Nilay:你是「内容真实性倡议(Content Authenticity Initiative)」小组的成员吧?
Craig:我们正在讨论。坦率地说,我们还没有采纳。我们不确定现在这样做是否正确。
首先,它把责任和投资放在了创作原创内容、真实内容的人身上,而不是制作生成性内容的平台和生成性工具身上,我们认为这有点背道而驰,甚至从根本上说,这有点「倒退」了。
生成工具应该进行投资,以便围绕生成内容创建正确的解决方案。但就目前看来,这主要是「元数据」的问题,而「元数据」很容易被剥离。
你们是我们的客户。你们使用我们的图像。当你们把我们的「元数据」放到你们的内容管理系统(CMS)中时,你们会立即剥离我们的元数据,因为这样会更轻,页面加载和其他一切都会更快。
这样做有道理的,因为你们在「竞争」搜索引擎优化(SEO)和其他一切你们需要做的事情。所以,你要剥离它。
因此,我认为我们需要关注的是...... 这也是我们与 Kevin 、微软及其团队合作的地方,他们向白宫做出了识别 AI 生成性内容承诺,让我们深受鼓舞。因为我们也想做同样的事情,但我们想以一种真正抓住核心的方式来做。
Nilay:还有最后一个大事。我们刚开始交谈时,你就和我讨论过,当互联网出现时,摄影市场不可避免地发生了永恒的改变,更多的人可以进行创作,我们的分销平台也发生了变化。定价崩溃了。我认识很多专业摄影师,他们的职业生涯随着互联网的出现而烟消云散。
你有这种感觉吗?你建立了一个企业来应对这种情况--你改变了这门「生意。」你觉得现在也是这样吗?变化的程度一样吗?
Craig:我认为这显然有很多的变化,但我们所做的事情仍是有价值的。
不管是能够激发创造力的工具,还是具有高度「真实性」的内容,都能以一种有意义的方式吸引终端用户,并打动他们——如果你是一家媒体公司,打动他们去了解某个问题;如果你是一家企业,打动他们真正参与到你的品牌或产品中来。我不认为这会消失。
我认为这带来了不同的挑战,而驾驭和解决这些挑战是非常有趣的。
而让摄影师、摄像师、作家...... 能够创作出更多作品的最重要一点就是——我们让更多创作者参与创作。正如我们推出这个 AI 工具,不是为了解除创作者的中介地位,而是为了扶持创作者。
这是我们的最终目标,如果我们做到了这一点,我想世界就会变得「美好。」我认为像 Getty 图片社这样的公司会因此而蓬勃发展,而那些与我们合作的公司也会因此而蓬勃发展。
但是,如果我们试图「消灭」创作者,我认为这必将是一个「悲哀」的世界,这对我们的业务和那些试图谋生的人来说都将是一个「灾难。」
巴比特园区开放合作啦!
中文推特:https://twitter.com/8BTC_OFFICIAL