我们许多人所期待的事情终于发生了,艺术家起诉了几家人工智能公司以及一个艺术品存储库网站侵犯版权(投诉此处)。这是人工智能工具的终结吗?我不这么认为,我会尝试解释原因,这不会是对诉讼的详细研究,将会有更多时间来做这件事,这是我自己对投诉中错误的一些技术问题的看法,所以这并不是对法律的深入研究,因为我怀疑这可能不会进入审判阶段,稍后会详细介绍。我也知道这还处于非常早期的阶段,事情可能会发生变化,最重要的是,没有人能确定结果会是什么,这是我自己对目前第一份文件的早期猜测,我将根据需要更新和撰写进一步的博客文章。
索赔
三位艺术家正在对Stability.ai、Midjourney和DeviantArt提起集体诉讼、间接侵犯版权、违反 DMCA、侵犯公开权和不正当竞争。DeviantArt 似乎因“背叛其艺术家社区”而被列入惩罚范围,因此目前我将在本次分析中基本忽略他们的部分。具体到版权索赔方面,诉讼指控 Stability.ai 和 Midjourney 未经许可从互联网上复制了数十亿件作品,其中包括原告的作品。他们声称这些作品随后被被告存储,然后这些副本被用来制作衍生作品。
这是诉讼的核心。投诉非常明确,Stable Diffusion 和 Midjourney 制作的图像并非直接复制原告的作品,没有证据表明他们的作品之一被复制了,哪怕是近似复制。他们声称的事情相当离谱:“系统输出的每一幅图像都完全来自潜像,而潜像则是受版权保护的图像的副本。出于这些原因,每幅混合图像必然是衍生作品。”让我们来理解一下。每幅输出图像都是每幅输入图像的衍生品,因此按照这种逻辑,任何参与抓取 50 亿张图片数据的人都可以起诉侵犯版权。哎呀,我的训练数据中有不少图像,也许我应该加入!但我离题了。
论点大致如下:未经许可从互联网上抓取图像,然后被告复制、压缩和存储这些图像,并将这些副本用作“现代拼贴工具”来将训练数据中的图像拼凑在一起,这是因为机器不能像人一样推理,所以它们只是把东西拼凑在一起,因此所有图像都是训练数据中作品的衍生物。
技术
我认为该声明中的论点是有缺陷的,因为它没有准确 德国手机数据 地代表该技术,所以我将尝试快速解释 Stable Diffusion 或 Midjourney 等工具如何生成图像。接下来的内容摘录自我即将发表的文章,因此请继续关注更长的解释。
我喜欢将 AI 生成工具中发生的事情分为两个阶段,即输入阶段和输出阶段。输入阶段包括收集数据以创建数据集,并用于训练模型。在 Stable Diffusion 的情况下,它使用一个名为LAION 的数据集,该数据集有超过 50 亿个条目,包括指向网络图像(而不是图像本身)的超链接与其 ALT 文本描述的配对。然后,该数据集用于训练模型,我不会详细介绍模型,只需说模型是使用数据集训练的现实世界过程的数学表示,它可用于进行预测或决策,而无需明确编程来执行任务。有各种类型的模型,但 Stable Diffusion 和 Midjourney 都使用扩散模型(请参阅上一篇博客文章中的解释)。长话短说,扩散模型拍摄图像,向其添加噪声,然后将其重新组合。
但从实际角度来看,模型是什么呢?人们普遍误以为机器学习模型只是存储图像然后生成拼贴画,目前的诉讼中反复使用拼贴画这个词,所以它延续了这一神话。这时另一个模型就派上用场了,它被称为 CLIP,旨在提高 AI 模型在涉及语言和图像的广泛任务上的性能。该模型使用大量图像数据集及其相应的文本描述进行训练,并学会理解语言和图像之间的关系。这使它能够高精度地执行图像字幕和图像分类等任务。因此,AI 工具结合使用在重建图像上训练的扩散模型和 CLIP 来理解用于描述图像的单词。