Midjourney 和其他生成网络的技术进步重新引发了关于标记人工智能生成内容的必要性的讨论。
标签可以保护社交媒体用户免受假新闻的侵害。但神经网络尚不具备在不降低生成质量的情况下向图像添加隐藏水印的技术能力。
该标记应该表明文件的 AI 来源,但 Midjourney 开发人员尚未实现此功能。
在图像生成过程中,神经网络采用随机噪声场,就像 黎巴嫩电报数据 旧电视屏幕上的模拟噪声一样,并逐渐细化它,产生轮廓和叠加滤波器。模型重复此序列,直到获得所需的结果。
标记可以通过创建神经网络可以识别的独特噪声模式的算法来实现。然而,为了使隐藏图案不降低图像质量,必须少量且不规则地嵌入。
此类标记在图像的小区域中可能更明显,其中图案显示为单独的元素。大型语言模型 (LLM) 的工作原理大致相同,即在预测标记的级别嵌入标记。
尽管 OpenAI 等公司声称这不会影响文本质量,但在比较标记和未标记文本时,差异有时是可见的,因此此类方法尚未广泛使用。
标记生成的图像有助于区分人工智能生成的内容和真实图像。例如,社交网络可以构建特殊的算法来识别隐藏的标志。
加载图像时,此类算法会扫描文件:如果找到隐藏模式,则会添加标签;如果没有,则图像将不带标签。
如果没有这样的标记,社交网络几乎没有工具可以自信地确定图像是否由人工智能生成。因此,向包括 Midjourney 在内的开发商施加压力,要求添加此类标签是合理的。
未来,大型服务可能需要包含隐藏标签以打击虚假内容。在假新闻传播的背景下尤其如此,而且许多人认为假新闻有真实的图像作为支撑。
有许多本地模型可以直接在用户的计算机上运行并生成质量不错的图像。在这些本地模型中,没有提供标记,也没有人可以强制这样做。
就主题而言。 Midjourney 6.0新版本:如何编写查询以获取商业利益
神经网络将如何演化
起初,中游注重生成质量,后来逐渐开始增加产品的复杂度。立即创建一个非常复杂的系统是不可能的:开发必须分阶段进行,从简单到更复杂。合乎逻辑的步骤是逐步增加功能。
可以假设,一年内就可以上传小照片,神经网络会将其构建成完整的场景,甚至 3D 模型。