2025-02-01 14:30来源:本站
这一次是在2023年,OpenAI令人眼花缭乱的聊天机器人崛起。ChatGPT像真菌感染一样在转移,不断聚集。数十亿美元的合作关系成为现实,投资蜂拥而至。大型科技公司也加入了进来。像《Midjourney》这样的人工智能图像生成器获得了成功。
仅仅一年之后,人们的情绪就变得暗淡了。OpenAI首席执行官Sam Altman给公司带来了惊喜。利润和计算成本都非常高。但有一个问题最为突出,并有可能使这个羽翼未丰满的行业回归现实:版权。
法律上的抱怨已经发展成雷鸣般的合唱,科技公司表示,它们现在对生成式人工智能(可以创作文字、图片、音乐等的那种)构成了生存威胁。如果2023年是世界惊叹于人工智能内容生成器的一年,那么2024年可能是创造原材料使内容成为可能的人类报复的一年-甚至可能收回一些建立在他们工作上的价值。
在12月的最后几天,该报对微软(Microsoft)和OpenAI发起了攻击,声称“其数百万篇文章被用来训练自动聊天机器人,这些机器人现在作为可靠信息的来源与新闻媒体竞争。”《纽约时报》的诉讼加入了其他许多诉讼——仅举几例,由Images、by、by提起的集体诉讼——都指控那些希望从生成式人工智能中获利的公司在未经同意或赔偿的情况下使用了作家、记者、艺术家和其他人的作品,在此过程中侵犯了他们的版权。
——认知科学家加里·马库斯
这些诉讼各有各的优点,但灰色女士的进入改变了游戏规则。首先,《纽约时报》在塑造国家叙事方面具有影响力。另一方面,它是独一无二的诅咒;它包含了一个接一个的例子,说明ChatGPT如何几乎一字不差地复制新闻文章,并向付费客户提供回复,而无需注明出处。
不仅仅是诉讼:国会、研究人员和人工智能专家也在升温。周三,两名参议员和媒体行业代表一致认为,人工智能公司应该为他们用来训练模型的材料支付许可费。“这不仅在道德上是正确的,”举行听证会的小组委员会主席、康涅狄格州民主党参议员理查德·布卢门撒尔(Richard Blumenthal)说。“这是法律规定的。”
与此同时,认知科学家和人工智能专家加里·马库斯(Gary Marcus)和电影行业资深人士里德·萨南(Reid Southern)共同撰写的一份激烈的报告显示,Midjourney和Dall-E这两家领先的人工智能图像生成器都接受过版权材料的训练,并且可以随意反制这些材料——通常甚至不需要提示。
“我们的实验几乎可以肯定,这些系统实际上是在用受版权保护的材料进行培训,”马库斯告诉我,这些公司一直不愿明确回应这一点。“这些公司在使用什么方面远没有直截了当,所以确定他们使用的是受版权保护的材料是很重要的。”同样重要的是:侵犯版权的作品会在很少的刺激下从系统中溢出。“你不需要提示它,说‘制作C3P0’——你只需要说‘绘制金色机器人’。’或者‘意大利水管工’——它只会画出马里奥。”
这对任何以商业身份使用这些系统的人都有严重的影响。马库斯说:“那些财产受到侵犯的公司——美泰、任天堂——将会对此感兴趣。”“但用户也很容易受到攻击——输出中没有任何内容说明源是什么。事实上,软件无法以可靠的方式做到这一点。所以用户就陷入了困境,不知道它是否侵权。”
在一个简单的概念背后,也有一种势头正在形成,即创造者应该为价值数十亿或数百亿美元的人工智能公司所使用的作品获得补偿,比如谷歌和微软。生成式人工智能系统是其根源的观点在其批评者中越来越普遍,社交媒体上充斥着对人工智能的谴责。如果人工智能公司必须支付版权使用费或许可费,他们就会破产。就在本周,英国媒体报道说,OpenAI已经在英国寻求版权规则的豁免,声称该公司根本无法在不摄取受版权保护的材料的情况下运营。
OpenAI在提交给英国上议院的文件中表示:“由于如今的版权几乎涵盖了人类所有的表达方式——包括博客文章、照片、论坛帖子、软件代码片段和政府文件——如果不使用受版权保护的材料,就不可能训练当今领先的人工智能模型。”值得注意的是,安德森和OpenAI的声明都强调了受版权保护作品的价值,认为人工智能公司不应该为此付费。
他们能做些什么呢?
首先,他们以贫穷为借口。有太多的材料来补偿那些为他们的系统工作做出贡献的人,让他们的估值飙升。马库斯说:“这家估值1000亿美元的可怜的小公司负担不起。”“我不知道这能不能行得通,但这就是他们所争论的。”
人工智能公司还辩称,他们所做的事情符合合理使用的法律原则——这可能是他们最有力的论点——因为它具有变革性。这一论点帮助谷歌打赢了与大型图书出版商的官司,当时谷歌将图书复制到其庞大的谷歌图书数据库中,并击败了YouTube通过允许用户托管和发布未经许可的材料而获利的指控。
接下来,人工智能公司认为,像马库斯、南方公司和《纽约时报》发现的那些侵犯版权的输出是罕见的,或者是将被修补的漏洞。
“他们说,‘好吧,这种情况并不经常发生。你需要做特殊提示。马库斯说:“但我们问的问题相当中立——我们仍然得到了”受版权保护的材料。“这不是一个次要的问题,这是如何建立系统。对于这些公司来说,能够使用这么多数据是存在的。”
最后,除了在法庭上和声明中进行辩论外,人工智能公司还将利用他们充足的资源在幕后游说,并利用他们的力量来帮助他们提出自己的观点。
同样,生成式人工智能产业还没有赚到多少钱——去年基本上是一次大规模的产品演示,以宣传这项技术。这招奏效了:投资资金确实大量涌入。但这并不意味着人工智能公司已经找到了建立可持续商业模式的方法。他们已经在假设他们不会支付培训材料、许可证或艺术家劳动等费用的情况下运作。
当然,谷歌、微软甚至OpenAI这样的公司支付不起使用版权作品的费用,这绝不是真的——但硅谷目前已经习惯了削减劳动力和创造性作品的成本,而且几乎没有理由认为它不会再这样做了。从优步(Uber)到Spotify,本世纪许多大型科技公司的商业模式都是建立在劳动力成本可以削减或最小化的假设之上的。当创意产业认为YouTube允许盗版和未经许可的材料以工人为代价扩散,并支持《禁止网络盗版法案》(SOPA)来打击它时,谷歌在阻止该法案、组织集会和在线活动、游说立法者跳槽方面发挥了重要作用。
威廉·菲茨杰拉德(William Fitzgerald)是工人机构(Worker Agency)的合伙人,也是谷歌公共政策团队的前成员。他告诉我,他看到一场类似的压力运动正在形成,以打击版权案件,这是谷歌过去成功使用的策略:组织第三方团体和机构(如Chamber of Progress),推动使用受版权保护的作品进行生成人工智能不仅是合理使用,而且是被接受的事情,并不是所有人都想要为自己的工作付费。他提到了一个由人工智能艺术家签署的支持生成的人工智能,该人工智能由德里克·斯莱特(Derek Slater)组织,他是谷歌的前政策主管,他的公司与谷歌合作,也是组织反sopa努力的人。菲茨杰拉德还看到了谷歌在知识共享组织中对人工智能艺术是合理使用这一论点的支持,因为谷歌是该组织的主要资助者。
菲茨杰拉德说:“看到谷歌使用他们多年来开发的游说策略,以确保工人得不到公平的劳动报酬,这令人担忧。”OpenAI紧随其后。它不仅采取了与谷歌类似的方式来应对版权投诉,而且还聘请了同样的人:它聘请了谷歌前版权政策主管弗雷德?冯?罗曼(Fred Von Lohmann)担任首席版权律师。
“看起来OpenAI正在复制谷歌的游说剧本,”他说。“他们聘请了前谷歌的拥护者来影响谷歌几十年来一直如此成功的剧本。”
然而,这一次情况有所不同。SOPA在当时被认为是由好莱坞和音乐产业策划的,因此确实受到了草根阶层的憎恨;硅谷仍然作为未来的仁慈发明者而广受爱戴,许多人不明白,把艺术家的作品上传到互联网上由好人拥有的视频平台上,可能会损害他们的经济利益。(尽管很多人都这么做了!)
然而,现在数字世界的工人们准备得更充分了。从好莱坞编剧到自由插画师,从兼职文案到全职程序员,每个人都能意识到生成式人工智能系统的潜在物质效应,它可以吸收他们的作品,复制它,并按月向用户提供——支付给硅谷公司,而不是他们。
“这是在索取巨大的赠品,”马库斯说。“这相当于一场大规模的土地掠夺。”
现在,硅谷有很多人对人工智能的潜力感到兴奋,还有很多人对政治经济问题一无所知;他们希望尽快看到成果,而没有意识到这些工作自动化系统将如何在实践中使用。其他人可能根本不在乎。但马库斯说,对于那些担心的人来说,有一个简单的办法。
“这里有一个明显的替代方案——OpenAI说我们需要所有这些,否则我们无法构建人工智能——但他们可以为此买单!”毕竟,我们想要一个有艺术家和作家的世界,他补充说,一个奖励艺术作品的世界,而不是因为少数科技公司赢得了数字领域的地盘,所有的钱都流向了最高层。
菲茨杰拉德说:“世界各地的工人都应该认清这一点,组织起来,教育立法者,争取公平的劳动报酬。”“因为如果他们不这样做,谷歌和OpenAI将在未来很长一段时间内继续从其他人的劳动和内容中获利。”