陈晨:生成式AI是不能输掉的“战役”
本文摘要:生成式人工智能治理规则需平衡利弊、思深忧远 4月11日,中国国家网信办发布《生成式人工智能服务管理办法(征求意见稿)》(下称《意见稿》),向社会公开征求意见。4月12日,美国商务部就ChatGPT等AI大模型监管措施公开征求意见,世界科技巨头在不断推出新品之

  生成式人工智能治理规则需平衡利弊、思深忧远

  4月11日,中国国家网信办发布《生成式人工智能服务管理办法(征求意见稿)》(下称《意见稿》),向社会公开征求意见。4月12日,美国商务部就ChatGPT等AI大模型监管措施公开征求意见,世界科技巨头在不断推出新品之际,各国监管部门的步伐也正迎头赶上,逐步开启对人工智能生成式内容的监管,未来的监管政策成为中美竞争的关键变量。

  美国监管政策的变化

  美国国家电信和信息管理局公开征求的内容方面,监管政策意见主题主要包括:人工智能开发公司及其企业客户应该进行什么样的信任和安全测试;进行审计和评估需要什么样的数据访问;监管机构和其他参与者如何激励和支持人工智能系统的可信保证以及其他形式的问责制;不同行业可能需要哪些不同的监管方法——如就业或医疗保健。

  美国国家电信和信息管理局(NTIA)负责人Alan Davidson表示,在新技术发展的同时,也要保证其安全性、可靠性。新的大语言模型功能非常强大,它们确实会产生一些有害的内容。新的监管政策不仅可以降低产品的安全性,也可以让企业以更加安全的方式发展创新技术。

  美国商务部表示,将在接下来的 60 天内就人工智能审计、风险评估和其他措施的可能性征求意见,这些措施可以缓解消费者对这些新技术产品的担忧。从美国国家电信和信息管理局的AI监管意见来看,其政策是目标是支持AI审计、评估、认证和其他机制的发展,以赢得人们对AI系统的信任。通过监管,让人工智能企业在政府的指导下,能以更安全的方式开展技术创新。

  中国监管政策走出重要一步

  我国对人工智能一直持鼓励发展的态度。国务院曾于2017年印发了《新一代人工智能发展规划》,提出了人工智能发展的战略目标;2022年,科技部等六部门印发了《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,明确提出鼓励在重点行业深入挖掘人工智能技术应用场景。本次网信办发布的《意见稿》是国家宏观指导政策首次进入法规层面。

  《意见稿》进一步明确“鼓励优先采用安全可信的软件、工具、计算和数据资源”。安全可信的网络产品和服务是《关键信息基础设施安全保护条例》《网络数据安全管理条例(征求意见稿)》对于关键信息基础设施运营者和重要数据处理者的强制要求,虽然《意见稿》的口径为“鼓励”宣贯,但未来相关监管是否会对如何判断网络产品和服务的安全可信发布系列规则或者标准,尚待进一步观察。

  比如,在训练数据方面,《意见稿》对预训练数据提出了更多的要求,要求保证训练数据的“真实性、准确性、客观性、多样性”。清华大学中国发展规划研究院执行副院长董煜指出,大模型离不开数据的训练,如果对于训练数据作出过于严苛的规定,将阻碍大模型的发展速度。数据训练的规模会决定人工智能生成内容的质量,数据的数量和质量比算法和模型更重要,美国可以做出ChatGPT,很大程度上在于美国对于全世界数据的收集和掌握。从欧盟、美国、韩国、日本等国家针对预训练数据合法性的要求来看,为了支持大模型的发展,他们允许使用各种出版物对生成式人工智能训练数据进行分析。因此,如果由于真实性、版权等问题无法使用相关训练数据,将对人工智能技术发展带来不利影响。

  生成式AI是不能输掉的“战役”

  当前中美竞争的形势十分激烈,从某种意义上说,生成式AI对未来的技术面貌具有相当的重塑力,这一认知已达成共识。国家高度重视科技进步,视科技创新为高质量发展的生命线。现阶段生成式AI在中外监管思路的明显区别是,美欧各国侧重从数据安全、数据保护的角度来介入和推动监管落地,中国则是一种综合治理的思路,强调权益保护、数据治理、内容治理等多个维度。

  监管的目的显然不是要限制人工智能工具的开发,而是要推动它的健康发展。中国的生成式人工智能产品和服务,百度的文心一言已经面世,其他大模型也在发布或是处在测试阶段。受限于有限的中文数据,整体表现与ChatGPT有一定差距,如何帮它们健康地强大起来,这是对包括监管体系在内的整个中国社会的考验。

  通过《意见稿》我们不难发现,这一文件的出台无疑为我国算法相关产业的发展提供了新的指导。然而,我们也注意到,该办法中的一些细节仍有待进一步完善,有关问题仍需要立法者澄清。例如针对《意见稿》第九条,北京大学法学院薛军教授指出,生成式人工智能服务,在某些特定场景下更类似于搜索服务,本质是一种智能检索,应当允许用户以游客的身份使用。这是因为,生成式人工智能服务可以根据用户提供的查询、问题或任务,自动产生相应的答案、方案或输出。这个过程类似于搜索引擎对关键词进行搜索并返回相关结果的过程,当然,还可以把搜索引擎与其结合生成更加动态、个性化、甚至创造性的输出。微软将ChatGPT问答模型迁入必应搜索引擎,可以让更多的用户通过输入问题获得答案,从而提高信息获取的效率和质量,整个过程并不需要用户的登录或验证。

  未来随着AI技术的发展,中国在生成式AI和大模型方面是否会面临类似芯片的卡脖子局面,我们不得而知。为了不陷入被动局面,打造有利于国内生成式AI发展的政策环境在中美竞争中扮演着至关重要的角色。

  陈晨 中国法学会网络与信息法学研究会常务理事

【编辑:李赫】