人工智能时代，从法律层面保护好数据主权

高艳东近日，微软高管苏莱曼认为，为了训练人工智能（AI）模型使之更好地服务人类而抓取互联网上的任何内容都属于合理使用，既不需要支付著作权人报酬亦无需征求著作权人同意。在他看来，开放网络上的内容属于“免费软件”，任何人都可以复制，用它来再创造、再生产。微软高管的这一观点，表面上是公开数据的合理使用问题，实质是算法权力对数据主权的挑战。发展人工智能和保护知识产权应当并行，可以使用网络上的公开数据训练AI，但不能侵犯著作权。毫无疑问，AI的广泛应用对人类社会发展具有重要价值，将把人类推向智能时代，我们应当鼓励其发展并给予热烈掌声。但同时，其发展过程也不能无视知识产权保护体系。训练AI大模型需要投喂大量数据，而其中的高质量数据都是由人类创造。皮之不存，毛将焉附？人工智能的前提是“人工”，在可以预计的未来，人工智能的学习对象还将是人的作品。如果没有知识产权保护体系，人类创作优秀作品的动力和数量也将锐减，AI发展也必然受到阻碍。显然，我们要平衡人工智能发展需要与知识产权保护需要。不能为了发展人工智能而忽视建立知识产权保护体系的重要性，微软高管观点的实质，是站在商业立场上，为企业减少生产成本的片面言论，是为利用技术优势掠夺他人利益行为的辩护。微软等AI巨头爬取海量数据用于训练人工智能，已经远远超出了“合理使用”的范畴。其实，基于商业目的爬取海量数据训练AI模型的行为，在绝大多数国家都很难被认定为合理使用。美国《版权法》中的合理使用首先要考虑“使用作品的目的与特性：具有商业性质还是为了非营利的教学目的”。这也是2023年《纽约时报》起诉OpenAI和微软的原因——在未经许可的情况下使用受版权保护的新闻文章来训练AI聊天机器人。相关行为同样不属于中国《著作权法》中的合理使用，《著作权法》第24条对于“可以不经著作权人许可，不向其支付报酬”而使用作品的情况有着明确规定，其中合理使用的标准是：在特殊情况作出；与作品的正常使用不相冲突；不得不合理地损害著作权人合法权益。合理使用的关键在于判断“特殊情况”。《著作权法》第24条第十三项规定了“适当引用”“不可避免”“少量复制”“不以营利为目的”等属于“特殊情况”。显然，微软公司的商业行为无法被认为是“特殊情况”，可见微软高管的观点是基于公司私利而无视各国法律的商业逻辑。我国应当警惕算法权力威胁数据主权。近年来，美国AI领域发展迅速，有较大的技术优势。微软高管的观点，也代表目前人工智能领域的数据殖民主义。一些AI巨头利用算法、算力优势免费爬取海量全球数据训练AI大模型，然后再将训练出的AI产品卖给其他国家，这种数据掠夺是数字时代的沙文主义。无论是航海时代、工业时代抑或二战后，历史上以各种方式掠夺其他国家资源的情况一直存在。在人工智能时代，这种剥削的方式就包括免费海量获取他国数据。面对这种新型的数据侵犯，我国应当积极应对，防止沦为数据殖民地。首先，防范技术剥削的最好办法就是技术反制。近年来，我国人工智能产业发展迅速，但仍需全方面加快技术发展节奏，不断完善促进技术发展的法律体系。欧洲在近年相继出台了《通用数据保护条例》（GDPR），通过了监管AI的《人工智能法案》。但这种强监管主义并没有带来欧洲数字产业的大爆发，而美国立法的宽松主义及对数字巨头的保护政策则帮助该国企业不断收割全球数字利益。所以，先发展再监管的人工智能立法政策值得学习，毕竟只有掌握了技术优势，我国才能反制美国的数据侵略。其次，应积极倡导数据主权平等，抵制数据沙文主义。在人工智能时代，各国对如何维护数据主权虽共同需求但尚无统一行动，我国应当提出具有全球号召力的数字共识，同时推动建立一套维护各国数据主权的国际法准则。在实现路径上，应本着友好协商原则，在“一带一路”机制、金砖国家合作机制的“朋友圈”里倡导数据有主权范围、算法涉及国家利益的观念，并建立符合各国利益的国际数据仲裁院、国际数字法庭等机构，为未来可能的算法权力争端做好法律准备。数据无小事，算法之争也是国力比拼。在人工智能时代应当着眼未来国家发展，在政策上，积极发展人工智能技术，以技术优势打赢算力竞赛；在立法上，本着包容审慎监管的态度，出台技术友好型法律；在国际上，倡导数据主权平等主义，构建数据争端解决国际机构。只有坚持发展主义，才能在数据霸权时代走好民族复兴之路。