8月16日,上海秘塔网络科技有限公司(以下简称秘塔AI)发布声明称,收到《中国学术期刊(光盘版)》电子杂志社有限公司(以下简称知网)28页的侵权告知函。
秘塔AI表示,其秘塔AI搜索产品的“学术”板块仅收录了论文的文献摘要和题录,并未收录文章内容本身,阅读正文需通过来源链接跳转至网站获取。秘塔AI还表示,即日起,秘塔AI搜索将不再收录知网文献的题录及摘要数据,转而收录其他中英文权威知识库的文献题录及摘要数据。
16日下午,秘塔AI方面向《每日经济新闻》记者表示,后续提供服务完全不受影响,已经有多家数据库主动表示愿意与其合作。
有业内人士在受访时表示,在版权授权与合作方面,AI搜索服务方可以结合未来的经营定位与规模,考虑与大型数据资源网站或内容版权方构建常态化合作关系,通过合作协议获取完整的授权许可,以企业技术优势获得合作优惠,共享收益,从根源上更好地解决版权问题。
侵权与否尚无定论
据秘塔AI发布的文章,知网方面表示,发现秘塔AI通过“秘塔AI搜索App”向用户提供知网的学术文献题录及摘要数据,且数量巨大。知网方面认为,此行为未经知网许可,严重侵犯知网合法权益,并表示不希望中国知网被秘塔科技搜索到,要求秘塔AI立即断开搜索结果到知网网站的链接。
秘塔AI则在声明中表示,依照学术规范,文献的摘要和题录应具有独立性和自明性,能够使读者不阅读全文就能获得必要的信息。秘塔AI搜索的“学术”板块仅收录了论文的文献摘要和题录,并未收录文章内容本身,阅读正文需通过来源链接跳转至网站获取。
“没有search,就没有research。‘知识发现’是知识传播链路上的第一步。”秘塔AI称,即日起,秘塔AI搜索将不再收录知网文献的题录及摘要数据,转而收录其他中英文权威知识库的文献题录及摘要数据。
16日下午,秘塔AI方面在微信上向《每日经济新闻》记者回复表示,后续提供服务完全不受影响,已经有多家数据库主动表示愿意和秘塔合作。
对于秘塔AI是否构成侵权,北京瀛和律师事务所高级合伙人、国际数据管理协会DAMA中国专家成员陈双在接受《每日经济新闻》记者采访时表示,知网主张的秘塔AI搜索侵犯行为是否成立,首先要判断知网对于其主张的数据资源是否享有权利、享有什么权利以及秘塔AI对于数据资源的使用行为是否具备不正当性从而构成侵权。
陈双认为,通常文献摘要的版权属于论文作者,如果知网通过版权协议实际上获得了版权方的完整授权,即不仅有权收录,还有权将文献对外授权使用、代为起诉维权等完整权利,类似“文献管理人”角色,则AI搜索产品直接照搬展示给用户的方式可能侵犯了相关方的信息网络传播权。而题录数据通常包含题目、作者、文献出处、文献时间等,一般不构成作品。但如果知网能够提出对其主张的文献摘要和题录数据库的著作权登记凭证,或有证据证明其对这些数据整理、编排、生成过程中付出了独创性劳动投入,并非对各种要素的简单堆砌、照单全收,则存在能够向秘塔AI主张享有该数据资源财产性权益的可能性。
此外,陈双还谈道,通常AI搜索产品的底层主要还是采用爬虫技术。对于AI搜索产品“爬取”数据的行为是否具备正当性,除了要判定爬取数据的来源、内容合规性,还要结合其是否遵守被爬网站的爬虫协议、用户协议、平台规则,是否有采取突破或绕开网站反爬技术措施,使用和展示方式是否对被爬取网站构成实质性替代等实际情况来判定。同时,从公共利益的角度看,法院也会考虑数据权益保护边界与学术资源共享流通间的平衡来综合判定。
侵权风险值得警惕
资料显示,秘塔AI成立于2018年4月,专注人工智能领域。今年3月,“秘塔AI搜索”上线。8月初,有媒体报道称,秘塔AI近期完成了超1亿元人民币的新一轮融资,由蚂蚁集团领投、光速光合跟投,本轮投后估值达1.5亿美元。
近期,OpenAI官宣加入AI搜索领域,这让本就拥挤的AI搜索赛道越发热闹。在国外,有微软必应搜索(Bing)、谷歌 AI Overviews这样的老牌公司产品,以及Perplexity等新兴AI搜索公司持续加码AI搜索。在国内,秘塔AI、昆仑万维等闯入搜索市场,传统搜索巨头百度和“搜索新人”夸克等也在各自产品中加入了AI功能。
随着AI搜索市场的竞争日趋激烈,众多玩家开始在细分赛道寻求差异化优势。7月26日,用户体验专家、专栏作者杜昭在接受《每日经济新闻》记者采访时表示,搜索引擎在数据资源、模型能力、索引库等方面的能力,新进入者需要付出巨大成本且很难突破。因此,不同AI搜索产品的差异化可能体现在细分领域,通用搜索比较难做差异化。
不过,随着秘塔AI收到知网侵权告知函,未来AI搜索玩家也需要开始思考如何应对可能的侵权风险。
对此,陈双表示,国内类似于秘塔AI的服务提供商在提供生成式检索服务时,应满足《生成式人工智能服务管理暂行办法》的合规要求。《生成式人工智能服务管理暂行办法》第七条规定,人工智能服务提供者“应当依法开展预训练、优化训练等训练数据处理活动”,遵守“涉及知识产权的,不得侵害他人依法享有的知识产权”等规定。
陈双建议,应当规范爬虫技术手段与程序,遵守被爬取网站的爬虫协议及规则,避免绕开任何网页技术限制或违反网站robots协议爬取数据,事前评估对网络服务的性能、功能可能带来的影响,避免干扰被爬网站网络服务的正常功能或妨碍计算机信息系统正常运行。针对大型资源平台类似的数据训练,构建内容审核机制,制定“技术手段+人工辅助”的内部审核流程,如审核平台用户协议/平台规则,确认被爬平台对数据权利的状态。
此外,陈双还提到,平台应当设置合理的使用限制。对于受版权保护的学术资源,平台应在用户协议中设置合理的使用限制,如禁止或限制用户将相关搜索结果链接复制、分发或用于商业目的。在版权授权与合作方面,类似秘塔AI的服务提供者,可以结合未来的经营定位与规模,考虑与大型数据资源网站或内容版权方构建常态化合作关系,通过合作协议获取完整的授权许可,以企业技术优势获得合作优惠,共享收益,从根源上更好地解决版权问题。针对用户或权利主体投诉事项实现快速审核和响应处理,如确属于侵权,应及时下架相关侵权内容。