您的位置:  首页 > 版权 > 话题 > 正文

警惕人工智能创作背后的著作权侵权风险

来源:中国新闻出版广电报/网 作者:焦和平 发布时间:2022-09-08 10:42
分享到:

  □焦和平

  近年来,随着人工智能技术的快速发展和广泛应用,人工智能自主创作诗歌、小说、音乐等已不再是新鲜事情。如同人类作者创作需要已有文献资料作为创作素材一样,人工智能创作也需要创作素材来“喂养”。这些创作素材是以数据形式表现的各种数字化作品。根据《著作权法》原理,任何人使用他人处于权利保护期内的作品,都应当取得授权并支付费用(除非属于合理使用或法定许可),否则属于侵害著作权的行为。人工智能在创作过程中获取和利用数据时所面临的著作权侵权风险问题如果不能妥当地予以解决,将不可避免地使人工智能创作的作品一经生成便背负上侵权“原罪”,从而影响该作品的后续传播与使用,最终阻碍人工智能技术的广泛应用和社会文化艺术的繁荣发展。

  与人工智能创作不断繁荣的图景相比,当前在解决人工智能创作中获取与使用数据的合法性问题上面临诸多困境:立法上,新修改《著作权法》关于著作权限制与例外的条款并未就此问题作出明确回应,使得这一问题在现行立法框架下如何解决仍缺乏规范依据;司法上,在我国两起因人工智能创作引发的著作权侵权纠纷中,当事人及审理法院仅将人工智能的创作结果是否属于作品及其著作权归属作为争议焦点,对于人工智能创作所使用的数据来源是否合法则未予关注。立足于此,本文拟分析人工智能创作中获取与使用数据存在的著作权风险,以期为后续探寻科学合理的风险化解之道提供依据。

  人工智能创作利用数据可能侵害多种权利

  复制权侵权风险。首先是数据获取与输入环节的复制权侵权风险。在人工智能进行深度自主学习之前,需要将作为创作素材的作品进行数字化处理并转换为适合“机器阅读”的标准数据格式。一般而言,完成这一过程有3种路径:一是将非数字格式的作品转换为机器可读的数字格式。二是直接在互联网上抓取已经数字化的数据作品。三是将已经数字化但格式上不兼容的数据进行标准格式的转换。上述3种方式都是对已有作品在不改变内容的情形下所进行的全文复制和原样再现,并且存储在机器中形成永久复制件,属于著作权法上的“复制”行为,存在侵犯复制权的风险。

  其次是作品输出环节的复制权侵权风险。根据“接触+实质性相似”的著作权侵权判定规则,如果人工智能最终输出的内容与之前所使用的数据作品存在实质性相似,则同样可能会侵犯复制权。与前述全文复制或原样再现不同的是,此种“实质性相似”判断还要受到“思想/表达二分法”原则的限制,如果构成实质性相似的是思想而非表达,则难以构成著作权法意义上的复制。

  改编权侵权风险。在人工智能创作中,如果最终输出的生成内容即便具有一定的独创性,但仍然保留了数据库中某一作品或者某些作品的基本表达,应属于改编作品,此种创作行为如未经许可并支付报酬则可能侵害改编权。有观点认为,将此种情形下人工智能的创作结果视为演绎作品的说法并不十分准确,理由是人工智能创作“不是实质性地以某个作品为基础所进行的再创作,不是对某个作品的演绎”。实际上,从人工智能创作对已有数据的利用来看,可以分为“利用同一人作品”进行创作和“利用多数人作品”进行创作两种情形:前者如微软公司开发的“下一个伦勃朗”人工智能系统,通过深度学习伦勃朗346幅画创作出与伦勃朗风格相似但又具有独创性的绘画作品;后者如微软“小冰”深度学习1926年以来500多位诗人的现代诗创作了《阳光失了玻璃窗》。这两种情形都是利用已有作品创作出新作品,如果被学习的作品仍在著作权保护期限内,则都属于侵犯改编权的行为。区别在于,前者侵害了同一作者数个作品的改编权,后者侵害了不同作者各自作品的改编权。

  传播权侵权风险。人工智能创作涉及的传播权侵权风险主要是信息网络传播权和广播权,表现在人工智能创作的输出环节:若将机器学习的数据分析结果通过网络即时公开发布,可能会侵犯作品广播权;如果延时发布,则可能侵犯信息网络传播权。

  正是由于人工智能创作在使用数据作品中可能会侵害传播权,为了避免此种侵权风险,日本著作权法于2018年修订时专门增加了“提供新的知识和信息”的著作权例外条款。根据该条规定,如果是为了提供新的知识或者新的信息,通过计算机对作品进行信息处理,可以将处理结果向公众提供。

  人工智能创作利用数据侵权豁免之困境

  著作权法的侵权豁免理由一般有合理使用、法定许可和强制许可三种类型。我国现行立法中尚无强制许可制度,法定许可规则所确定的4种类型也难以适用于人工智能创作场合,以下几种合理使用情形最有可能作为侵权抗辩依据。

  人工智能创作与“个人学习、研究”。根据我国新《著作权法》第二十四条第一款第一项的规定,“为个人学习、研究或者欣赏,使用他人已经发表的作品”可以不经著作权人许可亦无须支付报酬,此即为我国立法上的“个人使用”合理使用类型。人工智能创作需要对数据作品进行学习和研究,似乎在文义上属于“个人使用”合理使用类型中的“学习、研究”范畴,但仔细分析后可发现,人工智能创作并不符合该条款的规范意旨,从而难以适用该规定进行合理使用抗辩。

  理由如下:其一,从主体要件来看,“个人学习、研究”中的“个人”通常限于自然人,人工智能创作中使用数据的行为主体为人工智能系统,并非自然人,而控制人工智能创作系统的主体也是具备一定技术条件和物质条件的组织机构,并非单个的自然人。虽然实践中直接操作或者使用人工智能系统进行创作的主体可能是作为自然人的科研人员或者公司员工,但这些科研人员或者公司员工所从事的“学习、研究”是为履行人工智能所有者(一般为大型科技公司)安排的工作任务所实施的职务行为,并非为了科研人员或者公司员工自己创作而进行的“学习、研究”,因此不符合个人使用的主体要求。其二,从目的要件来看,个人使用必须是基于“学习、研究”的非商业目的,当前的人工智能创作均由大型商业互联网公司控制和实施,也难以符合个人使用的非商业目的要求。

  人工智能创作与“科学研究”。根据我国新《著作权法》第二十四条第一款第六项的规定,在“为科学研究,翻译、改编、汇编、播放或者少量复制已经发表的作品,供科研人员使用,但不得出版发行”情形下,可以不经著作权人许可亦无须支付报酬,此即为我国立法上的“科学研究”合理使用类型。

  在人工智能创作中,对数据作品进行的分析和处理就是一种科学研究活动,但此种情形仍难以适用“科学研究”类型的合理使用抗辩。首先,著作权法规定的科学研究合理使用类型属于以公共利益为目的对著作权进行的限制,因而该情形下的科研机构及科研活动应“只适用于国家设立的教育、科研公共事业单位”,而当前主导人工智能创作的主体多为大型商业互联网公司。其次,此类合理使用对复制作品有数量限制,但人工智能创作中使用数据作品往往涉及对作品的全文复制,因此不符合“少量”的要求。最后,此类合理使用要求对于数据作品应“仅供科研人员使用”。

  实践中,人工智能创作使用数据的主体要么是作为人工智能所有人的大型互联网企业,要么是通过购买人工智能系统成为使用人的其他大型企业;即使人工智能创作实际由科研人员进行操作,其也是基于履行岗位职责要求而实施的职务行为,不符合“供科研人员使用”这一条件,因此无法适用此种合理使用类型进行抗辩。

  人工智能创作与“适当引用”。根据我国新《著作权法》第二十四条第一款第二项的规定,“为介绍、评论某一作品或者说明某一问题,在作品中适当引用他人已经发表的作品”,可以不经著作权人许可亦无须支付报酬,此即为我国立法上的“适当引用”合理使用类型。人工智能创作是在学习已有作品基础上进行的二次创作,不可避免地要引用已有作品,表面上看似乎属于适当引用,但仔细分析可以发现,此种合理使用类型也难以作为对人工智能创作使用数据予以侵权豁免的法律依据。

  理由如下:其一,人工智能创作使用数据不符合“适当引用”条款所要求的目的要件。根据法条文义,适当引用必须是“为介绍、评论某一作品或者说明某一问题”,人工智能创作使用数据完全是为了生成新作品,既非“为介绍、评论某一作品”,也非“为说明某一问题”。其二,人工智能创作使用数据不符合“适当引用”条款所要求的“适当性”要件。引用的适当性要求所引用的部分不能构成被引作品的主要部分或实质部分,引用作品与被引作品具有主从关系和显著的区别,如此才不会造成引用作品构成被引作品的“替代品”。人工智能创作对数据作品的使用显然已经超出了适当性的要求,因此不符合“适当性”要件。

  司法政策“混合标准”下的人工智能创作。我国在合理使用规则的设立上采取了封闭式的立法技术,即认定合理使用只能在《著作权法》列举的具体类型清单中“对号入座”,不能在清单之外创设其他合理使用类型。但是,最高人民法院于2011年发布的一项司法政策在法定清单之外创设了认定合理使用的“混合标准”,即把美国版权法的“四要素标准”和国际条约的“三步检验法”混在一起形成了“确有必要+特殊情形+四要素标准+三步检测法(后两步)”的合理使用认定规则。该项司法政策并不属于司法解释,不宜直接作为法律适用依据,但可以在裁判说理中予以参照。该“混合标准”过于原则和抽象,使得人工智能创作能否被认定为合理使用具有很大的不确定性。例如,同样采用“四要素标准”,有学者认为人工智能创作使用数据可以纳入合理使用范畴,另有学者得出了截然相反的结论。因此,即使将司法政策的“混合标准”作为司法解释予以适用,人工智能创作中的数据使用行为仍然存在著作权侵权风险。

  (作者系西安交通大学法学院教授、博士生导师、法学博士)



中国新闻出版传媒集团  |  中国新闻出版广电报  |  华讯传媒网络科技有限公司  |  中国出版  |  中国全民阅读媒体联盟  |  妈妈导读师  |  版权声明