【戈程资讯】人工智能合理使用版权的两难与出路

人工智能是一种使机器智能化的活动,实现智能化的关键在于机器学习,即从数据中学习,通过输入并分析海量信息来“训练数据”,形成数据模型。在这一阶段,版权作品等信息作为输入数据被无数次地完全复制,甚至更改。这可能侵犯被利用作品的复制权或汇编权等。人工智能“训练数据”是否必然构成版权侵权,抑或能否受到合理使用制度的庇护,这个问题关系到人工智能技术的未来发展。过于严苛的版权保护会阻碍人工智能技术研发;而宽松的版权保护又可能改变版权利益格局,抑制人类作者的创作动力。

人工智能根据输出内容的不同可以区分为“表达型”与“非表达型”。“非表达型”人工智能在使用作品时,并不涉及作品的独创性表达,而是以作品的事实性信息为对象或将作品作为数据看待,着重分析其原始数据文本的物理特征。例如,在“Authors VS Google”案中,谷歌搜索引擎复制图书的目的仅在于向用户提供图书出版的事实信息,而非图书内容,法院裁定该复制行为属于合理使用。在该情形下,利用作品的目的是通过分析作品表达背后的“思想”来构建数据模型,而非生成“表达性”的可能替代被利用作品的内容,属于“非表达性合理使用”。根据“转换性使用”规则,作品使用目的越具有“非表达性”,则“转换性”程度越高,越可能认定为合理使用。这类合理使用在国际上已基本形成共识。

关于“表达型人工智能”是否构成合理使用的问题,尚未形成定论。在这类人工智能开发中,输入并分析作品的目的在于,通过分析作品的独创性表达来训练人工智能的表达技巧以创作新作品。例如谷歌的“下一个伦勃朗计划”,人工智能将伦勃朗所有的画作输入到数据模型中进行分析,从而“创造”出更多伦勃朗风格的作品。尽管风格属于思想,而非表达,但人工智能生成物可能会对被使用作品形成市场替代效应。而无论是“合理使用三步法”还是“转换性使用”,都要求作品使用行为不能对该作品的市场产生不合理的影响。知识产权保护的边界是不断变化的,随着电视节目模式和计算机字体的独创性标准逐渐放宽,作品表达的规律也可能具有独创性,而基于该规律产生的人工智能生成物就可能因与被利用作品具有实质性相似而构成侵权。可以想象,如果伦勃朗在世,他很可能起诉谷歌侵犯其版权。

然而,若由此否定合理使用,则人工智能技术发展将受阻。因为海量的被复制作品意味着高额的版权许可费,开发者要么很难以承担成本而放弃开发,要么倾向于使用已过版权保护期的作品,但基于过时信息开发出的技术可能并不实用,信息的片面性还可能形成带有偏见性的数据模型,即所谓的“数据歧视”。

在公共政策层面,合理使用制度具有重新分配公共福利的功能,它通过限制权利人的经济利益而使特定群体获得补贴。通过对经济权力和表达权利进行再分配,合理使用制度使公众能够自由地从事有益于社会的活动,同时又防止权利人的“垄断权”无限扩张。

合理使用制度的这种困境难以通过自身的制度完善加以解决,而以法定许可为主,并搭配公共许可的做法是比较适宜的解决方案。首先,人工智能开发者无需事先获得许可就可以使用作品,但需要向版权人支付费用。其次,由于表达型人工智能的生成物可能替代被利用作品,从而影响作者的市场收益,有必要允许作者享有随时退出法定许可的权利。法定赔偿制度中的“权利保留”,即权利人的“选择退出”机制,可满足这一需要。最后,网络用户作为非职业的创作者难以与集体管理组织形成稳定的交易模式,这一缺陷可以由公共许可来弥补,即释放部分版权权利以换取网络效应收益或搭售服务收益。

摘自:人民网

  2020年8月24日


返回