【基本案情】
数据堂(北京)科技股份有限公司(以下称“数据堂公司”)成立于2010年,经营范围包括数据处理、人工智能系统服务等。2021年,数据堂公司在其网站发布了“AI数据开源计划1505小时中文普通话语音数据”(以下简称“1505小时数据集”),并于2023年获得“普通话手机采集语音数据库”的数据知识产权登记证。
2021年,数据堂公司将隐木(上海)科技有限公司(以下称“隐木公司”)诉诸北京互联网法院,指控隐木公司非法获取并传播“aidatatang200zh”数据集(以下简称“涉案200小时数据集”,1505小时数据集的子集),侵害其数据财产权、著作权和商业秘密,并构成不正当竞争行为,要求隐木公司停止侵权、赔礼道歉及赔偿经济损失和公证费。
一审法院认定数据堂公司享有涉案数据集的商业秘密权利,隐木公司构成侵权,判决隐木公司进行赔偿。
隐木公司不服一审判决,提起上诉,二审法院审理认定涉案200小时数据集不构成商业秘密,但隐木公司的行为违反反不正当竞争法第二条,仍需承担相应法律责任。
下文简称该案件为“本案”。
《中华人民共和国民法典》(“以下简称《民法典》”)规定了民事主体可享有的财产权益类型,包括物权、知识产权为代表的绝对财产权,以债权为代表的相对财产权和以有一定影响的商品名称、包装装潢等为代表的其他财产性法益。随着技术的革新和进步,碎片化的数据信息被进行处理,提升了数据的使用价值,因此,《民法典》总则编民事权利部分第一百二十七条规定,法律对数据保护有规定的,依照其规定,确立了数据作为民事权利客体的定位。本案中的数据集合产生了独立的利用和交易价值,具有财产性利益,根据《民法典》规定,理应受到法律保护。
但是,基于“财产权法定原则”,在财产性权益未被法律确认为绝对财产权之前,财产性法益的权益人不得类推适用其他绝对财产权类型寻求司法保护。而《民法典》第一百二十七条作为引致规范和宣示条款,尚未将“数据”作为绝对财产权而规定其权利内容,仅从宏观层面规定数据受法律保护,却并未将数据作为类型化民事权利的客体,也没有规定数据的保护模式。
因此,本案二审法院认为,涉案数据集作为“数据”虽属法律保护的合法权益,但缺乏法律赋权,无权类推绝对财产权请求保护。
数据因其在外观特征、权利属性以及数据权益及其行使方式上所具有的无形性特点,属性上天然地与知识产权具有相似性,因此实务中常通过著作权来进行数据保护,数据集保护最为常见的则是主张适用汇编作品的规定。
但笔者认为,适用著作权、汇编作品的规定进行数据保护存在一定难度。首先,在法理层面,著作权保护的是作者与作品之间在精神与人格上的联系,即具有作者特殊独创性的表达,同时保护人格权和财产权,而机器生成的数据难以满足作者精神独创性的要求,且不具有人格权,严格来讲难以纳入著作权保护范围。即使不考虑前者,仅从法律适用角度,根据《中华人民共和国著作权法》第十五条的规定,数据集能否被认定为汇编作品的关键在于数据集合持有者对于收集、提取的的数据是否进行了独创性的选择和编排。而实务中,数据集合多数情况下仅是简单的数据汇总,编排和选择上未有独特之处。
例如本案中,一、二审法院均认为,涉案200小时数据集是在基础语音文件上编排而成,但本案中的涉案200小时数据集在展示方式及布局编排等方面尚不能体现出独特构思,在内容的选择和编排上不具有独创性。因此,不构成著作权法保护的汇编作品,未成功采用著作权法的保护路径。
通过反不正当竞争法对数据进行保护有两种路径,对于符合商业秘密构成要件的数据,数据主体可通过适用商业秘密的条款寻求保护,而对于难以构成商业秘密的公开数据,则可以通过一般保护条款主张权益保护。
(一)适用商业秘密条款进行数据保护
数据集合持有者通常先采集原始数据,简单处理后形成初步的商业数据集,随后根据数据的特性和用途,进行个性化的整理、分类和编排,进一步加工处理,此时形成的数据集通常对于持有者具有一定的商业价值,因此实务中常有数据主体通过商业秘密寻求数据保护。
不同于民法和知识产权法,商业秘密的保护不以具有财产权为前提,只要满足《中华人民共和国反不正当竞争法》第九条第四款所规定的不为公众所知悉的、具有商业价值且被采取保密措施的三个特性,就可以纳入商业秘密的保护范围。其中最重要的构成要件为“不为公众所知悉”,该要件的认定有三个维度,首先判断主体是所属领域的相关人员,其次是前述人员对该信息既不能“普遍知悉”,也不能“容易获得”,最后则是前述判断的时点应当为“被诉侵权行为发生时”。如果数据的收集、产生源于公开的途径,可以通过公共来源容易获得,它就失去了作为商业秘密受到保护的资格。因此,能够通过商业秘密进行数据保护具有一定局限性,其仅能保护处于非公开状态的数据,而无法保护公开数据。
在本案中,涉案200小时数据集就是因为未达到“不为公众所知悉”的要件要求,未能使用商业秘密进行保护。一审法院认为1505小时数据集具有商业价值,普通人无法通过观察直接获得,且并未予以公开,同时,数据堂公司与员工约定了保密义务、采取了管控措施,因此构成商业秘密。但一审法院忽略了涉案200小时数据集的开源事实,前述数据集已经于2019年7月2日在Github网站开源,面向不特定公众公开披露了下载渠道和训练方法,因此二审法院认为,被诉行为发生时,涉案200小时数据集可以通过公共来源容易获得,不再构成商业秘密。
(二)适用一般条款进行数据保护
如前所述,数据主体可以通过著作权法或商业秘密的途径来维护数据权益,但在权利的确认过程中,认定数据集的独创性或主张保护公开数据时,往往面临诸多挑战。对于同样具有重要财产性利益和商业竞争价值的数据,如因难以满足独创性、不为公众所知悉的要件而无法获得有效保护,将对经营者造成巨大损失,也有违诚信和公平原则,不利于市场竞争环境。因此,司法实践中,数据主体常主张适用《中华人民共和国反不正当竞争法》第二条的一般保护条款进行规制。
根据法律规定,适用一般保护条款予以规制的不正当竞争行为,应包括以下五个要件:
第一,双方具有竞争关系。本案中,数据堂公司和隐木公司同属数据服务领域经营者,具有竞争关系。
第二,被侵权方享有应受反不正当竞争法保护的合法权益。司法实践中,法院一般基于三项考察标准来确认数据是否能受到反不正当竞争法的合法保护:(1)企业是否合法取得数据并符合商业道德;(2)企业是否投入了人力、物力和资金用于数据的处理;(3)涉案数据是否具有经济价值,为企业带来经济收入,形成了其他经营者不得任意加以侵害的企业竞争优势。本案中,涉案200小时数据集由数据堂公司付出了技术、资金、人力、物力等实质性投入,使数据集具有了商业价值,能够为数据堂公司带来交易机会与竞争优势等商业利益。这种商业利益在本质上是一种竞争性权益,因此属于反不正当竞争法所保护的合法权益。
第三,侵权行为违反法律和公认的商业道德。《最高人民法院关于适用<中华人民共和国反不正当竞争法>若干问题的解释》第三条规定了何为商业道德以及认定违反商业道德的因素。具体到数据权益引发的案件中,数据集合开源时,数据需求方获取、使用行为应当遵循开源协议是数据服务领域公认的商业道德。而法院主要从网络信息产业和互联网环境的特点以及数据获取者、使用者的利益和公共利益等多方利益的协调来判断经营者是否违反商业道德。本案中,涉案CC开源协议规定了“非商业性目的使用”规则,但隐木公司作为与数据堂公司存在竞争关系的经营者,在其官网展示涉案200小时数据集,丰富了其平台数据储备并为平台吸引流量、扩大影响。隐木公司不正当获取、披露和使用他人数据的行为与使用规则不符,故违反数据领域公认的商业道德。
第四,被诉行为扰乱市场竞争秩序,损害其他经营者或者消费者的合法权益。其一,如果影响主要包括准入机制、供求机制、价格机制、信息机制、信用机制和创新机制的六种市场运行机制作用的正常发挥,则可以认定干扰了市场竞争秩序。如果其他公司同隐木公司一样不正当获取、披露和使用的其他公司合法数据,将导致与数据堂公司情况相近的数据服务经营者无法获得回报和激励,打击其投资收集、加工制作新数据集的积极性,直接影响数据服务领域的创新机制。因此隐木公司行为扰乱市场竞争秩序。其二,隐木公司使涉案200小时数据集在具有竞争关系的数据共享平台公开传播,截取属于数据堂公司的用户流量,同时,隐木公司在官方网站上未经授权提供涉案200小时数据集的下载服务,侵犯了数据堂公司作为经营者的合法权益。
第五,被诉行为属于违反2019年反不正当竞争法第二章及专利法、商标法、著作权法等规定之外的情形。如前文所述,涉案200小时数据集处于公开状态且数据内容的选择或编排不具有独创性的,缺乏知识产权专有权和商业秘密保护的基础,但是数据堂公司付出实质性投入收集且具有一定经济价值,故可通过反不正当竞争法第二条的补充性原则进行规制。
相较于知识产权法和商业秘密的规定,反不正当竞争法的一般保护条款为缺少独创性的公开数据提供了保护路径。但是笔者认为,适用该条款进行数据保护仍具有局限性。一方面该规定限定于侵权损害赔偿责任,另一方面只有当侵权人与被侵权人同为经营者存在竞争关系,且在生产经营活动中因抓取、利用数据的行为侵害被侵权人数据权益时,才能适用。因此一般保护条款是一种消极被动的、个案式的保护,也无法明确赋予企业对数据享有何种权益。
本案中,涉案数据集获得数据知识产权登记。关于数据知识产权登记的功能,实务中尚存争议,争议的核心主要在于以下两个方面:
首先,数据知识产权登记能否确立对数据财产权益的初步确认功能。有观点认为,登记可作为数据持有者能够获得合法持有数据并对其行使权利的初步证据,并减轻在诉讼中的举证负担。但数据的动态性和流动性使得其与传统意义上财产权的确认不同,在面对数据的频繁更新和变化时,是否能够通过登记有效确认数据权属仍存在争议。
其次,数据知识产权登记能否在某种程度上起到公示和公信的作用。持反对意见的观点认为,数据的无形性和易复制性使得其难以像不动产那样通过公示建立稳定的法律预期,特别是具有商业秘密属性的数据,如认可公示作用则代表了一定的公开性之间,二者之间存在矛盾,保密与公开的需求难以平衡。持肯定意见的观点则认为,在数字经济快速发展的背景下,赋予数据知识产权登记一定的公示效力,可以促进数据的流通和交易安全。
在本案中,法院通过数据堂公司提交的《数据知识产权登记证》认定涉案1505小时数据集系由数据堂公司收集且持有,认定《数据知识产权登记证》可作为收集行为合法的初步证据。因此本案法院认为,《数据知识产权登记证》一方面可以作为证明公司享有相关财产性利益的初步证据,另一方面也可以作为收集行为或数据来源合法的初步证据。这表明,数据知识产权登记有助于明确数据的归属,证明数据权利人的身份,为在法律纠纷中主张权利提供有力证据。
【结语】
数据作为一种新增确认的生产要素,在市场经济中发挥着日益重要的作用,对数据保护的需求也越发迫切。目前,数据主体可通过民法、知识产权法以及反不正当竞争法获得一定的法律保护,但均具有一定法理限制和局限性。虽然数据知识产权登记能够初步证明数据主体的财产性利益及取得的合法性,但对其功能的认定也尚存争议。由于数据具有无形性、流动性强等特殊属性,使得上述法律问题的处理仍处于探索阶段,未来需要在兼顾数据权益保护与数据流通的基础上,进一步明晰和完善相关法律框架。
本文作者
专栏文章
-
知识产权
数据资产保护路径与登记功能——以北知院首例已登记数据资产不正当竞争纠纷案为例
本文在梳理本案判决的基础上,结合相关理论研究,探讨数据资产的保护路径以及数据知识产权的登记功能。2024-08-27 -
知识产权
驰名商标在民事侵权诉讼中的认定路径探析
专业解读2024-04-26 -
知识产权
字号保护的司法判断标准
本文通过梳理相关资料,详细阐释字号获得保护的法律构成要件和司法裁判标准。2024-04-11 -
知识产权
关于新业态商标犯罪中“商标使用”的法律适用研究
本文以最高人民法院案例库入选的首批知识产权案件之一为研究对象,对新业态商标犯罪中如何认定刑法意义上的“商标使用”进行初步分析。2024-04-10 -
知识产权
浅析日本法中的肖像权保护制度
专业解读2023-07-10 -
知识产权
知识产权合规体系助力上合示范区创新发展
本文荣获由山东大学检察理论研究中心主办、青岛市人民检察院承办、胶州市人民检察院协办的“2023上合示范区检察理论与实务研讨会”征文一等奖。2023-07-06 -
知识产权
《文康知识产权典型案例集》发布
在“世界知识产权日”之际,特予以发布。2023-04-26 -
知识产权
计算机软件侵权行为的认定及应对策略
2023-04-26