天津自贸区法院日前审结了一起不正当竞争纠纷案,是天津某数码公司等与上海某公司关于数据爬取所引发的,该案引发社会关注。该法院在案件裁判中对于数据爬取是否构成不正当竞争及数据要素相关问题有创新性突破,值得理论与实务界参考。数据爬取涉及数据权属、数据竞争等法律问题,如何规制精准数据爬取,保护数据所有者和用户的合法权益,同时又不影响数据的流通和创新,是当前亟待解决的难题。
科学规制数据爬取,规范数据流通
数据爬取行为是指通过网络爬虫程序自动或半自动地从互联网上获取数据的行为,数据爬取能够以较低成本、较快速度从其他网页、网站等空间大规模复制目标对象数据,为数据需求方收集和处理数据提供了巨大便利。然而,这种从其他网页、网站等空间获取数据资源的方式,能够满足相关企业对数据质量、数量和流通速度的要求,客观上实现数据流通,推动数字经济发展,同时也引发了一系列的法律问题,其中既涉及民法领域的隐私保护、财产保护,也关涉竞争法领域的不正当竞争纠纷,还可能涉及刑事法领域的犯罪行为等。
数据爬取与促进数据要素流通之间有着密切的关系,数据爬取可以从不同的数据源和各平台上采集、整合、分析各类数据,为数据要素的流通提供了技术手段和数据资源。在数据要素市场化配置尚未完全成熟的过程中,数据爬取客观上促进了数据要素流通,这种方式将尚未完全由市场配置的数据要素转向由市场配置的过程,促进数据要素的高效利用和价值实现。
综上,数据爬取作为数字经济企业,特别是中小型创新企业获取数据资源的重要方式,正当合理的数据爬取是值得肯定与激励的,有助于激发各类企业的竞争动能。同时,也应确保在法治框架下平衡好各类数据主体的合法利益,权衡好数据保护与数据竞争间的关系,做好科学合理的数据保护和高效有序的数据竞争间的协同共进,才能确保数据价值得以充分释放。
不当规制爬取,引发数据流通阻碍
数据爬取行为引发的非刑事法律问题,大多数集中在反不正当竞争纠纷领域,如何识别数据爬取的正当性已成为理论与实践共同关注的难点问题。对数据爬取行为的规制目前主要存在两种观点:第一,应采取严格禁止的态度,强调对被爬取方的利益保护,遵从经营者私益保护优先的侵权法逻辑;第二,对爬取方的行为持竞争损害中立的态度,转向市场竞争秩序优先的竞争法逻辑;抑或引入其他多元利益,譬如国家利益、公共利益、用户利益等来综合权衡爬取行为的正当性。还有与此所伴生的难题——数据权益应当如何区分归属,如何开展分类保护,相关问题在实践中尚未达成一致意见。
司法实践中不同法院在考察数据被爬取方遭受的竞争损害时,所采用的标准不尽相同,当前,法院就数据被爬取方竞争损害分析的思路,大体分为以下三种:
第一,仅考虑数据被爬取方,因爬取行为导致其在流量或数据等数字化商业利益方面受到的损害。依照传统的侵权法路径逐一分析损害行为存在的事实,加上损害行为的因果分析,判定爬取方行为具有不正当性。
第二,在分析竞争损害的基础上,对爬取行为的正当性予以分析。已有法院在裁判中提出在自由开放的市场竞争中,应当允许一定程度的竞争损害发生,被爬取方需将损害作为一种竞争结果予以适当容忍,或者认定被爬取方的损失,尚未达到需要司法救济的程度。此类裁判逻辑反映出法院已对数据爬取行为的正当性边界予以关注,注意到数据财产性价值只有在流动中才能得以实现的特性,将损害结果作为判定数据爬取行为不正当性的必要不充分条件。
第三,在第二类裁判基础上,认识到除保障其他经营者的合法权益外,还需要保护消费者合法权益与社会公共利益,在爬取行为是否违反商业道德的判断上,需从更广阔的市场环境、更多主体合理权益的维度去判断,且在分析时考虑爬取行为对消费者权益和市场整体利益的积极影响。
譬如,在上述不正当竞争纠纷案中,天津自贸区法院就提出:原告在本案中主张保护的客体是其平台内的新闻数据,上海某公司未经原告许可,整体搬运涉案数据并直接用于涉案产品的新闻中,该行为既非实现涉案产品正常运营的必要手段,亦不符合社会公共利益的价值需求,其所实现的效果并不足以弥补被诉行为给原告所造成的损失,影响了正常的市场竞争秩序和健康公平的行业生态,降低了消费者的福利,超出了数据利用的合理限度,具有不当性。
总体而言,目前在对数据爬取行为引发的不正当竞争纠纷案件的审裁过程中,法院仍然偏向于适用《反不正当竞争法》的侵权法属性,以权利保护为案件审理的逻辑起点,对行为不正当性的判断,依据的仍然是“行为—法益”的侵权法思路,还有待于从私法保护的行权逻辑转向行为正当性识别的行为逻辑,即从数据保护到数据竞争的转向。
以规制促流通,需合理设置规则
为避免对数据爬取行为的不当规制,有必要对竞争法规制数据爬取行为予以澄清,以便更好实现对数据爬取行为的治理,避免简单地基于数据爬取可能造成的损害后果,进行“一刀切”式的否定评价,而忽略了行为可能存在的正当性,甚至爬取行为可能带来的积极效应。在这一过程中需注重个案分析,坚持竞争法的谦抑属性,重视行为正当性标准的进一步细化。同时,要更好理解《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》(下称《数据二十条》)的精神,深刻把握数据作为新型生产要素要义,以维护国家数据安全、保护个人信息和商业秘密为前提,促进数据合规高效流通使用,激发数据动能。
第一,导入“非公益必要不干预”理念与规则。即除为了维护公共利益的必要,公权力部门不得随意介入市场主体之间的竞争行为。数据爬取行为具有技术中立的特征,不应“先入为主”地打上违法标签,对企业课以过重的合规成本和治理压力。相关部门应在“非公益必要不干预”的理念和规则下,结合个案分析数据爬取行为的正当性。
第二,考察爬取数据的来源和方式,判断是否符合商业道德。数据爬取行为应当遵守相关法律规定和商业道德准则,尊重被爬取网站和数据权利人的意志和授权。简言之,如果数据爬取行为违反了被爬取网站的反爬虫技术设置,或者未经用户同意和平台授权,就获取并使用用户的个人信息或其他敏感信息,就可能构成不正当竞争。
第三,考察爬取数据的性质和价值,个案判断行为的反竞争效果。并非所有的数据都可以被任意爬取和使用,一些数据可能具有无形财产的属性,或者是经过劳动创造、整合、分析而形成的衍生数据、创生数据,这些数据对于经营者来说具有商业价值和竞争优势,应当受到法律的保护,如果数据爬取行为侵犯了这些数据的权利人的合法权益,就可能构成不正当竞争。具体而言,根据数据运行的全周期及“数据相关行为”的实施进展程度,可纵向将数据区分为原始数据、衍生数据、创生数据,结合横向数据主体的个人、企业、政府对于数据权益的需求,以精细化、差异化、场景化科学合理地对数据权益进行分配如表1所示。
对于数据爬取行为所涉及相关权益保护分析,可以参考以“数据相关行为”基准设计动态权属制度形成的动态保护逻辑,此种权益配置符合数据运行实况,可以对数据相关权益进行科学高效的配置,保证数据各主体能够合规有序地使用数据。《数据二十条》也明确了要对公共数据、企业数据、个人数据等不同类型的数据采取不同的管理措施,保障各方合法权益。因此,基于场景化数据权益分配来构建数据市场公平竞争的行为边界,促进以数据为关键要素的自由流通,能够更好落实数据作为生产要素由市场评价贡献、按贡献决定报酬的机制。
第四,考察爬取数据的用途和影响。数据爬取行为应当有合理的目的和正当的用途,不能损害公共利益或者其他经营者的合法利益。如果数据爬取行为是为了提供与被爬取网站相同或相似的服务,乃至于构成了“实质性替代”,或者是为了妨碍、破坏被爬取网站的正常运行,或者是为了从事非法活动,就可能构成不正当竞争。同时,还应当考虑到数据爬取行为的积极效果:
一是增加数据要素的供给:通过数据爬取可以从各种公开或半公开的网站、平台、数据库等渠道获取大量的原始或加工后的数据,丰富了数据要素的种类、数量和质量,为数据要素的流通提供了更多的选择和可能性。
二是提高数据要素的价值:数据爬取的相关程序可以对采集数据进行清洗、整理、分析、挖掘等操作,提取出有用的信息和知识,增加了数据要素的附加值和竞争力,为数据要素的流通创造了更高的收益和效率。
三是促进数据要素的创新:数据爬取可以从不同领域、不同层次、不同维度的数据中发现新的规律、新的关联、新的模式,且相关效率远远高于通过人力收集数据进行分析,因此,数据爬取也为数据要素的流通与创新奠定了技术基础。
可见,数据爬取行为并非一概禁止或允许,而应根据个案情况进行判断。数据爬取行为应当遵循诚实信用原则和商业道德,尊重相关企业的劳动成果和市场秩序,而非通过搭便车、不劳而获的方式进行恶意竞争,损害其他经营者或者消费者的合法权益,扰乱市场竞争秩序。
同时,要考虑到数据爬取对数据要素流通带来的积极效果。一方面,数据价值在于流通,数据的有效利用有助于提高企业的生产效率、改善产品质量,乃至于推动社会经济与行业的整体进步;另一方面,数据相关企业合法收集、生产、管理、运营数据的过程中付出了巨大的成本与劳动,其对数据相关权益应受到保护。故要做好个案分析,处理好数据权益的保护与流通利用之间的平衡关系。