11月21日消息,网络爬虫技术是大数据时代信息采集的一项重要手段,过界和非法使用会危害网络数据安全。

今日,据 上海普陀法院 公众号介绍,日前,上海市普陀区人民法院审理了上海首例认定提供爬虫程序抓取公开数据构成提供侵入计算机信息系统程序罪案件。

被告人王某2020年从某名牌大学IT专业毕业后入职了一家网络公司,发现爬虫技术目前应用火热,次年,王某开发出一款能破解得物App防护措施、自动抓取商品数据的爬虫程序。

了解电商行业竞品分析中市场需求旺盛的他,在朋友圈、博客等平台发布介绍贴并售卖他开发的爬虫程序,仅两年就获利60余万元。

2021年10月,王某发布的贴文被得物员工发现,该员工添加其微信购买算法。

经验证,该算法的确能够从得物App获取包括产品定价信息等核心数据,得物公司立即向公安机关报案。

经公安机关侦查,该爬虫程序通过破解API加密算法、批量获取设备身份指纹SK等技术方法绕过防护机制,无需授权即可获取服务器数据。

2023年11月,王某被抓获并自愿认罪认罚并退缴违法所得。

普陀区人民法院经审理后认为,被告人王某明知其开发的爬虫程序及接口具有破解App安全保护措施并获取商品数据的功能,仍通过网络向他人售卖并提供维护服务等,经审计违法所得60余万元。

其行为已构成提供侵入计算机信息系统程序罪,且情节特别严重,依法应予处罚。

鉴于王某具有坦白、认罪认罚、退赃等情节,最终判处其有期徒刑三年,缓刑三年,并处罚金人民币八万元。

据了解,爬虫技术自诞生以来长期被视为中立技术,但随着爬虫技术的应用范围和深度不断扩张,其合理使用的界限愈加模糊,使用不当可能招致法律风险,而如果爬取的对象侵犯他人权益的,就可能构成违法犯罪。

如未经授权爬取受保护的数据、破解验证码、绕过防火墙等可能构成非法获取计算机信息系统数据罪。

另外,利用爬虫对目标网站或系统发起大量请求,导致系统负载过高甚至崩溃可能构成破坏计算机信息系统罪。