7月底,新京报记者卧底“鹰眼智客”发现,其竟利用爬虫技术从淘宝、京东等网站爬取店铺手机号并用于营销。 此外,借助这款软件,用户可以通过微信附近的人设置虚拟位置并批量申请好友,还可以“站在大街上”进行钓鱼营销。
有安全专家表示,当用户进行上网行为时,就会发送数据包,其中包含行为痕迹、手机号码等信息。 一旦涉及方发生泄露,就可以通过抓取数据包来解析用户的敏感信息。 网络爬虫分为两种:合法爬虫和恶意爬虫。 一些所谓的大数据公司本身没有数据源,而是通过爬虫获取别人的数据。
在网络空间,数据战争已经达到白热化程度。 2019年5月,国家网信办发布的《数据安全管理办法》征求意见稿第十五条也规定,“网络运营者出于业务目的收集重要数据或者个人敏感信息的,应当向所在地网信办报告。部门备案。” 此外,大部分网站已经针对恶意爬虫实施了反爬虫措施,并发布声明严禁。 有律师直言,“突破、绕过第三方平台反爬虫政策、协议时,可能涉嫌非法获取计算机信息系统数据罪、提供程序工具侵入、非法控制计算机信息罪”。系统”。
“鹰眼智慧”大数据营销系统主页。
揭秘“最全面”的大数据公司
爬取了淘宝、京东等多家网站的数据
在郑州双赢科技公司,销售人员正忙着“杀单”。新京报记者 李大伟 摄
记者发现,一家名为“鹰眼智客”的大数据公司自称“中国互联网营销服务第一品牌”。 其官方网站宣称:“你需要的一切都在那里。” 据官网介绍,“鹰眼智能客”隶属于郑州双赢科技有限公司。
7月29日,新京报记者来到该公司采访地点——郑州市金水区金城国际广场A座。 通过面试,他获得了试用岗位的资格。 他的主要工作是销售一款包含“鹰眼智客”电脑的大数据营销系统。一百平米左右的房间里充满了键盘打字的声音。房间里的30多名销售人员共同组成了“鹰眼智客”。共赢科技事业部。
据其官网介绍,“鹰眼智客”系统涵盖QQ营销系列、微信营销系列、综合收藏系列、论坛贴吧系列、邮件营销系列5大模块,拥有218个小功能。 此外,其还宣传称“已成功为2800多家企业提供网络营销服务,覆盖120多个行业”。 其中,综合采集系列号称能够精准采集目标客户信息,覆盖全网11大B2B平台、4大搜索引擎、7大地图,准确率高达90%。
试用期间,记者的任务是熟悉软件流程,并领取主管发的《终端客户聊天技巧》。 《终端客户聊天技巧》显示,其数据来自各大行业网站、各大平台、各大地图等。“只要此类信息在互联网上公开披露过,如阿里巴巴、百度、腾讯等,将通过我们的核心技术SPILDER多线程技术为您收集。”
据捷先产品总监程白(化名)介绍,其核心技术其实是网络爬虫技术。 据他介绍,目前网络上流行的网络爬虫有多种类型,信息采集网络爬虫主要是脚本爬虫和模拟器爬虫。
记者发现,“鹰眼智客精准营销系统”包括数据采集系列、QQ营销系列、社区论坛营销、综合营销工具五个模块,覆盖了从客户数据采集到营销的全产业链。
其中,数据采集系列模块包括地图行业采集、数据综合采集、阿里巴巴采集、慧聪网采集、单页目录综合采集、大众点评网采集、淘宝商家信息采集、中国制造网采集、团购外卖商家采集,阿里巴巴十二功能包括国际站采集、八方资源平台采集、京东商家采集。
记者测试发现,该软件操作非常简单,每个功能都附有相应的教学视频进行指导。 7月30日,通过该软件,记者成功获取了大量手机号码。
以淘宝商家信息采集为例,记者在系统中的淘宝商家采集功能中输入关键词“服装”后,成功采集到北京地区淘宝卖家信息82条,共耗时10分钟。 在软件弹出框的右下角还有一个“导出手机商店”按钮。 采集的信息包括类型(店铺级别)、店主姓名、地区、电话、店铺地址等多个维度。
此外,记者还依次测试了系统的京东商户采集、地图行业采集、阿里巴巴国际站采集等功能,均成功。
附近的人有多亲近?
软件可以任意定位,也可以用于钓鱼营销。
“你得放手,大声喊出来!” 第一天早上记者上班前,部门经理将业务员分成两队,两人一组轮流玩“美女与野兽”游戏。 据公司工作人员介绍,玩这个游戏是为了调动销售人员的积极性,培养团队荣誉感。
记者发现,《鹰眼智慧》附赠教学视频。 通过这段视频,记者在试用期间一一测试了该工具中的八项微信营销功能。 以本模块中的微信定位营销功能为例。 要使用该功能,用户需要使用手机模拟器登录微信。 根据添加方式的不同,软件分为添加附近人、添加指定QQ、摇一摇、添加群组成员四种。
记者调查发现,在微信定位营销中点击“获取经纬度坐标”时,会弹出一个页面。 如果用户在弹出的页面中输入国贸的位置,则用户可以定位国贸的坐标并看到国贸区域的“附近的人”。 使用该软件,用户可以同时添加多个虚假位置,并且还支持多个微信ID同时操作。
该软件还具有一定的防封锁机制。 视频教程显示,在参数设置中,用户可以选择好友验证数量、间隔时间以及向每个位置发送的验证申请数量。 “如果是刚用的话,就少加一点,比如加五六个,然后逐渐增加。如果最多加的话,加十以内,过一段时间再加。”
设置好位置和参数后,用户可以在软件中“验证信息”下的空白操作区编辑验证信息。 “例如,如果他在做生意,你可以将验证消息编辑为‘你好爬虫软件干嘛用,我想看看你的产品’。” 这样的话,(验证申请的)通过率会更高。”
值得一提的是,该软件还有一个功能,叫做“站在街上”。 所谓“Stand on the Street”就是“如果你不想主动添加好友,只是想让附近的人看到并添加你,你可以使用Stand on the Street功能”。 在位置栏弹出的对话框中,用户只需点击“模拟器使用该位置“站在街上”即可。
捷先产品总监程白(化名)认为,“鹰眼智慧”的部分功能属于黑色产业链。 “有些群发功能是违背用户意愿的,纯粹是为了盈利。 有时我也会收到此类垃圾邮件,大部分是出于营销目的。 然而,这种营销的许多来源并不可靠,而且可能还有其他来源。 黑色产业链、恶意引导。”
新京报记者从“鹰眼智客”工作人员处了解到,为了方便客户营销,该公司还提供外呼机器人(AI电话)服务,只需导入收集到的电话号码即可。
此前,新京报曾曝光过外呼机器人。 所谓外呼机器人,实际上是电话机器人系统,客户每天拨打1000个电话。 随后,央视3月15日晚会也曝光了外呼机器人。 犯罪分子和非法科技公司通过探针盒收集用户隐私,以大数据提供支持,智能机器人提供外呼。
大数据如何实现“精准营销”
抓取任意指定网站或APP访问者的手机号码
新京报记者搜索“大数据精准营销”关键词,注意到一家名为御嘉科技的大数据精准营销公司。
据企查查了解,该公司全称是苏州御嘉互娱网络科技有限公司,法定代表人为吴辉。 公司成立于2018年4月19日,注册资本200万元,产业为软件和信息技术服务。
8月19日下午,新京报记者联系上保健品、网贷销售人员吴辉。 对于某些行业数据,吴辉显得谨慎。 “保健品暂时不行,保健品目前检查严格,属于高风险敏感行业。” 吴辉告诉新京报记者。
据他介绍,公司的获客系统非常精准。 “您可以指定任意网站或APP,您只需提供网站链接或APP名称和下载链接,我们就可以捕获访问者的手机号码。” 吴辉说道。
但访客提供的手机号码只显示真实号码的前三位和后四位,因此只能通过他们提供的系统进行营销。 “我们会提供外呼系统,可以将这些手机号码提供给外呼系统,与客户沟通。” 吴辉介绍。 获取到的中间四位隐藏的手机号码也称为“脱敏数据”。
此外,对于访客获得的手机号码也有一定的限制。 “目前运营商主要集中在中国联通和中国电信,而中国移动已经停止了。” 吴辉说道。 至于为什么停止移动,对方给出的答案是因为“移动用户数量太大”。
除了运营商之外,吴辉还表示,如果用户通过WiFi或者电脑接入,手机号码是无法被捕获的。 “它(系统)是通过流量访问的,电脑、无线网络是无法被攻陷的,必须通过手机通讯网络来访问。”
为了增强说服力,吴辉建议记者“可以花500先测试一下”。 据他介绍,使用包一开始有1000个项目可供测试。 “我们可以签订收费套餐,开设代理,你可以自己测试转化率。”
吴辉向记者介绍了公司情况。 介绍文档将钰嘉科技的获客系统与普通网页手机抢号软件进行了比较。 对比图显示,网页手机抢客软件属于违法行为,而御嘉科技的获客系统是中国联通、中国电信正式推出的。 产品合法合规、稳定安全。”
8月19日,该公司背书的中国联通和中国电信的客服人员分别否认了此事,称“没有提供此类服务”。
介绍文件中,还把该公司为整形医院提供的服务做成了案例。 案例显示,该整形医院提交了包括本地同行在内的23个推广网站、31个同行座机咨询电话和2个医疗美容APP,要求目标客户为上海地区16岁至50岁的女性客户。
该公司文件显示,2019年3月,每天推送数据约100条,总计推送3053条。 其中,对接客户1872户,意向客户873户,转化客户372户。 拨通率为61.31%,意向率为28.59%,转化率为12.18%,获客成本仅为百度竞价推广的六分之一。
安全研究员Jane表示,当用户上网时,首先会向运营商发送一个数据包。 数据包经过运营商,然后传输到服务提供商。 数据包中包含用户的上网痕迹、手机号码等信息。 “当信息从一方泄露出去时,犯罪分子可以利用这个数据包解析出用户的敏感信息。” 简告诉新京报记者。
熟练的“杀”字
一名销售员一天收入近5000元
“公司目前有两种薪酬方式,一种是底薪制,底薪1500,销售产品提成10%;另一种是非底薪制,底薪为0,而销售产品的佣金为25%。”双赢科技负责采访的李梦海(化名)告诉新京报记者,“大多数人会选择没有底薪、高佣金的,得到更多。” 搭载“鹰眼智慧大数据营销系统”的电脑售价8800元。 按照定价和佣金计算,销售人员每售出一台可以获得2200元。
据李孟海介绍,双赢科技有限公司在郑州总部共有5个团队。 记者被分配到“刀队”。
“恭喜尖刀团队下单!” 7月31日下午3时50分,坐在记者右侧的甜甜突然大喊。 销售人员下单时,会喊出“恭喜XX团队下单!” 这一刻,所有人都会停下手中的工作,鼓起掌来。 “这是一种奖励机制。” 一位工作人员告诉新京报记者。
甜甜是新人。 1992年出生的她几个月前来到这家公司转行,成为一名销售人员。 因为刚刚入行,一些“杀令”技能她并不熟练。 当客户表现出强烈的意向时,更多的资深业务员就会聚集在一起提供指导。 据她描述,她平均每个月可以成交四到五个订单。 在郑州,收入是非常可观的。
所谓“杀单”是销售人员常用的行话,意思是与客户达成一笔交易。 甜甜下单后不久,坐在记者斜对面的“马先生”(昵称)也下单了。
“这已经是他今天的第二笔订单了,按照每笔订单25%的利润佣金,包括奖金来计算,他已经赚了近5000块钱。” 甜甜说道。
这样的场景在记者试岗时经常出现。 尖刀团队总监杨晓峰(化名)发给记者的一份《终端客户聊天技巧》文档中,详细记录了一些“杀单”技巧和问答记录。 记者发现,当新人有强烈的获客意向时,管理者和班组长就会聚在一起出谋划策,研究如何让客户上钩。
据天天透露,她“杀死”的客户是一家“保健品生产商”。 8月18日,记者联系上天天的客户张娜(化名)。 据她介绍,就在使用“鹰眼智慧”系统两天后,她使用多年的微信号就被封禁了。 张娜说她再也不敢用了。
合法爬虫还是恶意爬虫
恶意爬虫涉嫌非法获取计算机信息系统数据罪
“这绝对是合规的,因为我们不直接参与销售数据。” 该公司人事负责人李孟海告诉新京报记者,“出售爬取的数据是违法的。”
该公司销售人员王伟(化名)给出了不同的答案。 王伟向新京报记者直言不讳地表达了自己的担忧。 “外呼机器人是非法的,之前就被曝光过。” 王伟说道。
爬虫技术是为了在互联网本身上传播信息而创建的。 通过网络爬虫,搜索引擎了解互联网的内容。 在网络安全领域,爬虫也被用来检测网站漏洞和网站可用性。
“爬虫技术的本质用途仍然存在,像百度、谷歌这样的公司,但互联网上的其他黑色产业眼里只有利润。 他们利用网络爬虫封装二手数据并分流用户,通过数据销售和流量牵引来获取利润。 。 从用户角度来看,危害主要包括恶意营销和网络攻击(网络钓鱼); 从网站角度来看,危害包括网络攻击、牟取暴利、影响企业正常服务、信息价值损失、用户流失等。”程白解释道。
中消协此前发布的《APP个人信息泄露调查报告》显示,约86.5%的受访者曾受到过推销电话或短信骚扰,约75.0%的受访者曾接到过诈骗电话,约63.4%的受访者遭遇过诈骗电话。的受访者曾收到过垃圾邮件,位列前三名。
大多数网站已经声明严禁此类爬虫软件。 北京伟衡律师事务所周浩律师认为,“网络爬虫必须遵守第三方平台的Robots协议来爬取数据,且获取的数据性质必须公开,不得包含个人信息、商业秘密、国家秘密”。和其他信息。 如果突破或绕过第三方平台的反爬虫政策和协议,则可能涉嫌非法获取计算机信息系统数据或者提供侵入、非法控制计算机信息系统的程序工具。”
Robots协议也称为爬虫协议、机器人协议等,它的全称是“机器人排除协议”。
“网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。它是业界通用的搜索引擎抓取协议爬虫软件干嘛用,但对恶意爬虫没有任何约束力。” 知创宇技术总监邓金成告诉新京报记者。
据腾讯发布的《2018上半年安全专题系列研究报告》(以下简称报告)显示,恶意爬虫通过自行分析构造参数的方式爬取或向非公开接口提交数据,获取对方不愿意大量获取的数据。 。
报告指出,据统计,旅游、社交、电商占据恶意爬虫流量前三大目标行业,占比分别为20.87%、18.40%、13.38%。
周浩表示,《网络安全法》和《个人信息安全规范》都强调,通讯联系方式(电话号码)属于重要的个人信息,未经同意不得收集。 提供收集个人信息的工具一旦使用就一定是违法的。
科技发展倒逼法律完善
收集重要数据或敏感个人数据需要归档
追根溯源,就是对利润的追求。
“一些所谓的大数据公司本身没有数据源,而是通过爬虫获取别人的数据。”程白说。
反登山斗争悄然进入白热化阶段。 然而,“逆爬”并不容易。 智创鱼404实验室副主任隋刚表示,规模较大的公司会有自己的反爬机制,但“有些爬虫可以绕过这些反爬机制”。
技术的不断发展正在倒逼相关法律的完善。 2019年5月,国家网信办发布《数据安全管理办法》征求意见(以下简称《征求意见稿》),对爬虫技术有明确的定义和规定。 第十六条规定网络运营者采用自动化方式访问、收集网站数据的,不得妨碍网站的正常运行; 自动访问采集流量超过网站日均流量三分之一,网站请求停止自动访问采集的,应当停止。
“不过,第16条在实践中可能存在一定的问题,对于导致网络无法正常运行的情况,没有相应的处罚措施,这可能是未来需要完善的地方。” 上海国际总部专职律师徐彦轩表示,京师多次参与企业隐私政策的制定。
同时,征求意见稿第十五条还规定,“网络运营者出于业务目的收集重要数据或者个人敏感信息的,应当向当地网信部门备案”。 徐彦轩认为,收集重要数据的记录保存系统可能是未来的监管方向。
新京报记者李大伟、罗一丹、实习生徐子林、编辑徐超、校对刘悦
记者邮箱:lidawei@xjbnews.com