当前位置:主页>科 研>学术交流>

疏重于堵 如何应对网络爬虫流量很重要

网络爬虫(也被叫做网页蜘蛛、网络机器人)是一种能够“自动化浏览网络”的程序,它们被广泛用于互联网搜索引擎或其他类似网站,以获取或更新这些网站的内容和检索方式。它们可以自动采集所有其能够访问到的页面内容,以供搜索引擎做进一步处理(分检整理下载的页面),而使得用户能更快的检索到他们需要的信息。



 

  企业Web流量中有高达60%可能是由网络爬虫产生的

现在,国际CDN企业Akamai发现,在企业Web流量中有高达60%可能是由网络爬虫产生的,而这些爬虫则是由用户或其他程序控制,并可能模拟人类的Web访问行为。几乎所有在线业务都可能受到各种类型的爬虫流量的影响。这可能包括抓取内容或价格信息的爬虫、用欺骗手段增加广告收入的自动“点击”爬虫、购买限量供应商品及服务而使合法客户无法正常购买的“交易”爬虫等。

为了阻止上述情况,企业往往会采取爬虫检测或防御解决方案来实现Web流量的自动发现及拦截,防止网络爬虫流量影响到企业网站的正常访问与响应,进而对业务和IT产生一定的负面影响。

当然,有时爬虫活动也可能会对企业业务产生有益的影响,但对站点性能的影响则不然。因此,企业机构需要一种新的方式,这种方式不仅要能够识别所遇到的爬虫活动类型,而且要能够提供多种超越简单拦截的、妥善应对不同类型爬虫流量的最有效的技术。

对此,爬虫管理器技术方案就显得相当重要了,Akamai云安全解决方案高级副总裁兼总经理Stuart Scholly表示,面对Web上充斥着爬虫,目前企业普遍面临两个选择,要么拦截要么默默忍受。但是很遗憾,这两种选择都不理想。而Bot Manager(爬虫管理器)将改变这种局面,该方案将给予企业客户能力和灵活性,使其可以根据业务目标,部署成功的爬虫管理策略。



 

  企业如何应对网络爬虫流量变得相当重要

与仅能实现Web流量自动发现及拦截的传统爬虫检测或防御解决方案不同,Bot Manager方案旨在为在Web上开展业务的公司提供支持,使他们在处理爬虫时能够采用更新、更全面的策略。通过帮助用户更好地识别并了解哪些类型的爬虫流量进入他们的站点,以及提供超越简单拦截的多样化策略,Bot Manager能够帮助客户采取最恰当的措施,更好地控制爬虫流量对业务和IT产生的正面或负面影响。

从许多方面来看,当企业进行在线销售时,爬虫活动是一种“经营成本”,直到现在,也没有一种好的方法来帮助企业深入了解爬虫流量,并在此基础上做出真正明智的决策。而在部署了Bot Manager后,来自互联网零售商、美国汽车零部件有限公司(U.S Auto Parts Network,Inc.)的IT总监William Avellan则表示,他们已获得了足够的信息,使其能够解决长久以来面对的所有爬虫问题,包括内容窃取、价格信息爬取,甚至能够识别托管这些爬虫的IP传输运营商等等。由此可见,面对不可避免的网络爬虫,如何进行更为有效、更高级别的管理,对于企业业务来说,才是一条真正的“疏通之道”。

(责任编辑:安博涛)

分享到:

更多
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
  • 微笑/wx
  • 撇嘴/pz
  • 抓狂/zk
  • 流汗/lh
  • 大兵/db
  • 奋斗/fd
  • 疑问/yw
  • 晕/y
  • 偷笑/wx
  • 可爱/ka
  • 傲慢/am
  • 惊恐/jk
用户名: 验证码:点击我更换图片
资料下载专区
图文资讯

我要用1T带宽DDoS你:这句话竟然拿到了10万

我要用1T带宽DDoS你:这句话竟然拿到了10万美

利用DDoS攻击威胁企业以勒索金钱,是一件太有利可图的事情,以致于一个网络犯罪团伙在...[详细]

这种密钥真得破不了:量子密码学研究新突破

这种密钥真得破不了:量子密码学研究新突破

通过同一个光子分流器输出端口的光子无法继续分离 剑桥大学和东芝欧洲研究分会的研究...[详细]

什么是SS7?黑客是如何滥用SS7的?

什么是SS7?黑客是如何滥用SS7的?

一谈及到网络安全问题,用户们总是觉得很头疼。除去要记住你的每一个账号以及对应的密...[详细]

针对物联网设备的攻击过程概述

针对物联网设备的攻击过程概述

分享到:据了解,Avast公司的安全研究人员入侵了一台Vizio智能电视,并成功获取到了目...[详细]

漏洞与补丁不是一回事 打上补丁也会有漏洞

漏洞与补丁不是一回事 打上补丁也会有漏洞

漏洞和补丁之间存在相互作用关系,它在任何大型机构的信息安全活动中都是必不可少的部...[详细]

返回首页 返回顶部