8月28日,华住集团旗下连锁酒店用户信息被曝疑似泄露,卖家在“暗网”打包售卖5亿条住客数据。此事曝光后,除了再一次引发公众对网络信息安全的拷问,肆无忌惮出售公民信息的“暗网”也引发了公众的担忧。
什么是暗网?
所谓“暗网”(Darknet或Dark Web)指只能通过特殊软件、授权或对电脑作特别设置才能访问,在流行的搜索引擎上无法查到的特殊网络。
迈克尔·伯格曼将当今互联网上的搜索服务比喻为像在地球的海洋表面的拉起一个大网的搜索,大量的表面信息固然可以通过这种方式被查找得到,可是还有相当大量的信息由于隐藏在深处而被搜索引擎错失掉。绝大部分这些隐藏的信息是须通过动态请求产生的网页信息,而标准的搜索引擎却无法对其进行查找。传统的搜索引擎“看”不到,也获取不了这些存在于暗网的内容,除非通过特定的搜查这些页面才会动态产生。于是相对的,暗网就隐藏了起来。
当然,所谓“暗网”,并不是真正的“不可见”,对于知道如何访问这些内容的人来说,它们无疑是可见的。2001年,Christ Sherman、GaryPrice对Hidden Web定义为:虽然通过互联网可以获取,但普通搜索引擎由于受技术限制而不能或不作索引的那些文本页、文件或其它通常是高质量、权威的信息。
暗网的种类
一种是技术的原因,很多网站本身不规范、或者说互联网本身缺少统一规则,导致了搜索引擎的爬虫无法识别这些网站内容并抓取,这不是搜索引擎自身就能解决的问题,而是有赖整个网络结构的规范化,百度的“阿拉丁计划”、谷歌的“云计算”就是要从根本解决这一问题。
另一个原因则是很多网站根本就不愿意被搜索引擎抓取,比如考虑到版权保护内容、个人隐私内容等等,这更不是搜索引擎能解决的问题了。如果他们能被搜索引擎抓取到,就属于违法了。
数据显示,能够搜索到的数据仅占全部信息量的千分之二。而对暗网的发掘能扩大搜索数据库,使人们能够在搜索引擎上搜索到更多的网页、信息。
暗网、深网、互联网
如今我们每个人都上网,我们大多数时间所说的"上网"和"联网"都指的是与互联网的连接,它始于1969年美国的阿帕网,也就是现在的因特网。
暗网和深网实际上都是从英文翻译来的,暗网即dark Darknet或Dark Web;深网则译为Deep Web、Dark Web。
暗网是指需要通过特殊软件、特殊授权、或对电脑做特殊设置才能连上的网络;
深网是指互联网上那些不能被标准搜索引擎索引的非表面网络内容。简单来说,暗网是深网的一个子集。
暗网的登录方式
从暗网的定义中可以看到,暗网是需要通过特殊软件、授权才能连接的网络。也就是说,从实现逻辑上来讲,暗网不是随随便便就能进入的,暗网链接需要一定的契约、技术手段和资金支付。
虽然Tor 项目联合创始人 Roger Dingledine 指出,大部分 Tor 用户访问 Tor 隐藏服务,只是想隐藏身份,并对出席 DEF CON 会议的与会者表示,暗网没有真的存在,它们只是少许网页。
但是,这不能否定一个反向的逻辑,即大多数登入暗网的人都是通过Tor洋葱网络实现的(当然也有部分通过I2P隐形互联网项目连接)。Tor,这个由美国情报局发明的工具,戏谑性的成为如今大多数人进入暗网的首选方式。
暗网有哪些危害?
暗网”的兴起甚至比intenet的流行还要早一些:上世纪70年代,一些黑客为了私密在线交流的需要,架构了独立于当时流行的互联网体系ARPANET之外的秘密网络体系,“暗网”的使用者可以从互联网上接收收据,但普通互联网在无授权情况下无法搜索,也Ping不出“暗网”的地址和域名。