【新唐人2012年6月4日讯】(新唐人记者李韵综合报导)继谷歌公司针对中国网际网路审查系统的封锁,发布谷歌敏感词库、中文黑名单、黑名单词库、Google Chinese blacklist后,尼曼新闻实验室就中国数以千计的微博网页从网际网路消失的规律,对中国审查机器进行反向工程研究,研究似乎能证明一个假设:新浪微博删贴数量与媒体报道敏感事件的热度高度相关。而该研究还列出了一个有趣的发现:即什么时间最合适发不敏感信息。
《译者》网翻译了一篇来自尼曼新闻实验室的文章。文章表示,审查中国的网际网路是一件费心费力的工作,新浪微博拥有三亿注册用户,日发帖量超过一亿。但该文感到奇怪的是,为什么有些微博被删了,其他的微博却没有呢?哪些话题会被认为是“和谐社会”的最大威胁呢?
曾任美国《商业周刊》驻中国记者的麻省理工大学斯隆商学院的MBA学生章智竹希望揭开这个黑盒子。章智竹这学期就读伊桑•朱克曼的“互动媒体时代的新闻”课程。在做期末论文的时候,他收集了中国数千被删微博的数据来寻求答案。
他引用了香港大学新闻及传媒研究中心的研究结果。Cedric Sam 和King-wa Fu将新浪微博上最热门的内容进行实时智能化处理,并将2月1日以来超过12000条被删微博纳入其巨大的数据系统。
他利用Tableau这款可视数据软体,将这些被删的微博信息按时间顺序制成柱状图,而后又将政治敏感事件叠加进去来提供关联信息。
数据显示,从2月1日至5月20日,删贴最多的一天出现在3月8日:那天开始流传薄熙来即将下台并且正在被调查。
其次就是3月15日,那天薄熙来被解职。有趣的一个数据点出现在3月18日,一辆黑色法拉利造成的致命车祸。几乎所有关于车祸的信息都从网际网路上消失。章智竹发现那天新浪微博删贴数量居中。
还有一天4月22日缺少数据。当天,人权活动家陈光诚逃出山东。为何会缺少数据呢?4月23日的一则出错信息显示因“载入问题”而临时无法收集数据。
章智竹认为很可能那天中国微博信息流量突然太大,因此造成服务器瘫痪;当然也说不定是什么其他原因造成的。
章智竹也想研究3500个被审查最多的微博用户的关系。他提出了一个假设:新浪微博删贴数量与媒体报道敏感事件的热度高度相关。
他的这一假设与卡内基梅隆大学的一项类似的研究所得出的结论基本一致。该研究评估了5600万条微博,其中16%被删除。研究者发现一些关键词更容易被微博删除,比如真理部、法轮功、艾未未等等。
他们同时发现,通过揭示网路审查方式对现行事件和不同地理区域的变化,该研究能够根据动态的变化积极监控到中国社交媒体的审查状态。
最后,章智竹还评估了一条微博需要多长时间被删除。他发现,最快的,在刚刚发表4分钟的微博就被删除;最长的,管理者会花长达4个月的时间到处查找最终完全删除。
但对于在5月20日发表的并在当天被删除的微博,这款搜索软体要经过平均11小时才会发现什么被删除了。他怀疑一些微博是在几个月之后被删除的,因为那些微博中的内容突然重现于中国媒体。
他甚至也试过在新浪微博上发布一些比如有关陈光诚、薄熙来和台独之类的敏感信息,想看看会发生什么。结果不到14小时,他收到了来自新浪微博系统管理员的一封信,说他关于“陈光诚”的两个帖子“不宜公开”,已被审查。
研究数据还发现,在微博上发布政治敏感信息的最合适的时间是每个星期五晚上11点钟之后。章说有趣的是,每个星期六新浪微博删除信息的数量都很少,我不是很确定为什么是这样,也许网路审查员周末也要休息。
谷歌针对中共封锁推出敏感词搜索提醒服务
由于中共不停的加强网际网路管控,大量删贴封号,网民为突破被中共当局封锁的敏感词,智慧的发明暗语或代用词,但也很快被封掉,惹来网民怨声载道。
谷歌公司因反对中共当局对网际网路信息内容的审查,早在两年前就被迫在搜索服务方面退出大陆市场,转往香港。
虽然如此, 大陆用户在使用谷歌香港的搜索服务时常被中国网路审查系统干扰,一旦发现有谁搜索的信息与中共不对外公开的黑名单关键词匹配, 大陆的网路审查系统就会伪装成目标域名的解析服务给查询者返回虚假查询结果。于是, 网民看到的是 “网页无法显示”或 “连接被重置”。
《自由亚洲电台》报导,针对这个情况,谷歌推出敏感词搜索提醒网民,大陆使用谷歌搜索网路信息时遇到的问题不是因为谷歌搜索服务技术问题造成的,而是中国的网路审查系统,如防火长城对他们的搜索进行所谓的“重置”从而导致谷歌网页中断连接。
现在网民敲一个词,谷歌会提示“这个词是被中共封锁的”。把中共对网路不择手段、不计后果的封锁相当于在不停地提醒每个用户,你花了钱上网,但是你的网路是被中共过滤的,这些信息在中国还是搜索不到的。这些封锁还是在那儿,谷歌是没有去集中地做反封锁的手段,它只是看了哪些词是被封锁的,然后会提示网民。