微博审查机制分析

时间:2013/03/11 栏目:看中国 编辑:admin 字体:

根据第一份对于中国版推特──微博的审查机制的分析,我们可以在其中看到几乎是实时的审查效果。这也是超过4000位微博审查者辛勤工作的结晶。

微博是中国版的推特,它与2010年与中国用户见面。这项服务允许用户发表140字长度的信息,并使用 @用户 和 #话题 功能,就像Twitter一样,虽然,140个汉字比英语能承载多很多的信息。

在短短3年之间,微博已经吸引了3亿用户。他们每天要发送大约1亿条微博,相当于每分钟7万条。对于有关部门来说,这个特点使不可避免的审查变成一项棘手的工作。他们到底是如何做到的?

今天,Rice大学的Dan Wallach与几位合作人公布了关于微博审查机制的详细研究的结果。他们的研究方式使他们能够勾画出被中国政府使用的审查技术,并且计算出参与审查工作的工作人员人数,甚至探索他们的日常工作日程。

这份研究能够实现,是因为微博上的内容至少有一部份在发布前未经审查,而只在发布后(被审查)。他们的探究方法是以每分钟一次的频率收集一群特定用户发布的微博。然后他们追踪这些微博中哪些在后来被删除。

当然,追踪微博上的每一个用户是不现实的,所以Wallach与合作人把时间花在那些看起来被删微博更频繁的用户上,并假设在未来他们比其他用户更容易被审查。在这种人工技巧的帮助下,他们最终在去年追踪研究了3500位用户,这些用户每天发送的微博大约总共有4500条被删除,占比约12%。

并不是所有的删除都是由于审查,因为用户也可以删除自己发送的微博。Wallach的团队指出,根据他们自己的试错,他们发现两种删除的反馈信息是不同的。若是用户自己删除微博,则请求打开被删除的微博,会返回“微博不存在”的信息。但是,若微博因被审查而删除,则会返回“请求不允许”。Wallach的团队关心的是后者。

研究的结果是引人入胜的。Wallach说,在他们的数据组中,大约5%的删除发生在微博发布的8分钟之内,大约30%发生在1分钟之内。总体来看,90%的删除发生一天之内,虽然有的时候删除会在几天之后才发生。

考虑到微博在中国的流行,这些数字令人印象深刻。微博的管理团队是如何完成如此繁重的审查任务的?

Wallach的团队认为,这些数据使他们能够猜测微博的幕后在发生着什么:由于大部份的删除发生在微博发布的5﹣10分钟之内,微博的管理团队必须是以实时的方式来进行审查。如果审查员一分钟平均审查50条微博,那么必须有至少1400名审查员才能处理每分钟不断涌入的7万条微博。如果他们采用8小时轮班制,那全天共需要至少4200名审查员。

即使如此壮大,这支审查大军也需要一些技术支持。Wallach的研究表明,微博有运用一些技术与审查过程中。第一个是关键词警报。当一个关键词出现时,这条微博会立即在审查员的屏幕上被标出。但是,这绝非易事,因为中文的博大精深,和微博上广泛使用的网络语言、缩写短语,微博很难以此方式过滤。Wallach的团队指出,有关部门也特别盯住有发布违规微博历史的用户,也许是因为他们假设这些用户更有可能发布被禁止的内容(就像Wallach假设的一样)。

结果是,这些用户的微博比其他用户被删除地更快。Wallach说:“有较高被删微博频率的用户会发现,他们的微博被更快地审查。”

Wallach的团队也检视了24小时周期内的微博删除率,发现审查员在夜间没有日间那么活跃,意味着更少的审查员在夜间工作。所以,审查者们每天早上都面临着积压的工作。“他们在中午左右赶上进度”,Wallach的团队总结说。

有趣的是,在晚上7点,《新闻联播》节目正在放映时,审查也有所放松。

Wallach的团队也对哪种微博被审查感到兴趣。为此,他们检查了被审查的微博的内容。他们说,通常被删除的话题包含“支持叙利亚革命” “政府说谎” “滥用一胎政策”和“群交”等短语。 最快触发大规模删除的,则是那些把微博整体的热门话题(如性丑闻)与关于政府或警察的敏感话题结合起来的话题。

Wallach团队完成了一份令人着迷的研究,它对于中国新闻审查的机制提供了罕见而启发人的洞察。但是这次研究没有解决一个问题,那就是为什么中国有关部门允许微博在被审查前就公开发布?既然审查机器如此强大,为什么不延迟微博的公开发布一段时间,等到审查基本完成?

Wallach的团队看起来认为这是可能的。他们说,2012年8月1日,他们尝试了发布一条包含“政法委书记”的微博。Wallach说,“当我们提交一条包含敏感字符串的微博,系统会提示‘抱歉,此微博不适宜对外公开。如需帮助,请联系客服。’”所以,很多微博在他们进入公共视线之前就被屏蔽了。

不管是为什么原因,对新浪微博的进一步研究是必要的。Wallach的团队说,他们对于未来的研究有若干目标,其中一个是尝试了解微博对于需要删除的内容如何排序优先级。这完全依赖于团队得到数据的能力,以及有关部门不会追寻到以及查封团队的账号或赖以把数据传出中国的Tor网络。这是一项很大胆的工作!

 

来源:麻省理工评论( MIT Review)   译者:王晟

声明: 本文由( admin )整理编辑,转载请保留链接: ./archives/10399

微博审查机制分析:等您坐沙发呢!

发表评论