(编者按:2014年7月12日上午,红辣椒时评研讨会围绕“大数据时代如何判断新闻事实与价值”主题,各位评委与来自中央、各省市近40家媒体评论员,以及各行业时评爱好者,就网络评论如何顺势发展等问题展开热烈讨论。本文系红辣椒评论评委、《中国青年报》评论部主任曹林的发言。)
亲们,上午好。今天咱们这个研讨的话题很高端——大数据时代,现在什么研讨会都要加个大数据时代,不加个大数据时代都不好意思说自己是高端的研讨会,甚至连算命的,咱们看不起算命的,但是人家说人生的大数据研究,立刻高端大气上档次了,其实我觉得咱们这个时事评论,和大数据有什么关系呢?咱们完全是赶潮流,大数据它需要数据的挖掘与分析的能力,尤其他需要一定的文本来让你来分析数据,但是评论也就是八百到一千字,哪有空间让你去挖掘大数据,而且现在写时评,都在追时尚,今天的新闻今天就要写评论出来,而大数据的挖掘需要有时间去深入挖掘,历史的数据等等,评论没有这个耐性去挖掘大数据。
其实我觉得,咱们还是应该回到一个很传统的话题,不必要非得说大数据,还是作为咱们这个评论员,时事评论员,怎么去分析数据,因为很多时候我们把数据作为论据,怎么来分析这个问题。对于咱们时事评论员来说,尤其重要。因为我觉得,在座的基本上都是文科生,文科生对数据非常不敏感,所以咱们文科生经常被人瞧不起,尤其是经常被方舟子骂,你们这些“文傻”,这个“文傻”比文盲好不了多少,为什么说“文傻”,就是对数据的缺乏抽象分析的能力。
举个案例,其实有时候面对一些很荒谬的数据,我们缺乏基本的识别、分析的能力。去年光棍节的时候,也就是败家节的时候,他们很多人都在淘宝上买东西,当天晚上淘宝的官方微博就非常兴奋的发了条微博,说你们知道我们今天卖得最多的商品是什么么?内裤,我们今天一共卖了200万条内裤,把这些内裤连起来有三千公里长,哎呀大家看到这个数据都去围观,我和我的老伙伴们惊呆了。因为经常看到类似的数字,很直观很形象。
我们说中国人爱吃方便面,我们每年吃的方便面连起来能绕地球几圈,中国人爱喝凉茶,每天喝的凉茶连起来绕地球几圈,中国的贪官很多,假如把这些贪官都抓起来怎样怎样,面对这种数字,一般都是呵呵一笑。缺乏“是不是这么回事”,计算算一下是不是真的有三千公里长,但这个世界上还真是有很蛋疼的人,有一个官方微博叫江宁公安在线,他还真就认真算了一下,按照这种算法,两百万条内裤三千公里长,平均每条内裤长多少呢?结果一算,大吃一惊,平均每条内裤长一米五,很多数字你假如说不留心的话,一带就过去了,但是你仔细的算一下你会发现很荒谬,所以后来央视有个著名的气象主持人叫宋英杰在后面跟帖调侃:“内裤一米五,汗滴禾下土”。
我们缺乏对数字这种敏感分析的能力,因为我经常写评论也经常跟学生讲评论,所以我对这个数据有我的想法总结一下,跟大家分享。咱们作为时事评论员,在面对数据的时候我们应该有怎样一个素养。比如说第一个,我们要警惕那些“野鸡数据”,什么叫野鸡数据,现在网上这种野鸡调查特别多,调查其实是一个非常严谨的事,怎么样去取样,什么样的人群,设置怎样一个议题,你不要像一些地方政府,设置一些幸福感的调查,选项就两个,幸福,很幸福,大家可想而知结果是怎样的。
我曾经看到一条新闻,很有新闻点,说外国跨国公司的员工,八成因为北京的雾霾不愿意到北京来工作。可能很多时评作者都看到过这条新闻,他非常符合我们这种评论的要求、需求,他有评论点嘛,他说你看北京的雾霾很严重,人家外国员工就因为雾霾的缘故不来,还有很多可以提问的点。但是你得仔细看一下这个数据的来源是什么,我仔细看了一下这个新闻,我在这个新闻里没有找到任何一个说进行了一个这样的调查,我说没有这样一个调查,你怎么得出一个这样的结论的?后来我在这条新闻,这条新闻有两千多字,在一个很不起眼的地方,看到他举了一个案例,说曾经有一个公司要派一个员工到中国来,结果20名员工里面18名员工不愿意到中国来,他们说就是因为雾霾问题,但是这只是一个个案啊,只是一个公司,你怎么能根据这样一个不知道什么来源的这样一个说法,就总结出这样一个很大的结论,八成员工因为雾霾不愿意来之类的,这样的野鸡数据太多了,网上吸引眼球。
还有一个调查,是电视台做的,说开着这个豪车去搭讪,去泡妞,成功率要比开一般的车要高很多,在网上也引起了很大的讨论,说现在女的太功利了,宁愿在宝马里哭,也不愿意怎么怎么笑。但是你仔细的看这个调查,就有问题了,第一个是调查的地点,他是在夜店门口调查的,在夜店问的那些女的,这是第一点。第二点,样本很少,他就问了7个女的,然后他就做了个调查百分之多少百分之多少,现在网站做这样的野鸡调查的特别多,你赞成还是反对,这样的问题很复杂,不是简单的非是即非,他中间有无限多的状态。网友很容易就被你设一个简单的议题,支持还是反对,其实也就两种选择,支持还是反对,这样的野鸡调查太多了,最后就产生一些这样的野鸡数据。
第二个我觉得要警惕的是,要意识到这样一种数据的相对性,我们经常容易被这样一些数字的描述牵着鼻子走,比如说我曾经看到过一个调查说当下有六成的人不相信教育能够改变命运,他非常符合我们评论的一个点——读书无用论,本身我们很多人已经有了这样一个判断,读书无用,这个调查又非常符合你的偏见、你的想法,立刻就顺着他这个标题来了,根本不判断。其实数据有他的相对性,他有个六成,就有四成,其实假如你换一个角度来看,当下的社会爆发了这么多的不公,曝光了这么多得萝卜招聘,但是竟然还有四成的人相信教育能改变命运,这难道不是一个很好的事么?数据总是有这样的相对性,你说一个99%,那肯定有个1%,很多时候我们看评论同样一个事情,基本上大家的角度都一样,90%的评论都一样,就因为大家都看到了数据的这一面,而没有看到数据的另一面。都看到了这个标题党里的99%、九成,而没有看到数字的另外一面。有时候好角度就是你能不能看到被忽略的数字的另外一面。
第三个我想谈的是,我们要警惕那些坏数据。所谓坏数据,更刚才那个也差不多,就是似是而非,我曾经看到过河南某报的一个调查,说因为去年公务员的“八项规定”压缩了公务员的福利,然后大家都流传说产生了很大的震荡,很多公务员辞职,但也有人说公务员不会辞职,虽然他的福利得到了压缩,但是他还有很多隐形福利,所以河南某报就做了个调查,他对在岗的公务员做了个调查,结果发现八成的公务员曾经有过想离职的想法,但是最终没有一个人实践,很多人一看,也是啊,没有一个人实践,不敢离开,没有人愿意离开,没有能力、没有资本敢到市场上去竞争。其实这个调查存在很大的问题,废话嘛,你问那些在岗的公务员,当然没有一个人实践啦。就好像去年常说现在春运“一票难求”,买票难,然后某某TV的记者,就到火车上采访乘客,说你买到票了嘛,回答买到了,他买到票了嘛,买到了,一看大家都买到票啦,没有什么一票难求啊,这不是废话嘛,你在火车上问人家买没买到票,他没票也不敢说啊。所以这样忽悠你的数据特别多。
评论员基本上的习惯就是百度一下,其实百度得到的那些数据都是二手的、三手的,根本不权威,甚至很多都是假数据,很多都是假新闻,很多都是专家估算的。我们要做一个判断,要想让自己的判断建立在一个权威的数据上,而不是简单的百度一下,百度一下已经是其他人把那个数据进行剪裁了。所以数据很多时候特别具有迷惑性,大数据时代,怎么去挖掘数据,怎么去进行新闻事实价值的判断,我就讲这些,谢谢大家。
文/曹林