专业新闻人要做的是筛选和清洗、挖掘工作

2016-07-28 中国发展网

IMG_4025

摄影/方士武

第十一期“网络传播沙龙”上谈到数据与新闻之间的关系。

王叁寿:

举一个简单的例子,刚才我们拍照的哥们,你说那个摄像机采集数据很容易,干吗只是放我一张图片,能不能多放几张,选一张帅的。当你获取数据免费的时候,为什么不能用更好一点的呢?现在没有大数据的支持,很多新闻做不出来,举几个小例子。

第一,之前天津爆炸是氰化钠爆炸,当天津氰化钠爆炸的时候,因为马上出新闻了,说是氰化钠的一个仓房爆炸了,你们谁能在一个小时之内就把全中国的氰化钠产业地图拎出来,没有媒体可以做到这一点。现在通过这样一个数据库,当我输入氰化钠的时候,当然这个数据库可以在电脑上看,一秒钟就会告诉你全中国有哪些是做氰化钠的,这些公司分布在哪个省、哪个市、哪个街道上,每个公司是存活了多少年,每一家氰化钠公司到底什么时候注册的,每一家氰化钠公司整个规模到底有多大,一秒钟就出来了。我的意思,你没有大数据支持,你能做这条新闻吗?你做不了。

第二,前两天我们看到和我们吃穿住行的一条新闻,说绝味鸭脖细菌超标。当你想深挖绝味鸭脖的时候,我想反问你能在一秒钟把绝味鸭脖在全中国店铺的布局拎出来吗?比如你想做一个绝味鸭脖中国产业布局图,你能做出来吗?你做不出来,因为你没有这个数据。而在我的数据库里只要输入“绝味鸭脖”的话,一秒钟就出现全中国的布局图。如果没有大数据的话,还是做不出来。不是说改变了谁,是让方法产生了变化。

叶蓁蓁:

就像“谁在代表我”这么一个产品,其实它的基础就是需要有一个完整的数据库,这个数据库的资料越丰富,将来算出来的匹配度就会越高。我们大量的时间是花在了做数据库或者完善数据库上,这个产品我们总共花了一个半月的时间,包括过去电子化已经成型的数据库,除此之外,我们觉得不够完善,所以我们又人工手动地补充了很多的内容,就是数字维度的精确,花了一个半月的时间在做,七八个人,其实这个东西很难算,因为有一些数据的丰富是通过人民日报各地的分社记者找当地很多人要更多的资料过来,很难一下子统计过来,就是这几个人在干,可能不同的人在参与,大家参与的都不同,但是我们核心的有七八个人。这就引出另外一个问题,其实我们也只是处在数据新闻的门槛初级阶段,表现的就是数据的来源太缺乏了。数据库不同数据之间的互相印证又非常困难,因为数据不够,所以无法去印证这个数据库是否可靠,那个是否可靠。互相之间的纬度交叉率很低,只能说明我们还处在大数据时代的“蛮荒时代”,我们还只是“野蛮人”。

孟威:

数据和新闻的关系,我觉得数据和新闻两个加起来就是数据新闻的说法。但是,数据我想是新闻的一个基础,因为新闻有一个数据源的问题,所以数据需要有一个高质量的数据源作为它的基础的保障,所以没有数据是不能成为新闻的。因为我们现在的数据概念,刚才已经说过了,不完全是一种数字的概念。比如自然的信息,比如传统的文化生产所产生的信息,比如我们人体自身的信息,都是一种数据信息。所以,没有这些信息的话,我们在现在的社会再成就一条新闻的话,可能是非常困难的,这是一种基础的关系。

同时,我想数据也不等于是新闻。因为刚才说过了,我们大数据还处在一种比较混沌的状态当中,所有的消息拿过来、数据拿过来都是新闻吗?不是的。所以,这就是我们专业新闻人所要做的这样一种筛选和清洗、挖掘工作的价值所在。