开发者俱乐部
标题:
《卫报》是怎么开发出内部数据分析系统的?
[打印本页]
作者:
jack
时间:
2016-3-14 18:08
标题:
《卫报》是怎么开发出内部数据分析系统的?
编者按:本文作者为 Joseph Lichterman,尼曼新闻实验室(Nieman JournalismLab)的特约撰稿人。
《卫报》的 Ophan 系统自从 2011 年上线以来,一直不断更新。
有一次,Katharine Viner(现《卫报》美国版主编)问报社里的程序员:为什么《卫报》内部的数据分析工具 Ophan 不能在移动端上用呢?
没过多久,《卫报》的程序员便开发出 Ophan 的移动版。现在,从移动端查阅分析数据已成为 Viner 每天都做的事情。
“我起床后,首先就是转身看 Ophan,然后看 Twitter,然后再看邮件和个人的东西。” Viner 告诉我说:“瞬息万变,很难预测。有时效果好的事情是我们先前没有预料到的,而我们预料效果会好的事情结果却不然。如果不知道事情发生的实时情况,就不能算了解事情的状况。有了移动版,我就可以在等车时看,什么时候都可以看。”
不光是 Viner 很爱用 Ophan。Ophan 是为了《卫报》在美国、英国以及澳大利亚的编辑部而设计的,总共大约有 900 人可以登入这个数据分析系统。这个系统的理念,就是让员工可以根据分析数据来改进报道,使之有更多人阅读,并为读者提供相关的信息。
例如,2015 年初,《卫报》发现有一篇报道的流量发生了激增。这是篇 2013 年 2 月的旧闻了,讲的是前海豹突击队狙击手 Chris Kyle 之死。但由于有部叫《美国狙击手(American Sniper)》的新电影上映,故事正是基于 Kyle 一生改编,这篇旧闻重新获得了关注。为了充分利用这波流量,《卫报》重新推了这篇快两年前的文章(但也有 Twitter 用户奇怪为什么这篇旧闻像新闻似的被推了出来)。
《卫报》希望员工利用 Ophan 来定位流量来源,或者根据数据来对内容作出修改。例如,当员工发现有很多来自 Reddit 的流量涌向某篇报道,或用户停留在某篇报道上的时间多于一般情况,员工便可以微改标题来迎合社交平台的趋势,或添加新链接来为读者提供更多信息、让他们接触到《卫报》别的内容。
“每个人都能看到自己得到的效果。”《卫报》美国版助理编辑 Mary Hamilton 说:“生产过程涉及到了许多人。如果他们改了一下标题,加了个链接,或在开头加了点东西,他们可以实时看到修改的效果。他们可以测试自己的灵感,看看结果如何,而非无从得知自己的感觉是否行之有效。”
为了使员工会去用这个工具,《卫报》需要把它做得易用、易懂。公司里的程序员做了一种 JavaScript 书签,一按就能带用户去到当前页面的 Ophan 分析数据。这样用户就能看见该页此时此刻的表现如何。Hamilton 说,这个工具只分析一周的内容,并主要集中于注意力持续时间和页面浏览量,因为 “这些是每个人都懂的东西”。
这种做事风格在老牌报社实属少见。去年,美国全国公共广播电台开发了自己的内部数据分析系统。与《卫报》的系统类似,也是让所有员工对所发报道的数据有更好的了解和利用。
别的新闻机构也在推动对分析数据的利用。《纽约时报》在 2014 年发布的创新报告中,号召编辑室和研发中心、产品、技术、数据分析和设计等 “读者体验部门” 要加强合作和沟通。
正是这些部门间的良好关系,使《卫报》得以持续地改进 Ophan 系统。Ophan 诞生在 2011 年的一次黑客马拉松上,作者是《卫报》的首席架构师 Graham Tackley。受众互动和开发小组一直保持讨论如何改进这个工具。通常,当编辑部的同事第一次使用 Ophan 时都会提出增加新功能,就像 Viner 要求有移动版一样。
“我们有一个持续而公开的流程,让编辑的反馈得到定期答复。” Hamilton 说:“开发总非常敏捷,我们总是先把最小可用的功能做出来,然后再进行迭代,而不是追求一下子就做得很漂亮、完美。”
Ophan 刚上线时,只记录 3 分钟的流量数据。但之后《卫报》持续地添加新功能,使得编辑可以查阅一切内容,无论是一篇文章、一个版块还是《卫报》全站都可以。《卫报》受众开发编辑 Ian Saleh 告诉我,近期 Ophan 添加的一项新功能,是当流量满足一定条件时,员工可以收到电邮通知。Saleh 一边说一边给我展示了他长长的通知列表。
其中一类通知,流量条件是当《卫报》美国版的一个页面每分钟从德拉吉报告(Drudge Report)来的浏览量多于 1000,或当一个页面每分钟从未知站点来的浏览量至少有 500。
Saleh 称,这样可以很好地简化数据,并确保编辑和记者看到的信息是对他们很重要或很相关的。
他说:“我们知道,编辑室里的人很忙。我们也知道,工具可以开发得很炫。但如果一个编辑或记者每次得花 20 到 30 分钟才能从 Ophan 汲取出信息,或者成为专家才能利用好 Ophan,这对于他们是很大的工作量。”
Ophan 现在的一个试验性功能是实时显示人们是因为搜什么词而从谷歌进入《卫报》网站的。由于谷歌的关系,《卫报》只能获取到 10-20% 的搜索关键词。但 Hamilton 说,这样也已足够令他们发现许多东西。
“这样子将谷歌流量化为易于人去解读的形式非常有意思。” Hamilton 说道:“这能很好地让编辑室里的人适应基于这样的数据的新趋势。原来那一大堆的谷歌流量其实是一个个人坐在电脑前敲键盘、点进了《卫报》。”
欢迎光临 开发者俱乐部 (http://xodn.com/)
Powered by Discuz! X3.2