Facebook的数据挖掘
不论“大数据”概念是不是个陷阱,我们的时代,互联网巨头坐拥海量信息是无人可以否认的事实,社区产品和社交产品赖以生存的基础就是从用户那儿来的数据。
他们都是怎样八仙过海、各显神通让你感受到大数据的?比如,去年年终的时候,你肯定看到众多好友在微信朋友圈儿分享了一张“订制”的图片,在微信产品成长历程的时间轴中标注你加入的时点;你可能在登录豆瓣电台后,才发现通过一个特别的回忆通道,豆瓣已经帮你记录了一年来的音乐足迹,从哪天注册哪天听第一首歌哪天听的很悲伤……无一遗漏;如果你是知乎用户,你肯定搭乘了一架“时光机”,直到这时一组组数据才让你猛然发现,你曾经写下的回答已经被上万的人分享……
这些贴心而极具煽情功效的产品背后,就是基于数据挖掘的最基本形态。这些体贴的数据化产品,常常为你一边绞尽脑汁写年度总结一边担心年底红包缩水的灰暗生活提供些许慰藉(支付宝的账单除外,这差不多是提醒了“过去一年造了太多孽”的恐吓信吧……)
你知道SNS霸主Facebook是怎么玩转大数据的吗?Facebook知道你什么时候跟别人约会,什么时候分手——对,就这么简单。
《大西洋月刊》一篇最新的文章发布了一张有趣的关系图(如下),显示了Facebook部分用户发帖数随时间变化图。这是什么意思?
这张图来自Facebook。就在今年情人节后第三天, Facebook通过其开发博客公布了其数据研究部门科学家团队的一项发现,即利用Facebook网站的统计数据,可以判断发帖的用户是否、何时擦出了爱的火花。联想到一首古诗“不识庐山真面目,只缘身在此山中”,换句话说,Facebook可能还比某些情侣早一步察觉他们之间萌生了爱意。
和传统线下结为恋人的过程类似,社交网络的用户确立恋爱关系也会经历所谓的“求爱”阶段。Facebook的科学家卡洛斯·迪乌克(Carlos Diuk)透露,沿着时间轴观察,在一段网恋的求爱期,两位Facebook用户的发帖都会增多。而一旦真正认准了对方就是意中人,两人在对方Facebook留言板上发的帖子都会减少。原因可能是共浴爱河的恋人花了更多的时间线下相处。
迪乌克这样用数字来解释上面的一切:
我们通过大量数据发现,在成为恋人之前的100天里,日后坠入情网的两人相互发帖缓慢地逐步增加。假设恋情正式开始的那天是“第零天”,这类帖子的数量是从“第零天”起越来越少。我们发现,“第零天”以前发帖最高峰的12天里,平均每天发1.67贴;而“第零天”以后发帖最少的85天里,平均每天每天发布1.53贴。
再加上点儿常识和心理学分析,解释这个现象就更简单:恋人之间求爱结束以后,双方共处的时间增加,线上互动就给线下现实世界的互动让位了。
迪乌克说,数据还显示了另一个有趣的趋势,即在告别单身之后,情侣之间普遍爱意大涨,互动的内容会越来越甜蜜,传递正能量。正如Facebook的下图趋势线所示,在第零天和第零天之后的第一天,恋人之间发帖数量剧增(比对上图)。
活跃用户规模已经达到2.7亿的Facebook掌握了数以亿计的这类用户信息。而Facebook这项分析的数据收集对象是2010年4月到2013年10月之间宣布恋爱满周年的情侣用户,并未包括这期间恋爱关系有变的用户。在分析恋人们彼此多相爱的时候,主要针对英语用户。
迪乌克的同事、Facebook数据研究团队的另一位科学家格登·史塔特(Bogdan State)还透露了两项好玩儿的发现:
第一、如果通过Facebook发展的一段恋爱关系能维持三个月以上时间,很可能会持续四年甚至更久;
第二、恋人分手可能性最大的月份是5月、6月和7月。
这显然是快要取代心理学专家和搞社会调研的那群人的饭碗的节奏了。
不过你可能会说,这种研究差不多也算情人节营销吧?不瞒你说Facebook还真的是喜欢利用情人节档期来玩转数据分析。
早在2012年始,Facebook的数据研究团队就开始利用用户主动公开感情的数据做出一些有趣的尝试。2011年底,Facebook开始让用户在社交网络上分享自己(数据来自Spotify插件)的收听习惯,Facebook的数据工作团队也同一时间开始工作。
这些带着一颗八卦新的数据工程师们,将情感关系和音乐这两个概念融合在一起,能够挖掘出哪些歌曲是用户开始一段新感情时喜欢播放的,而哪些歌曲是在他们分手后常提到的。具体的分析工具我们不得而知,然而看看这份发布于2012年情人节当天的排行榜吧,是不是比一味的情人节推广广告更讨巧、更有趣味?
新的感情开始时人们最喜欢的歌曲:Don’t Wanna Go Home(音乐人Jason Derulo的《不想回家》);而最受欢迎的失恋歌曲TOP 10包括:
“Don’t Wanna Go Home” by Jason Derulo
“Love on Top” by Beyoncé
“How to Love” by Lil Wayne
“Just the Way You Are” by Bruno Mars
“Good Feeling” by Flo Rida
“It Girl” by Jason Derulo
“Stereo Hearts” by Gym Class Heroes featuring Adam Levine
“Criminal” by Britney Spears
“No Sleep” by Wiz Khalifa
“Free Fallin’” by John Mayer
相应的,当人们分手时排在榜首的歌曲是的The Cave(Daniel Ek fave Mumford & Sons乐队的《洞穴》);而陷入爱河者最喜欢曲目TOP 10包括:
The Cave” by Mumford and Sons
“Crew Love” by Drake
“All of the Lights” by Kanye West
“Rolling in the Deep” by Adele
“Take Care” by Drake
“It Will Rain” by Bruno Mars
“We Found Love” by Rihanna & Calvin Harris
“Call It What You Want” by Foster the People
“Love You Like a Love Song” by Selena Gomez and the Scene
“Without You” by David Guetta featuring Usher
除了博你一笑,Facebook还让这些分析结果用在基于数据的推荐引擎上。产品工程师们基于各种推测结果推出了新的社交服务——向用户提供最契合心境的曲目。
Facebook的数据挖掘团队就像一群已经掌握了爱情“读心术”的魔法师,而从谈(ren)情(zhi)说(chang)爱(qing)做起使用大数据,这个路数看起来更接地气。这让人想到国内大大小小的婚恋平台和社区,是不是还没意识到自己还停留在1.0时代呢?未来,真正的红娘和“知心姐姐”也许就是社交网站!
(本文系作者@若离 授权钛媒体发表,并经钛媒体编辑)