TA的每日心情 | 开心 2016-10-18 06:23 |
---|
签到天数: 72 天 连续签到: 1 天 [LV.6]常住居民II 扫一扫,手机访问本帖
|
一项针对超过 1 0 0 0万条推特消息的分析表明 ,用户会在不知不觉中暴露自己的社会经济地位 。和性一样 ,金钱也是大多数人避免在公众场合谈论的话题 。但我们却经常留下会暴露我们经济地位的数字痕迹 ——即使是在字符数限制在 1 4 0以内的推特消息中 。一项针对 5 0 0 0多位推特用户发表的大约 1 0 8 0万条推文的分析显示 ,这些简练的信息足以揭示用户所处的收入阶层 。美国宾夕法尼亚大学研究自然语言处理 ( n a t u r a l l a n g u a g e p r o c e s s i n g )的博士后研究员丹尼尔 ·普雷奥蒂乌克彼得罗 ( D a n i e l P r e o . i u c P i e t r o )和同事 ,根据用户自定义的职业 ,将 9 0 %的上述样本归类到相应的收入组里 。接着 ,他们用一个能从数据中学习并能基于数据进行预测的机器学习模型 ,识别出了每个收入组的独有特征 。然后 ,他们用这个机智的模型对剩下的 1 0 %的样本进行测试 ,结果 ,模型成功预测出了这部分用户的经济状况 。正如研究人员 2 0 1 5年秋天在 《公共科学图书馆 ·综合 》 ( P L O S O N E )杂志上所描述的 ,高收入者倾向于谈论商业 、政治和非营利工作 。低收入者的话题大多局限在个人方面 ,比如美容秘诀和个人经历 。普雷奥蒂乌克彼得罗说 : “高收入者将推特作为传播信息的工具 ,而低收入者更多地将其用于社交 。 ”这项分析还揭示 ,挣钱越多的人更易表露出恐惧或愤怒 。在之前的机器学习研究中 ,普雷奥蒂乌克彼得罗和同事已经预测出了推特用户的性别 、年龄和政治倾向 。他们甚至能发现用户患上产后抑郁 ( p o s t p a r t u m d e p r e s s i o n )和创伤后应激障碍 ( p o s t t r a u m a t i c s t r e s s d i s o r d e r )的一些迹象 。接下来 ,研究团队还将继续优化其模型 ,不过 ,普雷奥蒂乌克彼得罗说 , “机器学习的威力归根结底源于获得的数据 ,人们应该意识到自己是不是在不经意中透露了私人信息 。 ” |
|