林肯译介 | 利用推特信息衡量公众对城市的态度(节译)

2016年08月18日
Other

作者:Justin B. Hollander & Henry Renski

在林肯土地政策研究院的支助下,美国塔夫斯大学城市态度实验室(Urban Attitudes Lab)的Hollander教授和Renski教授带领学生探索如何能更好地利用推特(Twitter)信息来衡量公众对城市的态度。本文是研究成果之一。

评估一个社区或一个社会的状况时,幸福指标可能比常用的经济指标更为重要。然而,作为一种主观感受,幸福是很难被准确定义的。判断一个人是否幸福最好的办法就是让其自己判断,我们可以通过采访来调查特定人群的幸福程度,但研究对象数量庞大时,调查成本很高昂,这种方法就不切实际了。

如今,一种新兴的调查方法可以解决这个问题。通过人们在社交媒体上发布的微博内容来判断人们的情绪,从而间接地衡量人们是否幸福。这种方法相对简单、低廉和快速,分析数据时自动化程度较高,在处理大量的数据时可以节约许多人力、物力和财力。但要注意,由于使用社交媒体的人群具有一定的局限性,以拥有智能手机的年轻人居多,由此得出的结果并不能代表广大的民众。

利用人们在社交媒体上表达的内容来分析情绪的方法称之为情绪分析(sentiment analysis),这是从内容分析(content analysis)方法发展过来的,可以用于处理大规模的社会媒体数据。传统的内容分析借助于研究人员通读文件,对特定的语言编码后进行分析。而情绪分析是一个很自动化的过程,采用一个情绪字典和一个计算机程序来分析大规模数据。现在已有一些研究人员和机构利用这个方法研究公众在面对不同事件时的情绪变化,也有研究社会发展程度和公众情绪之间的关联。本文介绍的研究是情绪分析在城市问题研究中的应用。尽管这个领域还很新颖,而推特情绪分析已在城市研究和城市规划中有了一些成功的运用。

在林肯土地政策研究院的支持下,我们于2013年研发了一款名为“城市态度”的软件并投入使用。这是一款数据采集和分析软件,有两个主要功能,分别是分析大量的文字数据和下载推特信息以及博主的地理位置信息。软件里还装有一本名为AFINN的字典,该字典是Finn Arup Nielsen开发的,它给每个带感情色彩的词打分,从正5到负5之间的整数分值,代表这个词所表达的正面或负面的程度。比如,“虐待的”(abusive)这个词取值(-3),“满意的”(satisfied)取值(+2)。最新版的AFFIN字典有2477个词,并能识别一些常用的网络词,比如,它能识别looooove为love。

利用这个软件,我们可以扫描博主发到推特上的所有文字,并逐一与预设的2477个带有情绪色彩的关键词匹配并打分。一条推特信息中,所有正面关键词得分之和减去所有负面关键词的分数就是最终得分,根据分数的高低可以判断博主对于社会上大事件或政府新推政策的态度,大量博主的态度则反映了群体的态度。这个方法还可以用来预测金融市场的走向。

此外,研究人员可以自主设定所需数据的时间段或自定义关键词及其对应的分数,软件就可以根据输入的条件统计出所需的数据。总之,这个软件类似于一个自主的数据分析器。未来,研究人员还可以通过与Yelp, Foursquare, and Facebook这种社交媒体的合作,丰富数据来源。

我们利用这个软件探讨了衰退型城市中的民众会不会比成长型城市的民众有着更多的负面情绪,这一问题的研究对于衰退型城市的规划和政策是有重要意义的。我们按以下两个条件选择研究226个中等规模的衰退城市:(一)1970年城市人口在30,000到250,000之间;(二)40年内人口减少超过5%。同时,我们也选择数百个成长型/稳定型城市作为对照组。通过采用倾向得分匹配(propensity score matching)方法,我们最终找出最符合匹配条件的50个衰退型城市和50个成长型/稳定型城市。

我们花了两个月的时间收集这100个城市民众发出的推特信息,总共收集到309,000条。对这些信息的情绪分析表明,衰退型城市的民众情绪和成长型/稳定型城市的民众情绪差别不大。我们尽可能地排除其他外部因素对情绪的影响,但我们必须承认还是会有一些没考虑到的因素,所以研究的结果可能不是那么准确。为此,我们更换了筛选条件和关键词后再做分析,得出来的仍然是类似的结果,所以可以大致认为我们的研究结果是有一定代表性的。

基于这个结果,我们认为民众的情绪跟城市是否正在衰退无关,衰退型城市的政府应该继续深究民众情绪变化的原因。正如前文所说,情绪与民众的幸福感是直接挂钩的,所以政府要想提高民众的幸福感,首先要让其有正面的情绪。即使在成长型/稳定型城市中,政府同样不能认为自己可以高枕无忧,因为城市类型并不能直接影响民众的幸福指数,许多管理得当的衰退型城市的民众幸福指数就要比管理不当的成长型/稳定型城市的民众幸福指数高。总而言之,对城市的管理者和政策的制定者来说,秉着严谨科学的态度从推特上采集得来的数据是极具参考价值的。

译者:李瑞钧

文章来源:https://www.lincolninst.edu/pubs/dl/3607_2954_Hollander%20WP15JH1.pdf



相关刊物