北京儿童插座价格联盟

TED经典演讲 | 如何与人打交道:人际关系的潜在影响

只看楼主 收藏 回复
  • - -
楼主

2018-03-29 TED正能量

How social networks predict epidemics

TED简介2017 | 人际关系是种美丽而复杂的东西,它不仅精密复杂且普及,我们为什么处于人际网络中?通过“肥胖流行症”的讨论,去了解复杂人际的影响力。


演讲者:Nicholas Christakis

片长:18:45

下载MP3音频方法:到网易云音乐搜索:TED博物馆

戳阅读原文下载视频



中文翻译演讲稿


字数过多放不下,英文请戳阅读原文

过去十年间,我一直在想人们是怎样把自己放在社交网络中的以及他们为什么要这么做。这里的社交网络不是最近网上最近流行的那种而是,自从人类从非洲大陆出现之后,人们几十万年来进行的社交活动。比如说,我和其他人建立友谊,同事,兄弟,亲戚的关系,其他人也和另外其他人建立类似的关系。这样的关系无尽止地延伸出去。这样你就有了一个像这样的网络。网络中的每一个点就是一个人。连接两点的每一条线就是两个人之间的关系--不同类型的关系。这样就得到了这种巨大的人际关系网,我们都交织在网中。


我的同事,詹姆斯.福乐,和我一起已经研究了好些时间什么是支配这些网络的数学,社交,生物和心理规则以及什么是基本的规则来支配这些网络的运作,和如何影响我们的生活。最近,我们在研究是否有可能利用这种认识来发现改善这个世界的方法,做一些好事解决一些问题,而不只是理解而已。所以我们认为需要解决的一件首要的事情就是怎样预测传染病。


现在预测传染病的方法--如果是美国疾病控制预防中心或者其他国家级的机构--就是呆在原地从医生和实验室收集数据来分析疾病的流行性和发病率。所以,(如果)一些病人在一个地方被诊断了得病,或者其他病人在另一个地方得到诊断,所有这些数据,一定的延迟之后,都送到一个中心数据库。如果一切顺利,一两个星期之后,你就会知道发生在今天的传染病在何处。实际上,一年前左右,曾经有过这样的一个,google流感趋势的想法关于流感,通过观察人们今天的搜索行为,我们能知道流感的发病区...传染病今天的状况,以及传播的趋势。


但我今天想给你展示的是一种方法通过这个方法,我们不只是得到关于传染病的警示,而且也能够及早发现传染病。事实上,这个想法不只能预测病毒的传播,也能预测很多事情的传播。比如说,任何以社交形式传播的事情,都能用这种方法来理解,从左边这些抽象的事物,像爱国主义,或利他主义,或者宗教,到具体的事物,像饮食行为,或者买书,或饮酒,或自行车头盔和其他的一些安全措施,或者人们可能买的产品,电子书的购买,任何能在人们之间传播的事情。一种创新的传播可以用我即将展示的方法来理解和预测。


正如你们所有人也许知道的,考虑这个问题的传统方法是创新扩散,或创新采用曲线。这儿,Y轴上显示的是受到影响的人们的百分比,x轴上显示的是时间。一开始,受到影响的人不多,得到的是S状的分布,或者说S形状的曲线。形成这种形状的原因是这样的,在一开始,假设一两个人受到影响,然后他们去影响两个人,然后就是四个,八个,十六个,等等,这样你就得到了这个曲线的传播增长阶段。最终,这个群体就饱和了。可以被影响的人就越来越少,这时你就得到了曲线的平顶部分,这样就形成了经典的S状曲线。这种方法可以用于病毒,观点,产品推广,行为,以及其他类似的情况。但是这些事物在人群中并非是随机传播的。他们实际上是通过网络传播。正如我所说的,因为我们在网络中生存,这些网络有一种特殊的结构。


现在,如果你看像这样的一个网络。。。有105人。这些线代表。。。这些点是人,这些线代表朋友关系。你也许看到在这个网络中人们占据了不同的地点。人们之间也有不同的关系。这些关系可以是朋友关系,同胞关系,配偶关系,同事关系,邻居关系,以及类似的关系。不同的事物通过不同的联系来传播。比如说,性病通过性关系传播。或者,比如说,人们的吸烟行为可能会受到他们朋友的影响。或者利他主义以及慈善施舍行为可能会受到同事的影响,或者邻居的影响。但并非网络中所有的位置都是一样的。


所以你看这里,就能立即理解不同的人有不同数量的连接。有些人有一个连接,有些人有两个,有些人有六个,有些人有十个连接。这就叫做结点的度数,或者一个结点有的连接数目。但是,还有些别的东西。如果你看结点A和B,都有六个连接关系。但是如果拔高来看,你就能理解A和B是非常不一样。让我来问你--用一个问题来说明这个直觉---如果有个致命的病毒正在网络中传播,你更愿意是哪一个,A还是B?(观众:B)尼古拉斯·克里斯塔吉斯:B,这很明显。B在网络的边缘。现在,如果有个非常有料的流言在网络中传播,你愿意是哪一个?A。你很快就看到A更有可能更快地得到正在传播的事物因为他们在网络中的位置。A,实际上,(位置)更加中心,这个能在数学上来表示。如果我们要追踪在网络中传播的事物,理想情况下我们会想设置感应器在网络的中心人物上,包括结点A,以此来观察网络中心的人们的活动,从而能够做到及早探测正在网络中传播的东西。


也就是说,假如你看到网络中心的人们感染病毒或得到了一些信息,你就能知道,很快所有人都会被传染这种病毒或得到这个消息。这种方法比不考虑群体的结构,监测六个随机选择的人,要好的多。实际上,如果能够这样做,你就会看到像这样的情况。在左边,我们有S形状的传播曲线。这条红色的点线,我们表示的是在随机人群中的感染率,左手的线条,向左移动,表现的是在网络的中心群体中的感染率。Y轴上是感染个体的累计总数,X轴上是时间。右边,我们显示同样的数据,但是在每天的个体数。我们在这里要显示的是--比如说,这里--很少的人受到影响,然后逐渐增多到这里,这里是感染的高峰。但是移到左边,是在中心群体中的发展趋势。两者之间在时间上的区别正是我们能够得到关于传染病在人群中的早期预测,早期示警。


然而,这个方法的难处在于,测绘人类的社交关系网并不总是可能的。这很昂贵,[很难],不正当,或者坦白说,就是没可能做这样的事情。那么,我们怎样能弄清楚哪些人在网络中心而不需要通过测绘整个网络呢?我们想出来的方法是采用了一个古老的事实,或者说关于社交网络的已知事实,这个事实是这样的:你知道你的朋友有比你更多的朋友吗?你的朋友比你有更多的朋友。这个称为朋友的悖论。想像有一个在社交网络中非常受欢迎的人物--就像一个聚会的主持有几百个朋友--而一个憎恨人类的人只有一个朋友,然后你随机从人群中选个人;他们更有可能认识聚会的主持。如果他们选择晚会主持作为他们的朋友,那么这个聚会主持就有一百个朋友,因此,就有比他们更多的朋友。这个就称为朋友悖论。随机选择的人群的朋友比随机人群本身,有更高的(关系)度数,并且更加中心。


你能对这个理论有一个本能的理解如果想像网络周边的人群。如果你选择(网络周边的)这个人他们能选择的唯一朋友就是这个人,而这个,在这个结构中,一定有至少两个朋友,通常情况下,有更多的朋友。这种情况发生在每个周边结点上。实际上,每当你加入一个网络的时候这个情况都会发生,你选择的每个人,当他们随机选择。。。当任意一个人选择他们的一个朋友,你就向网络中心移动。所以,我们想利用这个概念来研究是否能预测网络的现象。因为,有了这个概念,我们就选择一个随机人群,让他们提供他们的朋友,他们的朋友就更加中心,这样我们就能选择网络的中心,而不用描绘整个网络。


我们用这个想法来测试H1N1流感的爆发在哈佛大学2009年的秋冬,就是几个月前。我们随机选择了1300本科学生,让他们推举他们的朋友,然后我们跟踪随机的学生人群和他们的朋友每天按时观察他们是否传染上流感。我们观察的方法是看他们有没有去过大学健康服务机构。并且我们要求他们一个星期给我们发几次电子邮件。我们的预测一点不错的发生了。这个随机组在这个红线上。朋友组的传染移到左边,这里中间相差了16天。通过检测朋友组,我们能够得到16天的预先示警在这个人群的关于这个传染病的传播。


现在,在这个基础上,如果你是分析师,要研究一种传染病或者预测一个产品的推广,你能做的是选择一个随机的人群,让他们任命他们的朋友,然后跟踪他们的朋友,跟踪随机组和朋友组。在朋友组中,你看到的第一个零上的尖峰信号关于,比如说,创新科技的采纳,就是即将来临的流行趋势的信号。或者你能看到两条曲线第一次分离的地方,就像左边显示的。朋友组什么时候开始与随机组分离,他们的曲线什么时候开始偏移?正如白线显示的,发生在流行高峰的46天之前。通过这个技术我们能得到关于流感在特定人群中传播一个半月以上的预先示警。


我应该说能多早得到关于一些事情的消息取决于很多因素。它也许取决于病原体的本质---不同的病原体,使用这种技术,你可能得到不同的示警---或者其他一些传播的现象,或者,直接的说,在人类网络的结构中。现在,在我们的例子中,尽管不是很必要,我们也能够描绘这个学生网络。


这是714个学生的映射图和他们朋友联系。很快,我要使这个图动起来。我们要通过这个网络作每日监控120天。红点将会是流感的传染者,黄点就是流感传染这人的朋友。这些点的大小和他们得流感朋友的数目成正比。越大的点意味着更多的朋友得了流感。你看这个图---这儿是九月十三号---你看到几个病例出现。在中间你就会看到流感开始爆发。这儿是十月十九日。传播曲线的坡度开始临近,在十一月。砰,砰,砰,砰,砰,你将看到在中间的很多地方爆发,然后你会看到情况稳定下来,到十二月底就越来越少的病例发生。这样的图形表示能显示,像这样的传染病先影响中心个体在影响别人之前。


现在,如我所说,这个方法并不局限于病毒,实际上可以用于任何在人群中传播的事物。信息在人群中传播。规范在人群中传播。行为能在人群中传播我说的行为,就是像犯罪的行为或选举行为,或者保健行为,像抽烟,或免疫,或产品推广,或者其他类型的行为和人际之间影响相关的性为。如果我想做些事情来影响我周围的人,这个技术能得到早期示警,或早期预测,关于人群的采纳。要这个技术起作用,关键在于,人际之间的影响必须存在。它不能是像一些传播机制统一地影响每一个人。


现在同样的观察可以用上---关于网络---能够用其他的方法来利用,比如,可以用来追踪特殊的人群。比如说,你们大部分人可能听过群体免疫的概念。如果我们有一个一千人的群体,我们想使这个群体对某种病原体免疫,我们并不需要给每个人打免疫预防针。如果我们使960人免疫,效果和使所有人免疫差不多。因为即使一两个没有免疫的人感染了,也没有其他人让他们感染。这两个人周围的人都已经免疫。所以百分之96和百分之百效果一样好。一些其他的科学家已经预测了可能发生的情况,如果你从这一千人中取百分之三十的随机样本也就是三百个人,并且使他们免疫。这样能不能使整个群体免疫?答案是不可能。但是如果你选择百分之三十的这三百人,让他们举出他们的朋友然后使用同样数量的免疫针使得这三百人的朋友免疫,这三百个朋友,你就能达到群体免疫的效果就好像给百分之九十六的人打预防针的效果一样同时效率更高,并且花费更少。


同样的想法可以用于,比如说,解决像床罩这种物品在发展中国家的派发和分布。如果我们了解村庄的网络结构,我们就能选择介入的目标来促进这些过程的进行。或者,更加直接的说,来促销所有的产品。如果我们能理解如何选择目标,就能影响到我们达到目标的效率。实际上,我们能使用来源于各种渠道的数据[来应用这个方法]。


这里是一个欧洲国家八百万人的电话用户的网络图。每一个点就是一个人,每一条线代表人们之间的通话数量。我们可以利用这些数据,被动方式得到的数据,来描绘整个国家从而了解那些人处在网络的中心。不用实际上去询问每个人,我们能得到这种的结构。其他来源的信息,你肯定也知道,也能提供这样的信息,例如电子邮件交互,在线交流,在线社交网络,等等。实际上,我们处在一个我称为“大量被动”数据收集的时代。有很多种不同的方法我们能使用大量收集的数据来建立传感网络跟踪人群,了解在人群中正在发生的事件,从而可以更好的介入。因为这些新技术告诉我们不仅仅是那些人与那些人交流,同时也告诉我们每个人处在什么位置,根据他们上传到互联网上的东西来知道他们的想法,他们的购物记录告诉我们他们买了什么。所有这些管理数据能一起使用处理来了解人类的行为以一种前所未能的方式。


比如说,我们能用卡车司机的购油记录。卡车司机处理他们的生意他们要买汽油作燃料。我们看到卡车司机购油数据的零上尖峰信号,我们就知道经济衰退大概要结束了。或者我们能监测人们在高速公路上带着电话移动的速度,电话公司能看到,如果速度慢下来,那么就发生了交通堵塞。他们能把这个信息发给他们的用户,只发给在同一条高速公路上处于交通堵塞地点之前的用户!或者我们监测医生开药的行为,以被动的形式,看看在医生网络中制药公司的新药的发行如何。或者,我们能监测人们的购物行为,看看这些种类的现象在人群中是怎样传播的。


我想,有三种方式,这些大量被动的数据能被收集。一个方式是完全被动,如我刚刚描述的---例如在卡车司机的例子中,我们不需要以任何方式干涉这个群体的行为。另一种是类似于主动的方式,比如说像我说的流感的例子,我们选一些人来举出他们的朋友然后被动地监测他们的朋友---他们是不是感染了流感?--然后得到示警。或者另一个例子,如果你是电话公司,你能弄清楚谁在网络的中心,然后你可以问这些人,“你们能不能把你们每天的发烧情况给我们发过来?只要发体温度数。”然后收集人体体温的大量数据,但是只是网络中心个体的信息。这样就能,大面积地,监测即将来临的传染病而只需要人们给出非常少量的信息。最后的一种方式,就更加主动---我知道随后的演讲者今天会说到的--人们在哪儿参与维基,摄影,看选举,上载信息,这样可以让我们收集数据,来了解社交过程和社会现象。


实际上,我认为,这些数据的可用性,预示了一个新的纪元也就是我们所说的“计算社会学”。这有点像伽利略发明的--不是发明--使用望远镜能用一种新的方式看到天空,或者莱文胡克开始了解微观世界---发明了显微镜---而能以新的方式审视生物学。但现在我们能够得到这些数据这使得我们能了解社交过程和社会现象以一种前所未能的新方式。通过这门科学,我们能准确了解整体是怎样优于局部的总和。我们能用这些知识来改善社会和人类的生存。


谢谢。

 




举报 | 1楼 回复

友情链接