很落伍地最近才开始接触复杂系统,看了入门书《复杂》便为之着迷了,立马找相关书来看,《链接》是第二本,对于网络的叙述之于《复杂》更加具体深入。
《链接》此书主要阐述了三方面的内容:
1、网络是怎样的?
2、网络是怎样产生的(即为什么会是上述那样的)?
3、网络的特点之于其他领域研究和现实社会的启发和助益?
第二至第八章是对1、2两个问题的回答。
巴拉巴西将“随机宇宙”、“六度分隔”、“小世界模型”、“中心节点”四个网络研究的经典理论进行了系统的介绍。
“随机宇宙”理论指数学家艾尔德和莱利的随机网络模型,艾尔德和莱利认为网络图和它们所代表的世界从根本上来讲是随机的。当我们随意选择并将网络中的节点连接起来,就会导致特殊情况的发生——网络在添加了一定量的链接后,会发生急剧的改变。此前,只存在一些包含少许节点的相互孤立的节点串,相互不认识的小组只在节点串内部交流。之后,出现了巨型节点串,几乎每个人都参与进来。每个节点只需一个链接,就能让所有的节点连为一体。也就是说,每个人只要认识其他一个人,大脑中的每个细胞子要有一个链接连到其他的脑细胞上,我们体内的化学成分只要能参与至少一次化学反应,商业世界中的公司只要能和其他公司做成一个买卖,就和其他成员建立起了链接。1就是这里的阀值。如果网络中的节点的平均链接少于1,那么网络就会分割成无法相互沟通的节点串。而每个节点的平均链接如果超过1,分裂的危险就比较微小。而真正的网络不仅是相连的,而且远远超过了1的阀值。随机网络理论表明,随着节点平均链接数量的增加到一个临界值,被排除在巨型节点串外的节点数量就会急剧减少。也就是说,添加的链接越多,就越难找到孤立的节点。自然界不会冒险停留在阀值左右,它往往大大超过这个值。相应的,我们周围的网络就不仅仅是独立的网络。这个网络极其繁复,没有任何成员能够游离在外,其中的每个节点都能被访问到。
“六度分隔”理论是由心理学家米尔格拉姆通过实验得出,实验显示美国任意两人之间的平均距离为5.5,四舍五入为6,即六度分隔。根据米尔格拉姆实验,巴拉巴西与合作者郑浩雄等研究了其他网络中的距离,认为在所有人类研究过的网络中,间隔都比较小。事实上,万维网的十九度间隔是最大的了,到目前为止,其他研究过的网络之间的间隔为2到14。这是因为这些网络具有高度相互关联的特性。在真正的网络中,每个节点拥有的连接一般都超过1。当网络链接达到了平均数1的阈值,节点间的距离会骤然变小。可以考虑一下节点的平均链接为k的网络。这意味着从某个典型的节点,走一步可以达到k个节点中的一个。不过,实际上网络中间隔为2个链接的节点数量为k的二次方个,间隔为d个链接的节点数量为k的d次方个。因此,如果k的值较大,那么即使d的值很小,所能连上的节点数也会很多。
“小世界模型”由邓肯·瓦茨和史蒂文·斯托加茨提出,他们首先提出群集系数的概念,群集系数指假设你有4个好朋友,如果他们相互之间也都是朋友,你就能通过一个链接和他们每一个人联系,这样你们就有了6个友谊链。不过,你的朋友中可能有个别人相互之间并不是朋友。这样实际的数据就不到6个链接——我们假设有4个。这样,你的朋友圈的群集系数就是0.66,这个系数是以你的朋友链接的实际数量(4),除以理想条件下当他们相互都是朋友的时候的链接总数(6)得来的。根据研究,邓肯和史蒂文从一圈节点出发,试图建立具有高复群集特性的网络模型。这一圈节点中的每一个,都和紧邻的节点有联系。为了使这个圈子变成一个小世界,他们又额外添加了几个链接,将一些随机选择的节点连接起来。这些远程的链接为距离较远的节点提供了至关重要的连接捷径,大大降低了所有节点的平均间隔。这个模型说明即使只是添加少数几个链接,就能把所有节点之间的平均间隔大大降低,这少数几个链接却不会太大地改变网络的群集系数。然而由于它们构成了跨度颇大的桥梁,往往是将圆圈两端的节点链接起来,这使得所有节点之间的巨大间隔崩溃了。这个模型可以大大降低间隔,同时却基本上并不改变群集系数,这一特性说明了人们在交友的时候范围虽然有可能比较有限,只要其中有少数人的交往比较广,拥有远距离的链接,社会就能构成小世界。基于此简单模型,我们意识到六度分隔是植根于人群中有少数人的亲朋好友是住在远处,而不是住在左邻右舍,这些距离较远的链接,使我们拥有了链接远处世界的捷径。巨大的网络无须充满随机链接,就能显示出小世界的特性,只需少数几个远程链接就够了。
“中心节点”理论来自于心理学家格拉德威尔的畅销书《引爆点》,他认为在每一个阶层的人当中,都有一部分特别善于交往的人。他们是社会中的连接者。连接者是社会网络中极端重要的成员。他们创造趋势与时尚,制定重大的决定,散布流行主题,或是能给朋友帮忙开个新的饭馆等。他们是社会的连线,把不同种族、不同受教育背景、不同家庭背景的人联系在一起。在万维网中,其结构也被一些高度链接的节点(或称作中心节点)所主导。这类中心节点,如雅虎或亚马逊网站,都具有极高的可见性——不论我们到哪儿,都能见到指向这些节点的链接。万维网背后的网络里面有许多未受注意或很少被注意到的节点,只有很少的链接把这类网站和中心节点链接起来。中心节点的确很特殊,在任何存在中心节点的网络中,它们都对网络结构起到关键作用,使该网络呈现小世界的特点。中心节点和异乎寻常多的节点之间存在链接,为系统中任意两个节点创造了联系捷径。其结果,就是全球随机选择的两个人之间的距离是6,而任意一个人和连接者之间的距离则是1或2.于此类似,在万维网上,两个任意页面之间的距离是19次点击,而从任何网页转到雅虎所需的点击则是2-3次。从中心节点来观察世界,它的确非常小。
这四大理论同时是巴拉巴西研究的灵感来源和批判对象,尤其是随机宇宙理论,巴拉巴西在全书中贯穿对于随机宇宙理论的颠覆。
那么巴拉巴西认为真正的网络应该是怎样的呢?它们又是如何产生的呢?
首先,巴拉巴西提出了“无尺度网络”的概念,他和郑浩雄在网络节点数量分布研究中发现,有一些节点只有几个链接,另外一些中心节点则有大量的链接。当他们试图把节点连接性的柱状图和双对数图匹配起来时,发现不同网页上的链接分布严格依据数学上的幂律。幂律分布的最突出特点,不仅是其中有许多小事件,而且是许多小事件伴随着少数极大的事件。幂律分布表明,在连续的等级分布中,无法找出一个特定的节点,说它能代表其他节点的特性。这样的网络不存在内在的尺度。因此,研究小组将符合幂律的网络描述为“无尺度”。
第二步,巴拉巴西提出了“增长”和“优先情结”的概念,来解释无尺度模型形成的原因,随便找一个你能想得起来的网络,都会发现如下的特点:它从少数几个节点开始,随着节点不断增加,网络的规模与日俱增,逐渐达到当前的规模。显然,增长的特性迫使我们不得不重新审视网络模型中的假设条件。这样一来,就推翻了对于随机宇宙的第一条最基本的假说——静态属性。巴里巴西据此设计了模型A,但是,根据模型A,等级分布,即区分无尺度网络和随机模型的功能,下降地过快,其幅度是指数级的。虽然早期的节点是明显非赢家,但是指数级幅度预计这种节点仍然太小,而且太少。因此,模型A无法解释中心节点和连接者现象。不过,它却表明了增长本身无法解释幂律的出现。因此,他引入了“优先情结”概念,他认为我们在万维网上决定选择何种链接的时候,都遵循优先情结:在两个链接中任选一个的时候,如果其中一个链接的链接数是另一个的两倍,那么链接到它的人会是另一个节点的两倍。虽然每个人的选择很难预计,但是合在一起作为群体,我们的选择却遵循严格的规则。
“无尺度网络”、“增长”和“优先情结”综合起来,形成了巴拉巴西的无尺度模型,“把这个谜题的各个部分综合起来,我们发现真实网络受两个定律的控制:增长和优先情结。每个网络都是从很小的内核开始,随着节点的增加不断增长。这些节点在决定和那些已有的节点链接的时候,会优先考虑链接较多的节点。这些定律和早先的模型明显不同,以前的模型假定网络内的节点数量是恒定的,且所有节点都是随机链接的。”
但是,无尺度模型无法解释一个现象,即“在富者愈富的世界中,后来者如何生存?”
为此,巴拉巴西进一步推翻了随机网络模型中关于每个节点都是平等的的观点,提出每个节点都存在差别,在竞争环境中,每个节点都有特定的适应性,所谓的适应性就是相比于周围的人,你结交朋友的能力。适应性可以将节点处于竞争前沿的能力进行量化。引入适应性概念并不排除增长和优先情结这两个控制网络进化的基本机制。不过,它却改变了竞争环境中的吸引因素。在竞争模型中,假定适应性也起作用:适应性高的节点链接就多。将适应性加入到无尺度模型的简单方法,是假设优先情结受到节点的适应性和链接数目的共同影响的乘积。对于具有同样链接数的节点来说,适应性高的能够获得更多的链接。然而,假如两个节点的适应性相同,早出现的节点仍占优势。这个推论在实验结构中得到了证实。
因此,巴拉巴西网络模型可以归纳为,具有“增长”、“优先情结”和“适应性”特征的无尺度网络。
那么了解了网络的这些特性,有怎样的应用价值呢?
巴拉巴西首先证明了无尺度网络具有高容错性,但是这种高容错性同时也带来了其面临攻击时的脆弱性,因为无尺度网络面临攻击时,无需删除大量的节点就能到达临界点。破坏少数几个中心节点,一个无尺度网络就能立即瘫痪。更可怕的是,对于中心节点的攻击很容易造成级联故障,所谓级联故障指网络如作为交通传输系统,本地的故障会将故障效应或责任传递给其他节点。如果额外的载荷小得可以忽略不计,那么系统的其他部分可以很容易不留痕迹地吸纳它,几乎使人察觉不到发生了故障。而假如额外的载荷过大,相邻的节点无法承载,他们或者自身出现故障,或是重新把载荷传递给相邻的节点。不论发生哪种情况,都会出现级联故障,而故障的规模和影响力取决于首先出问题的节点在系统中所占的位置及其能力。
另一方面,在对计算机病毒进行的研究发现在无尺度网络中,病毒传播根本无视阈值的存在,人们简直就没有办法阻止它们的传播。病毒这种难以预测的行为方式根源于互联网的拓扑结构的不平衡,无尺度网络被中心节点主宰控制。因为每个中心节点都和大批的电脑相连,因此受到其中某个感染的几率也就高一些。一旦中心节点被感染,就会把病毒传染给所有与它相连的电脑。因此,中心节点成了病毒存在和传播的重要途径。
整体而言,网络特性的发现,对于生命科学、物理学、社会经济、互联网等的研究都提供了新的思路,并且为市场营销、传染病遏制等实践提供了新的方法和理论依据。
注:以上观点和句子大部分直接摘自书本