无尺度网络的源起

2024-05-13

1. 无尺度网络的源起

无尺度网络的概念是随着对复杂网络的研究而出现的。“网络”其实就是数学中图论研究的图,由一群顶点以及它们之间所连的边构成。在网络理论中则换一套说法,用“节点”代替“顶点”,用“连结”代替“边”。复杂网络的概念,是用来描述由大量节点以及这些节点之间错综复杂的联系所构成的网络。这样的网络会出现在简单网络中没有的特殊拓扑特性。自二十世纪60年代开始,对复杂网络的研究主要集中在随机网络上。随机网络,又称随机图,是指通过随机过程制造出的复杂网络。最典型的随机网络是保罗·埃尔德什和阿尔弗雷德·伦伊提出的ER模型。ER模型是基于一种“自然”的构造方法:假设有n个节点,并假设每对节点之间相连的可能性都是常数0 < p < 1。这样构造出的网络就是ER模型网络。科学家们最初使用这种模型来解释现实生活中的网络。ER模型随机网络有一个重要特性,就是虽然节点之间的连接是随机形成的,但最后产生的网络的度分布是高度平等的。度分布是指节点的度的分布情况。在网络中,每个节点都与另外某些节点相连,这种连接的数目叫做这个节点的度。在网络中随机抽取一个节点,它的度是多少呢?这个概率分布就称为节点的度分布。在一般的随机网络(如ER模型)中,大部分的节点的度都集中在某个特殊值附近,成钟形的泊松分布规律(见图3)。偏离这个特定值的概率呈指数性下降,远大于或远小于这个值的可能都是微乎其微的,就如一座城市中成年居民的身高大致的分布一样。然而在1998年,Albert-László Barabási、Réka Albert等人合作进行一项描绘万维网的研究时,发现通过超链接与网页、文件所构成的万维网网络并不是如一般的随机网络一样,有着均匀的度分布。他们发现,万维网是由少数高连接性的页面串联起来的。绝大多数(超过80%)的网页只有不超过4个超链接,但极少数页面(不到总页面数的万分之一)却拥有极多的链接,超过1000个,有一份文件甚至与超过200万个其他页面相连。与居民身高的例子作类比的话,就是说大多数的节点都是“矮个子”,而却又有极少数的身高百丈的“巨人”。Barabási等人将其称为“无尺度”网络,所谓的无尺度,是从scale free翻译而来,scale就是指节点度的大小,free 是指虽然网络中大部分节点的度不高,但极少数节点的度不受任何限制,可以变得十分巨大。

无尺度网络的源起

2. 无尺度网络的描述与定义

无尺度网络的特性,在于其度分布没有一个特定的平均值指标,即大多数节点的度在此附近。在研究这个网络的度分布时,Barabási等人发现其遵守幂律分布(也称为帕累托分布),也就是说,随机抽取一个节点,它的度d是自然数k的概率:也就是说d = k 的概率正比于k 的某个幂次(一般是负的,记为 γ)。因此k越大,d = k 的概率就越低。然而这个概率随k增大而下降的“速度”是比较缓慢的:在一般的随机网络中,下降的速度是指数性的,而在无尺度网络中只是以多项式类的速度下降。在现实中许多大规模的无尺度网络中,度分布的γ值介于2与3之间。在对数坐标系中,度分布将会是一条斜率介于-2至-3之间的直线。如左下图中,横坐标为节点的度,从10^0一直到10^3;纵坐标为找到这样的节点的概率从10^-8一直到10^0。最高度数的节点有882条连接。所有的蓝点大致成一条直线分布(绿色的直线)。

3. 无尺度网络的例子

不少现实中的网络结构都属于无尺度网络,或者有无尺度的特性。以下是一些无尺度网络的例子:  网络  节点  连接  电影演员网络  演员  出演同一部电影  万维网  网页  超链接  因特网  路由器  物理连接  蛋白质相互作用网络  蛋白质  蛋白质之间的相互作用关系  金融网络  金融机构  借贷关系  美国飞机航班网络  机场  飞机航线

无尺度网络的例子

4. 什么是无尺度网络

过去几年中,研究者在很多不同的系统中都发现了无尺度结构。我们研究万维网的目标是以超连结彼此串连的虚拟网页网络。相比之下,美国加州大学河滨分校的Faloutsos、加拿大多伦多大学的Faloutsos以及美国卡耐基梅隆大学的Faloutsos则是分析因特网的物理结构。这三位电脑科学家兄弟研究了以光纤或其他通信线路连接的路由器,他们发现,这个实体网络的拓扑结构也是无尺性的。 
研究人员还发现,某些社会网络也是无尺度的。例如,美国波士顿大学和瑞典斯德哥尔摩大学的科学家的共同研究显示,瑞典民众的性关系网络也遵循幂次定律:尽管大部分人终其一生只有少数几个性伴侣,但有少数人(集散节点)的性伴侣多达数百人。德国基尔大学的Bornholdt领导的一项研究表明,电子邮件所连结的人际网络,也可能是无尺度的。渡士顿大学的Redner则证实,由科学论文之间引用关系所连结的网络,同样也遵循幂次定律。美国密歇根大学安娜堡分校的Newman研究了包括物理和计算机等一些学科内科学家之间的合作关系网络,他发现这些网络同样也是无尺度的,这也印证了我们针对数学家和神经科学家所做的研究。(有趣的是,在数学界,Erdos本人就是最大的集散节点之一,他写的论文超过1400篇,其中共同作者不下500人。) 
无尺度网络同样也出现在商业领域。美国斯坦福大学的W·Powell、加州大学lrvine分校的R·White、亚利桑那大学的W·Koput以及密歇根大学的Smith,共同研究了美国生物技术产业联盟网络的形成。发现存在特定的集散节点:Gerlzyme、Chiron和Genentech等公司,与其他公司相比,拥有的合作关系数量就多得不成比例。意大利的研究者对这种类型的网络进行了更深入的研究。利用意大利锡耶纳大学的"制药工业数据库"所提供的数据(该数据库目前包括超过7200个组织之间所签定的约20100个研发协议),研究人员发现,Powell等人所发现的那些集散节点,实际上也属于某个无尺度网络。 
就连好莱坞演员网络也是无尺度的。这个网络因"六度凯文贝肯"的游戏而变得众所皆知。游戏玩家通过共同出演的电影,尽量让特定的演员与凯文贝肯产生关联。定量分析显示,这个网络也是由某些集散节点所支配的。具体来说,就是大部分演员只与为数不多的其他几个人相连结,而少数演员所拥有的连结数却高达数千个,其申包括Rod Steiger和Donald Pleasence。顺便说一下,在演员连结数的排行榜上,凯文贝肯自己只排在第876位。 
重新回到严肃的话题,无尺度网络也出现在生物学领城。我们与美国西北大学的细胞生物学家Oltvai一道,发现古菌域、细菌域和真核生物三大生物领域的43种不同生物里,都存在无尺度的细胞代谢网络结构。在这些网络里,细胞通过分解复杂分子来燃烧食物并释放能量。每个特定的分子就是一个节点,而节点之间的连结则是生化反应。我们发现,大部分的分子只参加一种或两种反应,但是有少数分子(集散节点)会参与大部分的反应,比如水和三磷酸腺苷。 
我们还发现,细胞中蛋白质的交互网络也是无尺度的。在这种网络中,如果两种蛋白质能相互反应,就认为是彼此"连结"的。我们在研究酵母这种最简单的真核细胞时,在它的数千个蛋白质之间找到了一种无尺度的网络拓扑结构:大部分蛋白质只与其他一、两种蛋白质发生相互作用,但有几种蛋白质分子却能与大量的其他蛋白质相结合。我们在另一种与酵母迥然不同的简单细菌——幽门螺杆菌中,也发现了类似的蛋白质交互作用网络。 
事实上。科学家研究的网络越多,发现的无尺度结构也越多。这些发现引发了一个重要的问题:为什么像细胞和因特网这样本质上不同的系统,却具有相同的结构并遵从相同的规律?这些不同的网络不仅都是无尺度的,而且还有着一个有趣的共同点:由于某些未知的原因,幂次定律中kn项中的n值,通常介于2-3之间。

5. 什么是无尺度网络

过去几年中,研究者在很多不同的系统中都发现了无尺度结构。我们研究万维网的目标是以超连结彼此串连的虚拟网页网络。相比之下,美国加州大学河滨分校的Faloutsos、加拿大多伦多大学的Faloutsos以及美国卡耐基梅隆大学的Faloutsos则是分析因特网的物理结构。这三位电脑科学家兄弟研究了以光纤或其他通信线路连接的路由器,他们发现,这个实体网络的拓扑结构也是无尺性的。
研究人员还发现,某些社会网络也是无尺度的。例如,美国波士顿大学和瑞典斯德哥尔摩大学的科学家的共同研究显示,瑞典民众的性关系网络也遵循幂次定律:尽管大部分人终其一生只有少数几个性伴侣,但有少数人(集散节点)的性伴侣多达数百人。德国基尔大学的Bornholdt领导的一项研究表明,电子邮件所连结的人际网络,也可能是无尺度的。渡士顿大学的Redner则证实,由科学论文之间引用关系所连结的网络,同样也遵循幂次定律。美国密歇根大学安娜堡分校的Newman研究了包括物理和计算机等一些学科内科学家之间的合作关系网络,他发现这些网络同样也是无尺度的,这也印证了我们针对数学家和神经科学家所做的研究。(有趣的是,在数学界,Erdos本人就是最大的集散节点之一,他写的论文超过1400篇,其中共同作者不下500人。)
无尺度网络同样也出现在商业领域。美国斯坦福大学的W·Powell、加州大学lrvine分校的R·White、亚利桑那大学的W·Koput以及密歇根大学的Smith,共同研究了美国生物技术产业联盟网络的形成。发现存在特定的集散节点:Gerlzyme、Chiron和Genentech等公司,与其他公司相比,拥有的合作关系数量就多得不成比例。意大利的研究者对这种类型的网络进行了更深入的研究。利用意大利锡耶纳大学的"制药工业数据库"所提供的数据(该数据库目前包括超过7200个组织之间所签定的约20100个研发协议),研究人员发现,Powell等人所发现的那些集散节点,实际上也属于某个无尺度网络。
就连好莱坞演员网络也是无尺度的。这个网络因"六度凯文贝肯"的游戏而变得众所皆知。游戏玩家通过共同出演的电影,尽量让特定的演员与凯文贝肯产生关联。定量分析显示,这个网络也是由某些集散节点所支配的。具体来说,就是大部分演员只与为数不多的其他几个人相连结,而少数演员所拥有的连结数却高达数千个,其申包括Rod
Steiger和Donald
Pleasence。顺便说一下,在演员连结数的排行榜上,凯文贝肯自己只排在第876位。
重新回到严肃的话题,无尺度网络也出现在生物学领城。我们与美国西北大学的细胞生物学家Oltvai一道,发现古菌域、细菌域和真核生物三大生物领域的43种不同生物里,都存在无尺度的细胞代谢网络结构。在这些网络里,细胞通过分解复杂分子来燃烧食物并释放能量。每个特定的分子就是一个节点,而节点之间的连结则是生化反应。我们发现,大部分的分子只参加一种或两种反应,但是有少数分子(集散节点)会参与大部分的反应,比如水和三磷酸腺苷。
我们还发现,细胞中蛋白质的交互网络也是无尺度的。在这种网络中,如果两种蛋白质能相互反应,就认为是彼此"连结"的。我们在研究酵母这种最简单的真核细胞时,在它的数千个蛋白质之间找到了一种无尺度的网络拓扑结构:大部分蛋白质只与其他一、两种蛋白质发生相互作用,但有几种蛋白质分子却能与大量的其他蛋白质相结合。我们在另一种与酵母迥然不同的简单细菌——幽门螺杆菌中,也发现了类似的蛋白质交互作用网络。
事实上。科学家研究的网络越多,发现的无尺度结构也越多。这些发现引发了一个重要的问题:为什么像细胞和因特网这样本质上不同的系统,却具有相同的结构并遵从相同的规律?这些不同的网络不仅都是无尺度的,而且还有着一个有趣的共同点:由于某些未知的原因,幂次定律中kn项中的n值,通常介于2-3之间。

什么是无尺度网络

最新文章
热门文章
推荐阅读