大数据时代的网络分析

这是Science杂志对其发表的Benson等人所著论文“ Higher-order organization of complex networks ”的评述。

我们如何全面挖掘大数据?

“为了挖掘网络数据的布线模式并揭示功能组织,仅仅考虑简单的描述符是不够的……,对我们相互关联的世界的整体分析需要概念和方法学范式的转变“

我们生活在一个由相互关联的实体组成的复杂世界中。在人类努力的所有领域,从生物学到医学、经济学和气候科学,我们都充斥着大量的数据集。这些数据集从不同和互补的角度描述复杂的现实世界系统,将实体建模为节点,将它们的连接建模为边,组成大型网络。这些网络数据是领域特定信息的新的丰富来源,但是这些信息目前大部分隐藏在复杂的布线模式中。破译这些模式是至关重要的,因为大型网络的计算分析常常是难以解决的,所以我们对这个世界提出的许多问题都无法得到准确的回答,即使有无限的计算能力和时间。因此,唯一的希望是近似地(也就是启发式地)回答这些问题,并证明在最坏的情况下,近似的答案离确切的未知答案有多远。Benson等人朝这个方向迈出重要的一步,提供一个可扩展的启发式框架,根据实体的布线模式对实体进行分组,并使用发现的模式揭示几个现实世界网络系统的高阶组织原则。

为了挖掘网络数据的布线模式并揭示功能组织,仅仅考虑简单的描述符是不够的,例如每个实体(节点)与其他实体的交互次数(称为节点度),因为两个网络在这种简单的描述符中可能是相同的,但是具有非常不同的连接结构(见图)。

因而,Benson等人使用称为graphlets的高阶描述符(例如,三角形),他是基于在数据中的节点子集上获得的小子网,该子集包含数据中出现的所有交互(3)。他们识别网络区域,这些区域富含特定graphlet类型的实例,很少有特定小图的实例跨越这些区域的边界。如果预先指定了graphlet类型,该方法可以发现通过它互连的节点,这使得Benson等人得以。将线虫神经网络中已知控制特定类型运动的20个神经元聚集在一起,该方法将局部布线图案与由其引入的高阶结构模块化相结合,揭示了网络数据中的高阶功能区域。

这一结果的重要性在于它适用于广泛的网络数据,我们必须理解这些数据才能回答当今人类面临的基本问题,从气候变化和转基因生物的影响,到环境,到粮食安全、人类迁徙、经济和社会危机,理解疾病、衰老和个性化医疗。例如,细胞是一个复杂的相互作用分子系统,其中基因被转录成RNA并翻译成蛋白质,这些蛋白质采用各种三维结构来实现特定的细胞功能。分子相互作用被不同的高通量生物技术捕获,并用不同类型的网络建模。分子网络的个体分析显示,参与类似功能的分子倾向于在一个网络中聚集在一起,并且有类似的连线(13),这使得我们能够更好地理解基因功能和细胞的分子组织,并改进治疗方法。

然而,每一种网络类型都提供了有限的关于正在研究的现象的信息。例如,疾病很少是单个突变基因或单个断裂分子相互作用的结果。相反,它是细胞内和细胞间复杂相互作用的多重扰动的产物。网络医学将网络分析与数据集成结合起来,挖掘大量互补数据,揭示看似无关疾病之间的共同分子机制。相比之下,看似相同疾病的患者可能有非常不同的疾病分子机制和对治疗的反应(例如,癌症异质性)。因此,个性化医疗旨在根据个体患者的基因和分子特征提供个性化治疗,这可能涉及将已知药物重新用于不同的患者群体,从而有助于缓解与开发新药所需的成本和时间相关的制药行业瓶颈。网络数据分析和集成的方法对于这些新生领域至关重要,因为全面理解只能来自于全面挖掘所有可用的基因、分子和临床数据。

对我们相互关联的世界进行整体分析,需要概念和方法学范式的转变。与其孤立地分析单一数据源,比如比对基因序列(这已经彻底改变了我们对生物学的理解),更深入的见解将来自于在单一框架内比对所有类型的数据——“数据比对”例如,关于一个细胞的所有遗传和分子相互作用数据可以整合到同一计算框架中,并且需要开发方法来对齐这些在“细胞排列”的新范例中“整合的细胞”同样,世界经济体系包括贸易、金融交易和投资网络,目前,这些网络已经被单独研究过。但是,要完全理解财富、危机和经济复苏的根源,只能通过整合和集体分析所有这些网络化的经济和地缘政治数据。类似地,气候测量由编码了跨地理区域的气候元素(例如,风速、大气压力和温度)的各种网络所捕获,而整体的、数据一致的分析可能有助于解释这个复杂的动态系统,并更好地预测人为改变的影响。应该开发和应用能够捕捉数据高阶组织复杂性的数学形式,以及从这些形式中计算和提取信息的算法。扩展Benson等人的框架,在这些集成和对齐的数据系统中找到更高阶的结构可能是一种前进的方式。由于数据的大规模、复杂性、异构性、噪声以及不同的时间和空间尺度,计算问题仍有待解决。

广告

0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论