近日,南方科技大学统计与数据科学系副教授胡延庆课题组在国际学术期刊Nature Communications上以“Reconstructing the evolution history of networked complex systems”为题发表研究论文。该研究使用机器学习方法,能够高精确度地重构可网络化复杂系统的形成历史,并证明了任何不低于随机猜测的算法,对于足够大的网络可以得到高质量解。该研究为社会系统演化、生物与生态系统进化等问题提供新研究方法。该论文被Nature communications杂志选为editor's highlights亮点论文。
复杂网络作为可网络化复杂系统的一种常见形式,在生物学、生态学、社会科学等领域中广泛存在。复杂网络主要用以表示复杂系统内部元素之间的作用关系,并主导了系统的功能。探索和理解复杂网络演化进化过程和和许多领域的核心问题相关,如生命和生态系统的起源与演化、大脑神经网络重组与智力的出现以及社区和国家的形成等。然而,复杂网络通常具有非常丰富的介观结构,这些结构通常同时存在于一个网络中,它们之间有着复杂交互作用关系,共同实现系统的基本功能。揭示复杂内部结构之间的关系通常十分困难,进一步阐明网络的演化机制则更为艰难。
图1. 网络演化过程和还原方法示意图
图 2. 还原结果有助于解释蛋白质-蛋白质相互作用网络的演化过程
图 3. 还原结果对链路预测性能的提高
在这个工作中,研究团队通过机器学习技术高精度地还原了多种复杂网络的历史演化轨迹(图1),包括蛋白质-蛋白质相互作用网络、世界贸易网络和社交网络等。同时,研究团队证实了还原的演化过程存在潜在科学价值。例如,还原出的蛋白质-蛋白质相互作用网络形成过程可以在分子水平上揭示生物体进化过程的一些趋势(图2);在网络结构预测方法中加入还原得到的时间序列信息,可以大幅度提高预测的准确度(图3),在AI-药物方面具有潜在应用价值等。此外,还原的结果还可以捕捉到网络形成过程中的关键结构特征和机制,如偏好依附、社团结构、局部聚类、度-度相关性等,这是以前的理论无法描述的。
此外,该团队通过理论解析发现,对于规模较大的网络,只要机器学习模型的性能稍优于随机猜测,就可以实现可靠重构整个网络的历史形成过程。由于真实的复杂网络通常尺寸较大,这一结论表明,大规模还原实际网络历史演化过程通常是高度可信的。
胡延庆是论文的通讯作者,南方科技大学是唯一通讯单位。中山大学博士研究生王俊雅、南方科技大学统计与数据科学系博士后张怡娇和讲师徐匆是论文共同第一作者。荷兰马斯特里赫特大学博士生李伽泽、腾讯孙嘉辰博士、北京师范大学副教授谢家荣、新加坡A*STAR 研究员冯凌、中山大学教授周天寿也参与了该课题研究。本项研究得到了国家自然科学基金的支持。
供稿:统计与数据科学系
通讯员:董茹、滕悦然
主图:丘妍
编辑:任奕霏