考普斯奖获得者蔡天文南科大讲堂解读大数据统计分析的机会与挑战
2017年03月21日 讲堂

2017年3月20日下午,宾夕法尼亚大学沃顿商学院Dorothy Silberberg 讲座教授、考普斯奖获得者蔡天文做客南科大讲堂,为我校师生带来一场精彩的科普性学术报告,引用大量实例解读大数据时代的机会与挑战。讲座由数学系主任夏志宏主持。报告会现场蔡天文作报告

 蔡天文是国际数理统计学会会士和勋章讲座者,统计年刊《 The Annals of Statistics 》的主编(2010-2012),现任泛华统计学会会长。蔡天文的研究领域涉及大数据、高维统计、函数数据分析、大规模假设检验、统计决策理论以及统计在金融工程,压缩遥感和基因组学上的应用,他于2008年获得了具有统计学界诺贝尔奖之称的“考普斯奖”。

大数据时代即将到来

“在人类历史上,能称得上‘时代’的概念是很了不起的。互联网时代已经从根本性层次上改变了人们的生活方式,大数据时代也正在悄然到来”,蔡天文表示。当今社会,需要分析处理的数据量越来越大,文本、图片、视频等数据种类愈加繁多,对高维数据、函数数据、图像等大数据信息进行处理成为了统计学界的热门研究领域。蔡天文表示,任何一个实验科学,只要拿到实验数据,就要进行统计学意义上的数据处理。

统计无处不在:大数据统计分析应用范围极广

从生物科技到量子计算,从商业管理到政府决策,从社科研究到网络搜索……大数据统计分析逐渐扮演起越来越重要的角色。在生物科技领域,新兴学科生物统计被广泛应用于脑科学、基因突变、癌症预测、伴随疾病预测等方面的研究。蔡天文举例说,多年来美国一直在进行临床病例统计工作,逐步构建起了一个数据量庞大的病例数据库,一旦数据库构建完成,个性化医疗将成为现实。人们可以通过对不同个体的病情与数据库进行比对,从而找到最佳的治疗手段。在互联网领域,大数据统计分析也被应用在图片搜索、推荐系统、识别匹配等方面;在商业管理领域,市场营销、金融风险控制等对大数据分析也有着更大的依赖性。

鱼和熊掌不能兼得,计算量和统计精度需权衡

蔡天文表示,大数据的处理主要面临两个问题。第一,数据量越大,计算量就越大,计算机性能面临考验。第二,大数据分析存在一个很有意思的问题,就是计算量和统计精度不可以兼得。如果不考虑计算量,就可以构建很好的统计算法,理论上也可以证明这种算法是最优的,但是这种算法却一定是不能算的。在这两者之间,就像是鱼和熊掌,不能兼得。从实用的角度来说,不能算的算法即使是最优的,也一定是没用的。所以,在实践中,需要统计学家和计算机学家一起协作才能较好地完成一个项目。

高水平大学建设离不开统计学系的壮大

蔡天文总结道,大数据时代的到来为统计学带来了广阔的发展前景,高水平大学的建设离不开统计学系的壮大。蔡天文认为,“统计学家不是坐在办公室里就能做统计研究的,而是需要和很多其他的学科进行交叉融合你的,诸如金融、医学、计算机等等。这些学科要么产生数据,要么处理数据,其中会遇到的问题就需要统计学来解决”。蔡天文举例说道,以美国为例,科技公司、金融机构对统计学毕业生的需求量极大,可谓是供不应求。

提问环节

讲座最后,蔡天文认真回答了师生们提出的问题。

 

文字:学新社记者刁金龙

摄影:学新社记者张皓帆、于灏

 
 
推荐阅读
查看更多 >>
FOLLOW US @SOCIAL MEDIA
关注社交媒体上的我们
  • 国家安全部官方微信

  • 南方科技大学微信

  • 南方科技大学视频号

  • 南方科技大学抖音号

  • 南方科技大学快手号

  • 南方科技大学头条号

  • 南方科技大学南方+