菜单总览
— 新闻 —

理工学院成功举办统计学和数据科学研讨会

  • 2018.12.12
  • 新闻
2018年12月12日,来自世界知名大学的多位教授参加了由香港中文大学(深圳)理工学院主办的统计学和数据科学研讨会,帮助学生了解统计学家在研究层面可以解决的大量问题,并且鼓励他们从事相关重要领域的工作。

2018年12月12日,来自世界知名大学的多位统计学教授参加了由香港中文大学(深圳)理工学院主办的统计学和数据科学研讨会,与会的教授从不同角度和研究领域讲述了统计在研究层面的广泛运用,帮助学生了解统计学家在研究层面可以解决的大量问题,并且鼓励他们从事相关重要领域的工作。

 

                                                                                                                                                              

香港中文大学(深圳)数据与运筹科学研究院蔡卓轩教授主持开幕

 

内容回顾

 

遗传风险的统计方法

                                                                                                                                                                 

Prof. Hongyu Zhao介绍遗传风险的统计方法

 

        Prof. Hongyu Zhao来自耶鲁大学生物统计学系,他为大家介绍了统计知识在遗传学研究与精准医学领域的运用。在过去的几十年里,人类发现了数千种与基因相关的遗传疾病,但是遗传风险预测的准确性却不高。这在很大程度上是由于在识别所有功能相关的变异和准确估计其影响大小方面都存在挑战。在这场讲座中,Prof. Zhao展示了近年来研究出的一些提高预测精确度的算法。把数据库里储存的大量遗传病相关数据作为训练数据,以此来建立模型,经过测试数据的测试之后,就可以进行遗传风险预测。在这方面,国内外已有相关公司和机构将这项研究运用到市场。用户进行基因检测之后,会得到一份风险预测报告,该报告会以样本中的数据为参照系,为用户进行风险说明。

 

稀疏协调辅助学习的最优治疗决策

                                                                                                                                                               

Prof. Lan Wang介绍辅助算法

 

        来自明尼苏达大学统计学系的Prof. Lan Wang为听众带来一场关于辅助学习算法的讲座。其算法可以广泛运用到各种决策场景中。Prof. Wang以公民投票为例,简单说明了为了找到最优决策规则,2016年提出的一种基于最大秩相关估计的协和辅助学习算法。通过两两比较,可以更好地利用现有信息。然而目标函数的不连续性,使得计算难以优化。经过一定研究,这个问题可以通过一种凸代理损失函数得到解决。此外,该算法还使得决策的复杂性降低。王岚讲授详细地讲授了该算法的具体步骤,并且此算法已在抑郁症治疗的临床试验应用中呈现不错效果。

 

人工智能,大数据和数据分析

                                                                                                                                                              

Prof. Feifang Hu解析人工智能

 

        Prof. Feifang Hu 来自乔治·华盛顿大学统计学系,他从数据的角度解析人工智能。人类通过已有的信息进行决策,并且根据新产生的信息来优化决策。Prof. Hu从这个角度为人工智能下定义,他认为人工智能够通过搜集的数据帮助人类做出决定。在这个过程中,有效数据极为重要。Prof. Hu 强调了有效数据的重要性,并且以曹冲称象、不同度量衡下的物体质量为例,为听众概述了获得有效数据的方式——设计合适的实验,以往有很多人对数据进行错误的认识,却以为是数据欺骗了他们。Prof. Hu认为学会如何获得并且认识有效数据极其重要。

 

部分观测Heston模型滤波方程的实时随机波动率估计

                                                                                                                                                                      

Prof. Zeng Yong介绍贝叶斯估计

 

        在其部分观测Heston模型滤波方程的实时随机波动率估计的讲座中,Zeng Yong教授以追踪股市交易记录为例,通过最近提出的针对超高频数据的标记点过程观察,以及滤波方程进行贝叶斯估计( BEFE),简单介绍了Markov过程的普遍框架。该讲座涉及使用标记点过程观察过滤模型,选择归一化方程以表征后验,并使用递归算法进行贝叶斯推理以传播和更新联合后验分布。Zeng Yong教授和他的同事B. Bundick,J. Yin表明了递归算法在GPU并行计算中的适用性,并提供了从超级计算机获得的仿真和经验结果以证明递归算法有效。最终,通过将递归与GPU计算和高效算法相结合,他们提出了基准SV或更复杂模型的实时统计推断。在之后的提问环节中,Zeng Yong教授更证明了这一模型在可应用于时间序列数据的分析,例如风险管理和期权定价,表现了统计学模型与其他领域的有机结合。

 

过去气候重建的统计发展与挑战

                                                                                                                                                               

Prof. Bo Li讲述如何应用大数据进行气候重建

 

         Prof. Bo Li 为我们带来了一场关于应用大数据进行气候重建,研究长期气候动态变化的科普讲座。要理解气候动态变化需要与长温度时间序列的相关知识,而长期的、广泛分布的温度观测是难以获得的。于是教授提出可以使用一些能用来推测过去温度的“气候代理”(如树的年轮、花粉等)以及辐射驱动力(如火山作用,太阳射线等)作为数据来源,并使用这些数据进行回归分析来推测长时间温度变化。接着Prof. Bo Li说明了存在的问题,即如何量化温度估计值的不确定性,然后提出了相应的解决办法:找出在已知观测的条件下,温度的分布,并用一个可能的重建整体替代该分布。接着Prof. Bo Li解释了如何生产温度整体,并随后展示了得出的统计模型,介绍了模型拟合方法以及如何解决过拟合问题和模型参数估计不确定性的方法,并使用多个图像展示出了最后的拟合结果。然后Prof. Bo Li解释了如何将以上提出的不同数据来源集合到一起的方法,并介绍了贝叶斯分层模型的方法。最后教授说明了从数值分析中所得出的信息,并提出目前仍然存在的问题及挑战。

 

协变量网络种群建模的网络响应回归

                                                                                                                                                                  

Prof. Jingfei Zhang 讲述网络响应回归方法

 

        Prof. Jingfei Zhang 讲述了有协变量的网络建模和分析。首先教授提出了研究目标,即在群体层次上描述网络连通性,并试图了解这种连接模式是否以及如何受到主题协变的影响。教授先说明了已存在的方法,并在此基础上提出了一种新的网络响应回归模型:将观测到的网络作为矩阵值的响应,将单个协变作为预测因子。随后Prof. Jingfei Zhang 对该网络响应回归模型作出详细的解释,例如对模型的估计,以及优化算法等,然后给出了理论上的结果。 最后教授介绍了一般损失函数下的误差边界,并用该模型和其他模型进行模拟实验,并给出了实验结果。

 

密歇根大学统计学和数据科学项目 (含讨论)

                                                                                                                                                                   

Prof. Xuming He介绍密歇根大学研究生项目

 

        Prof. Xuming He 详细地介绍了密歇根大学统计与数据科学研究生项目。首先教授讲述了统计学以及数据科学专业在近几年的发展状况,并介绍了密歇根大学的统计学及数据科学专业等研究生项目情况。随后教授说明了数据科学专业所需的知识内容框架,包括了数学、计算机科学、统计学以及其他领域科学。紧接着他还介绍了密歇根大学与香港中文大学(深圳)的AMDP研究生项目,包括项目具体内容、开设课程、申请要求及流程等信息。

 

                                                                                                                                                                

开幕式大合照

(医学和健康科学创新研讨会与统计学数据科学研讨会参会教授)

 

        本次研讨会探究了统计学在不同领域中的运用,展现了统计学和数据在未来不同产业中的发展前景,为在座的同学们提供了未来就业和升学新方向。