English

新闻快递

计算机学院於志文教授团队在《欧洲物理快报》上发表人类行为可预测性理论性成果

2023年03月26日 徐恩 

纵观历史,从古代的先知到现代的科学家,人类都试图做出预测——从天体运行、气候环境到人类行为。行为可预测性是人类行为理解的科学问题之一。从纯理论分析到人工智能预测方法,各种纷繁复杂的算法被提出不断刷新预测的准确率。一个基础性的问题自然而起:人类行为的最高预测准确率是多少呢?

可预测性是一种新兴的指标,可量化给定时间序列的最高预测准确率,被广泛用于评估已知的预测算法和描述人类行为的内在规律。了解可预测性能够认识预测任务的可行性,让研究者更好地有的放矢。但是,最近越来越多的批评针对可预测性的估计不准确,不精准的可预测性缺少实际的使用价值,而这是原始基于熵方法的缺陷造成的。

最近, 西北工业大学计算机学院徐恩博士、於志文教授、孙卓副教授、郭斌教授,与电子科技大学大数据研究中心周涛教授在《欧洲物理快报》上联合发表题为Equivalence between Time Series Predictability and Bayes Error Rate的研究论文,於志文与周涛为共同通讯作者。该论文严格证明了时间序列的可预测性等同于一个看似不相关的指标,即贝叶斯错误率,后者量化了分类中不可避免的最低错误率。这个证明连接了两个独立发展的领域,因此每个领域都可以立即从另一个领域受益。例如借助贝叶斯错误率估计可以在很大程度上解决可预测性评估不准的问题。

可预测性指给定时间序列的预测准确率极限。探索这样的度量非常重要。一方面,根据给定的数据,它可以用来评估表现,并估计现有算法的潜在改进空间。另一方面,它描述了时间序列的内在规律,从而加深了对相关现象的理解。例如,可预测性变化揭示了灾难后人类移动模式的改变,量化行为相似性和社会关系对人类移动预测的贡献,揭示模型结构和社会网络异质性在预测传染性疾病疫情的预测中所发挥的作用,等等。

了解可预测性的直接价值是决定是否值得改进当前的预测器。不幸的是,基于熵的方法通常会失败,因为它在很大程度上高估了真实的可预测性。性能不理想的部分原因是近似只考虑了具有最大下一时刻发生概率的状态的熵。但这种近似也是保证计算可行性不可缺少的一部分。因此,在熵框架中很难克服观察到的缺点。本研究揭示了可预测性和一个看似不相关的度量贝叶斯错误率之间的等价性,并立即提供了一种新的方法来提高可预测性的估计——应用受贝叶斯错误率启发的方法。如下图所示,受贝叶斯错误率启发的方法明显更好。在子图B和D中,红色线是受贝叶斯错误率启发方法的表现,蓝色线是基于熵的方法,虚线表示真值,越接近虚线评估偏差越小。

本研究为两个独立发展的领域建立了桥梁,为两领域的借鉴学习奠定了基础。时间序列可预测性的评估精度立即可以获得明显提升,不仅可以计算精准的人类行为可预测性同时可以限定可预测性的上下界区间。贝叶斯误差率的使用场景也将极大丰富,相关研究也可以将贝叶斯误差率视为一个系统特征,揭示生成机制的变化,并检测系统的高阶异常。

(审稿:邓磊)

上一条:计算机学院召开新学期研究生导师培训会暨招生复试动员会 下一条:生成模型在场景分析上的应用和挑战——计算机学院举办第三十三期“01学术沙龙”活动

关闭