一组研究人员推出了一种时间序列机器学习技术,旨在解决数据漂移挑战。这种创新方法由UNIST工业工程系和人工智能研究生院的SungilKim教授和DongyoungLim教授领导,有效处理现实世界时间序列数据中的不规则采样间隔和缺失值,为确保人工智能(AI)模型的最佳性能。
时间序列数据以连续时间顺序收集数据为特征,普遍存在于金融、交通和医疗保健等各个行业。然而,数据漂移(影响数据生成的外部因素的变化)的存在给人工智能模型中有效利用时间序列数据带来了重大障碍。
Kim教授强调了对抗数据漂移对时间序列学习模型的不利影响的至关重要性,并强调解决这一阻碍人工智能模型中时间序列数据最佳利用的持续问题的紧迫性。
为了应对这一挑战,研究团队引入了一种利用神经随机微分方程(NeuralSDE)构建弹性神经网络结构的新颖方法,能够减轻数据漂移的影响。
神经SDE是神经常微分方程(ODE)的扩展,代表残差神经网络模型的连续版本,并构成团队创新方法的基石。通过实施三种不同的神经SDE模型(朗之万型SDE、线性噪声SDE和几何SDE),研究人员在插值、预测和分类任务中展示了稳定且卓越的性能,即使存在数据漂移也是如此。
传统上,解决数据漂移需要进行劳动密集型且成本高昂的工程调整,以适应不断变化的数据环境。然而,该团队的方法提供了一种主动的解决方案,确保人工智能模型从一开始就对数据漂移保持弹性,从而避免了广泛的重新学习过程。
林教授强调了这项研究对于增强时间序列人工智能模型针对动态数据环境的弹性的重要性,从而实现跨行业的实际应用。主要作者YongKyungOh强调了该团队致力于推进监控时间序列数据漂移和重建数据的技术,为韩国企业的广泛采用铺平了道路。
这项研究被认为是国际学习表征会议(ICLR)的前5%焦点论文,它代表了人工智能和数据科学领域的潜在重大进步。