河流流量:新的机器学习方法可以改善环境预测

机器学习算法每天为我们做很多事情——将不需要的电子邮件发送到我们的垃圾邮件文件夹,警告我们倒车时后面的故障物,并给我们推荐接下来要看的电视节目。 现在,我们越来越多地使用这些算法为我们进行环境预测。

(ChinaIT.com讯)来自明尼苏达大学、匹兹堡大学和美国地质调查局的一组研究人员最近在 2021 年工业和应用数学学会 (SIAM) 数据挖掘国际会议 (SDM21)的会议记录上发表了一项关于预测河网流量和温度的新研究。 该研究由美国国家科学基金会 (NSF) 资助。

该研究展示了一种新的机器学习方法,其中算法被“教授”物理世界的规则,以便做出更好的预测并将算法引导到输入和输出之间具有物理意义的关系。

该研究提出了一个模型,即使在可用数据很少的情况下,也可以更准确地预测河流和溪流的温度,大多数河流和溪流都是这种情况。该模型还可以更好地泛化到不同的时间段。

“溪流的水温是许多重要水生系统的‘主变量’,包括水生栖息地的适宜性、蒸发率、温室气体交换和热电能源生产效率,”该研究第一作者、匹兹堡大学计算机与信息学院计算机科学系助理教授贾晓伟说。 “准确预测水温和流量也有助于资源管理者的决策,例如帮助他们确定何时以及从水库向下游河流释放多少水。”

对机器学习的一个普遍批评是预测并不基于物理意义。也就是说,算法只是寻找输入和输出之间的相关性,有时这些相关性可能是“虚假的”或给出错误的结果。该模型通常无法处理输入和输出之间的关系发生变化的情况。

2020 Ph.D. 明尼苏达大学科学与工程学院计算机科学与工程系的博士生贾和他的同事发布了一种新方法,使用“过程引导或知识引导的机器学习”。该方法应用于特拉华河流域 (DRB) 的水温预测用例,旨在克服使用机器学习进行预测的一些常见缺陷。 该方法通过一个相对简单的过程通知机器学习模型——时间相关性、流之间的空间连接和能量预算方程。

河流温度动态的数据稀疏性和可变性并不是特拉华河流域独有的。相对于美国大陆的大部分地区,特拉华河流域的水温监测良好。因此,特拉华河流域是开发河流温度预测新方法的理想场所。

美国地质调查局发布的交互式视觉解释器强调了这些模型的发展以及水温预测在 DRB 中的重要性。可视化展示了社会对水温预测的需求,水库为超过 1500 万人提供饮用水,但也有竞争性的水需求,以维持重要游鱼物种的下游流量和冷水栖息地。当水库管理者预计水温将超过临界阈值时,他们可以释放冷水,准确的水温预测是仅在必要时使用有限水资源的关键。

最近的研究建立在美国地质调查局的水科学家和明尼苏达大学双城分校计算机科学家在科学与工程学院计算机科学与工程系 Vipin Kumar 教授实验室的合作基础上,研究人员致力于开发知识引导的机器学习技术。

“这些以知识为导向的机器学习技术从根本上比科学界用来解决环境问题的标准机器学习方法和传统机械模型更强大,”库马尔说。

这些由 NSF 的利用数据革命计划资助的新一代机器学习方法正被用于解决各种环境问题,例如改善湖泊和河流温度预测。

在由明尼苏达大学计算机科学与工程系博士研究生 Jared Willard 领导的美国地球物理联盟水资源研究中心另一项由 NSF 资助的关于预测未监测湖泊水温动态的新研究中,研究人员展示了如何使用知识引导的机器学习模型来解决最具挑战性的环境预测问题之一——在不受监控的生态系统中进行预测。

模型从观测良好的湖泊转移到观测很少或没有观测的湖泊,即使在不存在温度观测的湖泊中也能进行准确预测。研究人员表示,他们的方法很容易扩展到数千个湖泊,这表明该方法(具有有意义的预测变量和高质量的源模型)是未来许多未受监控系统和环境变量的一种很有前途的方法。

 

ChinaIT.com 网站文章仅限于提供更多信息,不代表本网站立场观点。如需转载,请注明来源 。转载之文章来源于互联网,如有版权问题,请与我们联系:content@chinait.com。

扫码关注ChinaIT小程序,随时掌握最新IT资讯