科研动态

国科大导师白明团队合作提出地理大数据实时呈现的新方法

  • 地理空间数据分析在生物多样性、移动通讯、网络监控、环境监测等诸多领域中应用广泛,比如生物地理分析、即时通讯场景的位置共享、手机定位、卫星定位等案例,因此大规模地理数据的快速呈现具有重要的理论意义和实际应用价值,然而由于种种技术难题,目前尚无法有效实现地理动态大数据的实时性呈现。这个技术问题实际上可以被刻画为一个数学问题:点在球面多边形内的位置判定,这既是全球地理分析中的必要环节,也是解决该问题的关键所在。由于球面是非欧空间,这导致计算过程更为复杂,从而严重影响判定速度。相比投影、经纬度网格等方法,使用六边形网格来判定点的空间位置是一个可能的途径。为此,中国科学院动物研究所白明研究组和中国科学院软件研究所王文成研究员提出一种基于六边形的自适应层次网格结构和球面信息点的判定方法,该方法可以很好地处理球面的非欧空间约束,从而提高点向多边形的检测效率。

    同时,这种自适应层次结构的构建面临许多挑战:任务负载、动态内存分配和数据依赖与同步。因此,该研究又进一步提出使用GPU并行计算来实现高效的(Adaptive Hexagonal Hierarchical Grid, AHHG)构建。相比于类似的球面网格划分方法,该方法大幅降低计算开销,并且可以更稳定而高效地处理动态变化的情况。

    该方法可以很好地应用于生物多样性研究中,可以显著提高运算效率和稳定性。例如,在基于AHHG构建的球面体中,从约1.5亿个甲虫地理标点数据集过滤并可视化240万北美甲虫标本地理标点信息仅需95毫秒,比此前Ketzner等人提出的算法(Ketzner et al, 2022 Computers & Geosciences)快了877倍。

    依据白明研究组与海关系统正在合作的关口前移有害生物监测技术,项目组计划在远洋货轮上布设智能监测装备,从而可以精准探明货轮在不同国家地区监测到的有害生物,为避免国际纠纷提供科学支撑。然而货轮在地球上的精准实时害虫风险预测尚存在一定困难。本研究基于5艘移动的货船在大西洋的航行轨迹和约100万个害虫的动态分布点,平均每帧运行时间为23毫秒,实现了实时监控害虫风险。同时本研究对于边界不断变化的自然区域,点的判定速度也比其他最新优化算法效率更高,比如可以适合于洪水发展和消退过程中边界的快速追踪、昆虫迁飞区域识别、战棋推演等方面。总之,该技术为地理大数据快速呈现领域提供了目前世界最快的解决方案,对于理论研究、行业应用、可持续发展、美丽中国、健康中国等方面具有重要支撑作用。

    此前,白明研究团队还创制保存高质量DNA的昆虫野外监测装置WET(Lee et al., 2023 Methods in Ecology and Evolution)、开发表型编码网络PENet(Zhao et al., 2023 Methods in Ecology and Evolution)。结合本研究提出的使用GPUs创建六边形自适应层次网格,它们从昆虫标本的采集和高质量监测、表型数据提取和表征、地理大数据的处理等方面提供一系列高效的新工具和方法,全面助力下一代生物分类学发展。

    该研究成果以Hexagon-based Adaptive Hierarchies for Effcient Point-in-Spherical-Polygon Tests on GPUs为题,于北京时间2023年11月30日在线发表于《国际地理信息科学杂志》(International Journal of Geographical Information Science TGIS )。中国科学院动物研究所工程师李静为第一和论文通讯作者,动物所白明研究员和软件所王文成研究员为高级作者。这项工作得到科技部国家重点研发计划、国家自然科学基金委、国家科技基础资源调查项目、东北亚生物多样性研究中心等项目资助。

    论文链接:https://doi.org/10.1080/13658816.2023.2284908

    W020231201314674809745 (1).jpg

    图1. 使用GPU构建六边形自适应层次网格(AHHG)的工作流程图

    W020231201314674932268.jpg

    图2. AHHG的工作原理

    W020231201314675139421.jpg

    图3. 三个AHHG应用实例的截图,视频地址http://beetle.ioz.ac.cn/GAHHG.mp4

    责编 : 脱畅