918博天堂(中国)

顶刊解读|5万+图像!欧洲团队用Pi-10构建全球超大浮游生物AI训练数据集PlanktoShare
日期:2026-05-29 17:59:58

近期, 一篇发表于地球系统科学领域SCI一区Top期刊 Earth System Science Data(ESSD)(IF=11.6)的预印本论文引发行业关注——作者为来自瓦赫宁根大学及研究中心,瓦赫宁根海洋研究所,荷兰基础设施与水管理部(Rijkswaterstaat)的 Lodewijk van Walraven 等人,该团队来自荷兰、英国多家权威海洋科研组织,基于浮游生物成像仪 Pi-10, 成功构建了一套超大规模、标准化、可直接用于AI训练的浮游生物图像数据集 PlanktoShare,样本量超 52,882 张,覆盖大北海与东北大西洋海域,为全球浮游生物自动化监测树立了新标杆。

图026052902

浮游动物是一类物种多样性极高的生物类群,在生态系统运转中发挥着关键作用。这类生物是大洋食物网中重要的营养联结环节,诸多经济鱼类都依靠浮游动物获取食物。浮游动物还会顺利获得多种机制有助于生物泵运转,包括产生沉降粪粒、外骨骼与黏液摄食网,以及借助所谓的脂质泵发挥作用。此外,许多底栖生物存在阶段性浮游生活形态,也就是阶段性浮游生物。这类生物在近海海域中数量往往占据优势,同时也成为底栖动物定居与空间分布的制约因素。浮游动物的生物量与多样性被全球海洋观测系统认定为核心海洋观测变量,也被应用于 OSPAR's 最新海洋环境状况报告的多项质量评价指标中。

利用成像技术研究颗粒物与浮游生物, 是海洋科学领域中开展十分迅速的一个方向。这类设备生成的数据,需要依托人工标注图像数据集训练出的自动分类方案来处理。Pi-10 是一款较新型的成像设备,有着独特的应用场景。不同于水体剖面观测设备(如浮游生物视频记录仪(VPR)、水下视频剖面仪(UVP)),也区别于用于实验室分析网采样本的仪器(如浮游动物扫描系统、宏观流式成像仪)。Pi-10 可顺利获得外接水泵持续抽取表层海水,并借助机载线扫描装置对水中颗粒物进行不间断成像。设备内置的自动分割功能可实现让用户处理相近的感兴趣区域(ROI)。

Pi-10:船载原位陆续在监测的“理想平台”

传统浮游生物监测依赖网采、人工镜检,耗时费力、空间覆盖有限;而成像设备虽能高效采集图像,却长期面临数据集不统一、标注混乱、难以合并共享的痛点,导致 AI 分类模型难以推广。

Pi-10 由英国 Cefas 与 Plankton Analytics 联合开发,采用线扫描成像 + 流式陆续在采样,无需人工值守、不干扰船舶正常科考与渔业调查作业,可直接搭载于科考船、渔业监测船、水质调查船,实现表层海水全天候、高通量、原位浮游生物成像。

2023 年,荷兰渔业科考船“R/V Tridens II”搭载了一台 Pi-10 设备。2023 年 5~6 月召开的首期调查结果表明,该设备能够精准监测荷兰沿岸各类浮游生物的种群密度及其变化情况。2024 年,英国 “Sir David Attenborough” 号极地科考破冰船在从英国前往南极洲的航线上启用了 Pi-10 设备。2025 年,荷兰皇家海洋研究所(NIOZ)完成相关测试,证实将 Pi-10 设备安置在岸基集装箱内召开作业具备可行性,可实现对沿岸水域浮游动物动态变化的持续监测。现在,普利茅斯海洋实验室正研发并测试搭载于浮标之上的 Pi-10 设备,计划将其部署至 L4 观测站。

2025 年,Scotte 等人已对 Pi-10 浮游生物成像仪进行了详尽介绍。设备见图1。环境水体由 LED 光源照明,搭配一台朝下布设的 Basler 2048-70kc 线扫相机完成成像。该相机扫描速率为每秒 70000 行,每行可采集 2048 个像素,单个像素尺寸为 10 μm,能够清晰拍摄最小尺寸达 200μm的可辨识生物样本。设备通水流量需稳定维持在每分钟 34 升(即每小时 2 立方米),因此需配备流量计实时监测。整个调查过程中,由水泵抽取海面以下数米处的水体。“R/V Endeavour” 科考船与 “R/V Tridens II”科考船均搭载大流量离心泵,设备以低转速运行,最大限度避免对脆弱的浮游动物造成严重损伤。

图126052902

图1 Pi-10 搭载于 “R/V Tridens II”科考船,图中标注了进水口、LED 光源、流通池、相机、流量计及出水口。

在本研究中,研究团队打造了全球首个面向 Pi-10 用户的 FAIR 标准化浮游生物训练集,Pi-10 展现出强大优势:

图226052902

图2 使用 Pi-10 设备在北海拍摄的附带分类信息的浮游生物图像示例

PlanktoShare 技术亮点:灵活分类协议 + 开放共享

文章提出一套全新灵活分类体系,彻底解决多来源数据集难以合并的问题。所有图像分为三大类:

  1. Organism:完整生物个体

  2. Taxo_particle:带分类信息颗粒(如蜕皮、组织碎片)

  3. Non_taxo_particle:无分类信息颗粒(海洋雪、气泡等)

分类学标注统一使用 WoRMS 世界海洋物种登记库 AphiaID,确保标准唯一、可自动更新。生活史阶段、身体部位等信息以属性独立存储,支持灵活筛选与扩展。数据集内置版本控制,可不断扩充、兼容全球用户新增数据。最终,团队基于 PlanktoShare 训练出高精度 AI 模型:

  1. 精细分类器(49 类):F1=91.3%

  2. OSPAR 生态型分类器(12 类):F1=95.4%

图326052902

图3 多张未分类 Pi-10 图像的分类方案(左侧)。图像被划分为“生物个体”“分类颗粒”和“非分类颗粒” 三类。图像编号由 Pi-10 设备生成,自定义名称由研究人员设定。空白单元格代表无数据。

图426052902

图4 PlanktoShare 数据集中所有图像的采样位置。黑色线条表示荷兰大陆架边界。

图526052902

图5 PlanktoShare 训练集的图像尺寸分布谱

图626052902

图6 PlanktoShare 学习集中所有第一组图像(即生物类别)的克罗纳分类图(样本量 n=42742),图中百分比依据对应分类单元的图像数量计算。图中展示了各类群的典型感兴趣区域,仅作示例参考。

结语与展望

本研究提出一套通用、灵活的浮游生物图像训练集协同构建协议,可支持 FAIR 原则的数据共享。PlanktoShare 不仅是一套数据集,更是全球浮游生物成像监测从 “分散科研” 走向 “标准化、网络化、智能化” 的重要里程碑。而 Pi-10 凭借船载原位、陆续在成像、高通量、易集成等特点,将为近海生态长期观测增加更多助力。

918博天堂(中国)科技作为 Pi-10 在中国与东南亚的销售和技术服务组织,同步给予 Cytobuoy 藻类扫描成像监测系统,德国 WALZ 调制脉冲叶绿素荧光仪及藻类分类荧光仪等光合研究系统,我们致力于将国际最前沿的浮游生物自动化监测技术与标准方案引入国内,为海洋生态环境监测、渔业资源调查、赤潮 / 藻华/有害生物预警供全面技术集成和科研支持方案。

注:本文基于预印本论文 “PlanktoShare: A large (50k+) and FAIR learning set for the Plankton Imager (Pi-10) for the Greater North Sea and NE Atlantic, based on a new flexible classification protocol”(DOI: 10.5194/essd-2026-215)进行中文翻译、整理与解读。论文基于CC BY 4.0 协议授权,原文作者及期刊保留所有权利。

如您需要分析更多信息,请识别下方二维码填写登记表,我们会为您给予专业的服务,真诚期待与您的合作!

电话:021-32555118,邮箱:sales@ibennz.com

相关阅读:

•CytoSense:助力蓝藻高频监测,守护碧水清波

•多维度水质监测:驱动珊瑚礁白化机制解析与预测

•流式细胞术数据标准化实操技巧:不同海域浮游生物聚类分析

收 藏