发布时间:2024-07-01
2024年7月3日,《Nature Methods》期刊在线发表了中国科学院脑科学与智能技术卓越创新中心(神经科学研究所)严军研究组题为《Gapr for large-scale collaborative single-neuron reconstruction》的研究论文。该论文介绍了严军研究组自主开发的名为Gapr的新一代大规模单神经元重构系统。Gapr创新地整合了基于深度学习的全自动重构、多用户同时参与协同校对、高效响应用户需求的图像数据处理等多种功能,大幅提升神经元重构的效率。Gapr的开发对推动全脑介观神经联结图谱的绘制具有重要意义。
大脑中神经元形态各异,尤其是复杂多样的神经元轴突结构对大脑中的信息传输极为重要。单个神经元轴突在全脑范围内的完整形态被称为单神经元投射谱。人脑中有近千亿个神经元,而要揭示大脑结构的组织规律,需要重构海量的单神经元投射谱。然而,用于重构轴突的亚微米分辨率的全脑成像数据体量巨大,比如小鼠全脑的数据高达TB量级,而猕猴脑数据甚至已经接近PB(1000TB)量级。传统神经元重构主要依靠手工方法完成,工作量大、极为复杂和耗时。如何在TB甚至PB量级的光学成像数据中准确、高效地重构出大量单神经元投射谱,是全脑介观神经联结图谱研究面临的一个巨大挑战。
严军研究组长期致力于全脑单神经元投射谱的重构和分析。该研究组苟凌峰博士前期开发了Fast Neurite Tracer (FNT)神经元追踪软件,实现了TB级光学成像数据中的单神经元重构。目前FNT已经在小鼠大脑单神经元投射谱重构的研究工作中被广泛使用。然而该系统已经难以满足全脑光学成像数据在数量和体量上的迅猛增长。
为解决这一问题,苟凌峰博士通过努力攻关,开发了Gapr(Gapr accelerates projectome reconstruction)这一全新的TB/PB级光学成像数据的神经元重构软件(图1)。与包含FNT在内的上一代神经元追踪软件不同, Gapr的工作流程是首先基于人工智能的算法,计算机对成像数据中所有的信号进行全覆盖式的自动重构。该环节可以在数据转换的过程中同时进行,从原始图像信号中识别出神经元的轴突结构和连接关系,可极大程度节省人力。而自动化重构中产生的错误,可继续由人工进行校对和纠正。Gapr的校对模块可支持上百个用户在同一空间内同时在线协同完成校对工作(图2)。由于校对工作中的每个用户都可实时看到其他用户的动态,因此可更大程度地减少对错误结构处理的遗漏,避免不同用户对同一错误结构的重复处理,也可杜绝对同一结构产生不一致的处理结果。因此Gapr可在提高校对工作通量的基础上,保证追踪结果的一致性和正确性。同时,针对更大的数据体量,由于Gapr开发了实时响应用户需求的数据处理模块,支持在重构工作中选择性地只处理那些包含有用信号的部分,在同等的计算资源条件下极大提高计算效率,突破了对TB乃至PB级图像数据进行高效处理的技术瓶颈。
图1 Gapr神经元重构系统的架构。a,Gapr的五个模块,包含图像数据处理的Convert模块,自动重构的Trace模块,协同重构服务器端的Gather模块及人工校对的Proofread和Fix模块;b,响应用户需求的图像数据处理;c,Gapr的神经元模型,与SWC文件格式兼容。
图2 Gapr中多用户协同重构的实现。a,在Gapr框架下避免重复追踪,确保结果一致性的示例;b,多人协同重构的实例,上图展示了参与重构的各个注释者的活动,下图为整体进度。
Gapr对一组小鼠fMOST数据进行重构的完整流程。最终总共得到了 402个神经元。
Gapr针对不同的科研需求提供了灵活的重构流程,为不同水平的用户提供了相应的校对模式,并可以系统地标记和评估追踪中的错误,降低对重构工作的人员专业性的要求。通过比较分析,Gapr的多项性能优于现有其它神经元重构软件。严军研究组前期工作中使用FNT从161组小鼠fMOST数据中获得了6357个小鼠前额叶神经元;而使用Gapr,在15组小鼠fMOST数据中,就能重构出4278个小鼠的神经元(图3)。Gapr能够在一组样本中重构出更多的神经元,有效的节省了动物的使用数量和样品制备成本,从而提高了总体的重构效益。同时,也可以避免FNT这类系统因人为选择性追踪带来的偏差。因此,新一代的大规模单神经元重构系统Gapr,为最大程度刻画和研究神经元多样性提供可能,为研究全脑介观神经联结图谱提供了重要的解决方案,也为将来绘制灵长类大脑的单神经元投射图谱铺平了道路。
图3 Gapr软件在小鼠fMOST数据中的应用。a,在15组样本中重构获得的共计4278个神经元;b,Gapr中单个注释者的校对速度,上部分列出了与Janelia Workstation和Vaa3D的手动重构与校对速度的对比。
该研究工作在严军研究员的指导下,由副研究员苟凌峰和博士研究生王彦智共同完成,高乐、钟毅婷、谢路成、王海芳、查茜、邵吟淇也做出了重要贡献。中国科学院脑科学与智能技术卓越创新中心许晓鸿研究组、徐华泰研究组(现临港实验室)提供了该研究中所用的部分测试数据。该工作获得科技部、基金委、上海市、临港实验室的资助。
主要作者合影