新闻动态

WeBrain:基于Web的脑信息计算云平台

发布时间:2021-11-25

1. WeBrain平台简介

随着云脑科学的发展,大规模的脑电研究需要快速处理不断增加的脑电数据。为了应对大规模脑电数据分析计算这一挑战,电子科技大学尧德中教授团队研发了用户友好(尤其是编程能力较弱的研究者、脑电初学者等)的脑信息处理云平台WeBrain。户不需安装任何软件或系统,只需要一个能够上网的浏览器就可以随时随地管理以及分析处理脑电数据。WeBrain云平台的注册使用面向广大科研人员目前也是完全免费开放的。平台工作现已正式发表在1区杂志Neuroimage。


image.png

图1 WeBrain主页:https://webrain.uestc.edu.cn/

 

2. WeBrain架构

WeBrain被设计成分布式计算脑信息平台,见图2。用户通过网页或者FTP工具来上传数据,用户与WeBrain的通信通过SSL证书进行加密,且WeBrain支持加密存储,保证数据传输、存储安全。WeBrain目前支持多种文件格式并且提供docker (https://www.docker.com/) 封装的脑电计算工具(如表1所示),用来保证结果的可靠性及可重复性。COMBS系统 (COntainer Management and Batch Schedule , COMBS) 是WeBrain用来管理计算任务的子系统,COMBS利用 Kubernetes (K8S, https://kubernetes.io/) 框架实现计算任务的调度、管理。根据现有的WeBrain系统的资源(今后还会升级),目前可同时容纳最多3500个任务并发运行(如图3所示)。


image.png

图2 WeBrain总体架构图。主要包括:1)用户层:用户通过浏览器与WeBrain平台进行交互;2)平台层:WeBrain采用微服务架构实现模块之间的相互配合;3)云端资源层:云端的工具与计算资源。

 

image.png

图3 WeBrain在不同数量任务并发时系统负载情况。图中A点表示单个任务达到资源上限时,理论上可运行最多250个任务;B点为WeBrain设定的并发阈值,现为3500个;C点表示理论上最多能同时运行5000个任务。虚折线为运行不同任务的系统实际负载情况。

 

表1 WeBrain支持的数据格式以及工具。

image.png


3. 使用介绍

3.1 角色介绍

在WeBrain中,主要分为三个角色,分别为系统管理员、工具开发人员以及用户/研究人员,见图4。三者工作流程分别如下:

  1. 管理员主要通过网页端实现系统的升级、维护以及数据、计算资源、工具的管理。

  2. 工具开发人员可选择自己熟悉的开发语言,在本地进行编程开发、工具打包、本地测试,然后将工具(基于Docker封装,以便保证结果的可重复性)封装为镜像后发布至云端私人或者公开镜像仓库,经管理员审核后,即可将工具整合至WeBrain系统(更多细节可见more details see the document on https://webrain.uestc.edu.cn/documentation.html , “How to Develop Standard WeBrain Tools ”)。

  3. 用户/研究人员使用的主要流程为:首先在本地将数据整理为标准文件结构(目前支持SEDS、EEG-BIDS以及手动打包,详见https://webrain.uestc.edu.cn/documentation.html,“WeBrain Tool Instruction v1.3 En”),然后上传数据、创建计算任务,计算完成后下载结果,具体流程见图5。

 

image.png

图4 WeBrain角色工作流程。

 

image.png

图5 用户操作流程。包括上传文件、创建任计算务、检查结果输出、下载结果。

 

3.2 论坛介绍

       为了让科研人员有一个相互交流的平台,WeBrain还创建了一个虚拟社区(International Virtual Community of Brainformatics, IVCB),见图6。如果用户或者工具开发人员在使用过程中遇到问题,可以直接联系WeBrain团队或者在论坛上发布自己遇到的问题。

image.png

图6 WeBrain论坛主页:https://webrain.uestc.edu.cn/WebrainForum

 

3.3 版块介绍

a) My Monitor版块。不同颜色的方框中显示了所有计算任务的基本信息(任务名称、使用的工具、选择的数据和创建者)(绿色:成功;红色:失败;蓝色:终止;灰色:其他)。

 

image.png

图7 My Monitor版块。

 

b) My Project版块。列出了用户操作中的所有计算任务。用户可以通过单击“+new task”,设置任务名称和描述、选择工具、设置参数以及选择数据文件,然后单击“执行”按钮来运行任务,从而轻松创建新的计算任务。


image.png

图8 My Project版块。

 

c) My File版块。列出了所有用户上传的数据文件(蓝色)或在WeBrain平台计算的结果文件(绿色)。用户可以通过web界面过滤、管理、删除和下载数据文件。

 

image.png

图9 My File版块。

 

d) 可视化板块。用户可以在WeBrain平台上在线快速查看脑电数据的波形图与地形图。


image.png

图10 在线可视化板块,可在网页上查看数据的波形图与地形图。

 

4. 结果对比

4.1 测试说明

测试数据集选用了闭眼静息态数据,年龄为 24 ± 1.6岁,其中男性为31例,女性为9例,共计40例数据。原始数据利用“WB_EEG_prepro”工具进行预处理,再将预处理之后的数据利用“WB_EEG_CalcPower”工具计算相对功率谱,并将WeBrain平台的测试结果与两台本地计算机上利用MATLAB计算的测试结果进行对比,并给出的组内相关系数(intraclass correlation coefficient, ICC)。同时,为了比较WeBrain与本地计算机之间处理数据的速度,我们利用“WB_EEG_prepro”工具对测试数据进行预处理。测试数据集采用闭眼静息态数据,共计16例,采样率为500Hz,导联数为63个,每例数据大小在30 ~ 45Mb之间。

 

4.2 测试结果

在WeBrain平台上对某样本脑电原始数据进行预处理。图中上半部分为原始脑电数据的波形图,下半部分为预处理后干净的脑电信号(REST零参考)波形图。


image.png

图11 预处理前后脑电信号波形对比。

 

       计算相对功率指标的WeBrain示例结果。前3行分别显示了WeBrain平台和两台本地台式计算机计算得到的不同频段的平均相对功率谱指标。最后一行显示了WeBrain平台和本地计算机之间运行的相对功率谱指标的ICC值。图12可见,WeBrain平台的计算结果与本地台式计算机的结果完全一致。处理速度对比结果可见,WeBrain极大的缩短了计算时间(图13)。

 

image.png

图12 ICC计算结果。

 

image.png

图13 处理速度对比结果。测试平台为本地个人计算机与WeBrain云端并行计算,计算工具为脑电预处理工具(含ICA等步骤)。

 

5. 总结与展望

随着云脑科学的兴起,缺乏计算资源与工具是大规模的脑电研究的一大阻碍。WeBrain旨在为大规模脑电数据分析提供工具与计算资源;并构建一个可持续和广泛的脑信息科学计算生态圈,将不同领域和经验的研究人员聚集在一起,不断扩大其影响力。此外,也为研究人员提供了完全相同的计算环境,以确保结果的可靠性和可重复性。

截止至目前,WeBrain已有来自全球25个城市,45个单位的注册用户,WeBrain网站已有来自51个国家/地区的6700人访问共计19000次访问。我们希望未来有更多的研究人员使用WeBrain分析处理数据,如果您是工具开发者,我们也十分欢迎您将工具发布到WeBrain。最后,WeBrain团队也希望用户能够提出改进意见,帮助WeBrain越做越好。

 

 

 

参考来源:

Webrain网址:https://webrain.uestc.edu.cn/

参考文献:

Dong, L., et al. (2021). "WeBrain: a Web-based Brainformatics Platform of Computational Ecosystem for EEG Big Data Analysis." Neuroimage: 118713.


原文链接:https://mp.weixin.qq.com/s/4KddEj32J-NCBcht1NMz_A