
好讯息,AI也不错帮科学家画脑图了!
近期,一个来自加州大学旧金山分校的神经科学团队冷落了一种新的机器学习算法——CellTransformer,仅破耗几个小时就完成了对5只小鼠大脑图谱的分类和绘图使命。

这五只小鼠大脑的基因数据中包含1040万个细胞,每个细胞包含数百个基因。但通过这一翻新性算法,规划团队不仅明晰地分离出了小鼠大脑内的已知区域,还绘图出了新的脑区。
更夸张的是,这项技巧很可能会进一步应用于东谈主类。
画脑图的最新黑科技:CellTransformer
大脑图谱绘图是一门迂腐的学科,当年画脑图的措施相当复杂,需要科学家用铅笔在脑部图像上画线,勾通不同区域。
2020年发布的艾伦小鼠脑通用坐标框架(Allen Mouse Brain Common Coordinate Framework),就是遴荐这种措施画出来的。
这幅脑图基于1675只小鼠的脑部数据,涵盖了1000多个不同的脑区,具有很高的价值。

但这类手工特征很强的图谱也不能幸免地存在一个问题:具有主不雅性。
宾夕法尼亚州立大学医学院的神经剖解学家金永洙(Yongsoo Kim)暗示,当他向资深内行求教怎么画脑图时,对方往往唯有一句话:“这都是我脑子里的。”
不外,今时不同往日。来自加州大学旧金山分校的Reza Abbasi-Asl和他的团队冷落了一套名为CellTransformer的编码器-解码器架构,仅破耗几个小时便能完成这项使命。
CellTransformer的使命旨趣是这么的:
立时遮住一个细胞的身份和基因抒发,让模子凭据邻居细胞来估量它,估量错了就更新,访佛几百万次。
具体来说,规划东谈主员会先给每一个细胞规矩一个“邻域”——以它为中心,在一定微米距离内的总计细胞,都会被纳入不雅察范围。这么模子在消亡时辰里,既能看到细胞之间的空间结构,又能看到它们在分子层面的各异。
在这个邻域里,每一个细胞都会被算作一个token,就像谈话模子里的一个词。
CellTransformer使用Transformer的自谨慎力机制,让这些细胞互相“换取”:模子会自动学习,哪些细胞之间的关系更要害,哪些邻居对现时细胞的影响更大。

磨练时,规划东谈主员遴荐一种相当精巧的自监督花样。模子会立时选中一个细胞,把它的基因抒发信息“遮住”,只保留它的细胞类型标签,然后让模子凭据周围邻居的情况,去估量这个细胞正本应该抒发哪些基因。
在里面结构上是这么的:
通过多层Transformer编码器架构,模子会让邻域内总计细胞的信息充分交互。
随后,它会把这些细胞的暗示通过一个学习得到的池化操作压缩成一个向量,用来代表总计这个词邻域的“组织环境”。
接下来,模子再结合被遮住细胞的类型信息,通过一个较浅的解码器,反推出该细胞的基因抒发散播。
终末,规划东谈主员为每一个细胞索求一个“邻域暗示向量”,把总计细胞、总计切片的这些向量拼接在一皆,再用k-means等聚类措施进行分析,脑区就会“我方败表露来”。
已知的功能区会当然对皆,而在一些区域中,模子还会进一步拆分出更细巧的亚区,以致发现当年从未被系统标注过的新脑区。
适度有多强?
为了考证CellTransformer的灵验性,规划团队在ABC-WMB数据集上进行了系统评估,数据集包含5只小鼠的脑组织数据。
其中一只小鼠由艾伦脑科学规划所使用包含500个基因的MERFISH panel 进行处理,并鸠合了53个冠状切片;其余四只小鼠的数据来自艾伦小鼠脑通用坐标框架的规划,并使用包含1129个基因的panel进行鸠合。
领先,后果太高了。CellTransformer在数小时内完成了对5只小鼠、1040万个细胞的空间组织建模,a8体育官方网站这是传统措施在时辰和鸿沟上都无法企及的。
其次,准确对皆已知的脑结构分区。CellTransformer粗略在小鼠大脑中界说25到1300个神经区域,何况在皆备不使用脑区标签的情况下,高度对皆已知的剖解结构和功能分区。
由于CellTransformer诓骗其估量适度对细胞进行分组,不会生周全新的脑图,是以也不存在幻觉问题。
规划团队再行遴荐了手绘的艾伦小鼠脑通用坐标框架,将CellTransformer的输出与其进行比拟,发现两者吻合邃密,展现了相似的结构,连皮层中的层级结构也能作念到一致。

上头这张图中,左边是CellTransformer绘图的小鼠脑图,右边是东谈主类科学家诓骗艾伦小鼠通用坐标框架绘图的小鼠脑图。两者都定位了大脑中1000多个细胞亚区,但AI发现得更多。
在海马体分区的识别中,CellTransformer在k=1300时识别出的空间域与当年关连规划界说的亚区领域高度一致,包括背侧下托的三层组织和前下托的背腹侧组织。

而在上丘区域,CellTransformer也明晰识别了嗅觉层的带状层、浅灰层和视层,以及通顺关连中间灰质和白质的亚区,并发现了与Benavidez等东谈主通过投影映射详情的类似表里侧结构。
第三,除了对皆已知的脑功能区,CellTransformer还能识别和绘图出新区域。即即是此前通用神经科学措施所遗漏的区域,CellTransformer也不在话下。
以纹状体为例,它位于大脑中部隔邻,呈条纹状,容貌略似C形。在小鼠脑图谱中,纹状体被称为尾壳核。
规划发现,当调动不同的k值时,尾壳核会出现网格状、交错的空间结构,这与此前规划基于投射勾通得到的Voronoi分区高度一致。

由此,CellTransormer还不测地回复了神经科学领域一个被追问已久的问题:纹状体已知参与通顺、赏赐和举座大脑处理。大脑的消亡部分是怎么实践如斯截然有异的任务的呢?
谜底是:尾壳核并非一个单一的脑区。从图谱中就不错看出,它履行上被细分为更小的区域,不外每个区域所对应的功能还有待进一步规划。
{jz:field.toptypename/}而脑干的中脑网状核则是一个规划相对较少的区域,它考究启动通顺。
CellTransformer在该区域识别出了4个新的脑区,每个脑区都具有特地丰富的细胞类型和特定的激活基因。
此外,一些此前分析中被定位在大脑其他区域的细胞类型,在这部分脑区也被发现了。

第四,这不是“小鼠特供算法”。CellTransformer粗略延伸到多动物、百万细胞数据集。
为了规划CellTransformer整合不同动物样本的智商,团队又基于另一个MERFISH数据集从新启动磨练了一个新模子。
适度发现,CellTransformer在总计5只动物(1个冠状切片和4个矢状切片)中均生成了一致的亚区,所识别的脑区在不同动物之间高度一致,标明该措施粗略凯旋整合具有异质性测量适度的动物脑区。

实在的大招还没来:东谈主脑
小鼠并不是实验的看法,这项算法最终的应用方针将指向——东谈主类大脑。
规划东谈主员谋略,小鼠和东谈主类大脑的某些区域会高度匹配,而另一些区域则会存在各异。
不外缺憾的是,小鼠大脑约有1亿个细胞,而东谈主脑则有约1700亿个细胞,面前还无法从东谈主脑中得回实足多的数据来作念出准确的估量。
但规划团队对改日的地点亦然相当有信心。Abbasi-Asl以为,一朝得回实足的数据,CellTransformer将粗略搪塞这一挑战。
除了大脑除外,不异的算法还不错用于其他器官——举例肾脏和病理组织,通过提供堤防细胞图谱来匡助科学家作念进一步规划,如判断健康肾脏和糖尿病肾脏的各异。
不外,以当今的技巧发展速率……AI画出东谈主类脑图,这一天应该不远了吧?

备案号: