生物学学生+蟋蟀+高性能计算机=科学突破

发表 作者:Rebecca Goldfine
哈德利·霍奇学院分子神经生物学课程的学生本学期不仅要学习生物信息学的入门知识, 他们正在把新的计算技能应用到一个项目中,这个项目将有助于破译蟋蟀的神秘基因.
哈德利·霍奇和一只蟋蟀
生物学和神经科学教授哈德利·霍奇和一只蟋蟀.

Horch给她班上24名学生布置的任务是创建最大、最完整的普通田地蟋蟀的转录组. 在4月.

转录组指的是所有的转录本, 称为信使rna, 存在于组织中. 这些信使rna, 哪些是位于DNA中的基因的RNA副本, 蓝图是构建蛋白质的指示吗. 

“我们正在尝试做的事情是雄心勃勃的,”霍奇说. “在我们建成这个之后,我们还有更多的计划.“他们将利用收集到的信息,寻找蟋蟀弥补感官器官损失的非凡能力背后可能的生物途径。.

霍希的大多数学生在完成如此大的工作所需的计算生物学方面的经验有限或根本没有. 帮助他们尽快跟上进度, 霍奇与位于巴尔港的芒特沙漠岛生物实验室(MDIBL)的三位生物信息学家合作。. 他们每周都来领导在线实验室(事实上, 他们在同一个实验室上四节课,这样全班就可以分成六组,每组有社交距离的参与者).

在最近的一次坎巴107实验中, 六名戴着面具的学生至少相隔六英尺,坐在乔尔·格雷伯的大屏幕投影下面, 他是MDIBL的资深科学家和计算生物学主任,也是那天授课的老师. 一步一步来, 他和他的同事们正在指导学生们通过命令计算机将数十亿个遗传物质片段串在一起的过程.

尽管学生们将使用自己的笔记本电脑来完成这个项目, 生成转录组的实际工作需要的计算能力远远超过任何一台台式机或笔记本电脑所能提供的. 因此,学生们正在学习如何使用他们的个人电脑连接到 十大电子游艺的高性能计算机集群(HPC)该部门由十大电子游艺公司高性能计算部门主管Dj•梅里尔(Dj美林)负责.

梅里尔表示,他很高兴看到外部研究机构的融合, 十大电子游艺课程, 和学院的高性能计算. "这是我们第一次看到这三个人一起积极地教一节课。” 他说. 

“我个人非常感兴趣 分子 生物学; recent advances in 分子 研究方法 是它让我们有可能追寻这么多酷炫有趣的问题的答案. 了解现代神经科学研究, 有必要跟上这些方法的前沿. 我对神经和精神障碍也很感兴趣, 如:Angelman, 阿尔茨海默氏症, and Parkinson’s; these are 分子 障碍. 为了了解如何治疗和治愈它们,我需要获得工作所需的技能 分子 生物学. 我正在学习这些技能 分子 神经." -安东尼·亚尼斯22岁 

转录组对所有生物的重要性

对于非生物学家来说,转录组虽然与基因组有关,但却非常不同. (“转录组”是“转录本”和“基因组”的合成词). 基因组是生物体DNA和基因的完整图谱. 转录本是指信使rna从DNA上复制并开始构建蛋白质后所编码的信息. 而转录组是在任何给定时间内任何给定组织中所有可能的mRNA转录本的目录——这意味着它可以相当大.

科学家通过对生物(如胚胎)组织样本中的mRNA进行测序来获得转录本, 大脑, 肝脏, 和其他器官. 组织被解剖和均质化,并从样本中纯化RNA. 信使RNA被切割成短片段并进行测序, 是什么创造了一个需要把数百万块碎片拼起来的拼图.

成绩单阅读样本
学生们组装的部分转录组的截图.

霍奇想要一个准确的, 完成板球的转录组,因为它可以帮助她显示哪些基因, 它们中有多少在昆虫体内被打开或关闭, 在一定的实验条件下. 这反过来又能揭示在形成蟋蟀腿或眼睛的生物过程中所涉及的基因, 更适用于她的研究, 听觉系统.

这种蟋蟀非常不寻常,因为它能在受伤后重组听觉系统. 这意味着, 基本上, 在它的一只耳朵被割掉或损坏之后, 蟋蟀可以通过重新连接断开的一边来补偿剩余的一边, 完整的耳朵. “我们正在寻找这种重组的分子基础,”霍奇说. 

霍希的研究类型通常被描述为基础科学, 这意味着, 在她的工作基础上,未来可能会有医疗或治疗方面的进步, 她的目的纯粹是挖掘知识. 她借用了"临床前"这个术语来描述基础研究,因为, 她解释说, “你永远不知道接下来会发生什么,在另一个有机体的系统中变得有用,或者成为癌症或再生生物学重大突破的基础. 我们是否有可能在其他地方重现蟋蟀的可塑性?"

“这就是我们想要达到的目标,”格雷伯附和霍希说. “最终, 无论是了解一种疾病, 寻找治疗方法, 理解发展过程——我们要做的是在分子水平上了解玩家是什么以及他们是如何变化的."

MDIBL
Mount Desert Island生物实验室在过去几年里都邀请十大电子游艺的学生在春假期间到它的设施进行教员领导的研究项目. 今年,这是不可能的.

与MDIBL合作

从21世纪初开始, MDIBL和十大电子游艺一直是联邦政府资助的教育和研究机构网络的一部分 在缅因州进行生物医学研究和培训. 2019年,该组织——IDeA生物医学研究卓越网络(INBRE)——得到了提升 当时美国国立卫生研究院(National Institutes of Health)授予它1800万美元,用于在未来5年继续在该州创造研究和培训机会.

自2003年以来,霍奇曾多次带她的学生去MDIBL的Bar Harbor实验室——每次都是在春假期间. 她的学生通常会在海边的实验室里呆上10天, 通常是她的板球研究项目. 今年, 因为COVID, 这些时间被分散在整个学期的课程中, 发生在校园里, 尽管远程. 幸运的是,生物信息学——因为它是基于计算机的——很容易适用于在线课堂. 

在一个典型的年份, MDIBL为学生提供许多基于实验室的遗传学和分子生物学培训. 在过去的两年里, 它还在为缅因州学生提供的课程清单中增加了一个转录组分析讲习班, 科学家们, 和教育工作者.

“我们有很多不同的人在研究这个共同的问题”,试图在不同的动物身上制造转录组. “测序已经变得非常便宜和容易, 但我们有专门处理海鲈鱼的人, 蠼螋, 龙虾, 或蟋蟀, 因此,为了让人们在一起工作,这个研讨会应运而生, 在一起交谈, 共享资源和努力,格雷伯说.

他教授的生物信息学技能只会在生物学中变得更加重要, 当然, 但在许多其他领域也是如此. “我们的世界是数据密集的,而且只会越来越密集, 因此,培养处理大型数据集的技能和心态是一项关键技能,他说. 

“最近,我与一些神经科学博士候选人和研究人员进行了交谈, 我问的其中一个问题是‘哪些技能是你在大学里没有得到但你希望自己拥有的?’很多人说要熟练掌握计算机编程, 特别是随着技术的进步, 你必须要跟上科技的发展.——露西·奥沙利文23年

十大电子游艺的高性能计算

手持电脑

这些图片显示高性能计算(HPC)机架安置在 FirstLight 在前海军基地. 这些计算机通过专用光纤线与十大电子游艺大学的中心校区相连. 

生物信息学是一个快速发展的领域. “不断有更多的信息流出,”霍奇说. 去年夏天,蟋蟀的基因组公开了——这是一个重要的里程碑. 目前还存在五个转录组(两个来自Horch的实验室). “但它们都是零零碎碎的,”霍希说,“由不同的群体分别制作."

霍奇想让她的学生取下这些转录组, 这些“数据罐”,并将它们构建成一个统一的转录组,为“板球研究界的每个人提供更完整、更充分的资源”." 

但是要做到这一点, 她的课程需要一台高性能的计算机以逻辑的方式将大量的信息组合在一起. “这就是MDIBL拥有的生物信息学知识的帮助之处, 帮助我们思考如何将这些长序列分割成一小段一小段,从而形成一个整体. 我们自己肯定做不到,”霍奇说.

Dj美林
Dj美林负责监督Bowdoin公司的高性能计算集群.

这就是十大电子游艺的高性能计算的用武之地. “学生们会告诉它去运行这些庞大的工作, 做困难和计算复杂的事情, 耗费时间的, 和资源, 他们可以通过他们的小笔记本电脑上的命令行来完成,霍希说. 

十大电子游艺早在12年前就开始投资高性能计算, 最初是为了支持化学系的教员研究, 生物学, 和物理. 从那时起, 计算机的容量, 他们住在附近前海军基地的设施里, 是否随着需求的增加和技术的改进而增长. “我们在处理能力和内存方面取得了相当大的飞跃,”Merrill说.

即使十大电子游艺的科学家们越来越依赖高性能计算, 非自然科学领域的教师,如数字和计算研究, 环境研究, 经济学, 和政府已经更频繁地利用十大电子游艺的计算能力.

就在过去的三四年里, 越来越多的学生也开始使用HPC进行独立研究和课堂项目. 帮助学生连接到HPC, 美林建立了一个更直观的网络界面, 十大电子游艺也开始支持朱庇特, 一个免费的, 一个具有图形界面的开源网络工具,可以促进高性能计算程序.

“学生们可以用笔记本电脑进入Jupyterhub, 运行R, Python, 或者任何他们想要使用的环境, 他们的项目将在后端运行在高性能计算上,美林表示. “这带来了很多机会, 我们每个学期都有多个课程使用Jupyterhub的web界面并运行HPC作业."

在美林的支持下, 以及MDIBL的支持, 霍希的学生将在短短几周内完成他们的板球转录组. 然后他们将进入第二阶段,即注释和管理资源. 与此同时, 他们将在“潮湿实验室”工作,在那里,当蟋蟀的听觉器官完好无损时,他们将试图确定哪些基因被表达了——以及表达了多少, 在对照动物中, 当它受伤的时候.

霍奇说:“能雄心勃勃地完成这个故事是件很棒的事。. “他们会选择一个基因来关注, 解剖组织,测量该基因,看看它是否像我们预测的那样上调或下调. 这两条线会很好地结合在一起——生物信息学和湿实验室研究——所以学生们可以看到你如何建立这个资源,以及你如何在实验中使用它."