超级计算机助力癌症研究项目
癌症研究项目开展至今已有十年了,目的在于通过开发及运用分析大量复杂数据的各种算法,从而深入了解癌症。除了安大略癌症研究所外,这个项目小组的成员还包括来自玛嘉烈医院(Princess Margaret Hospital)、大学健康网络(University Health Network)以及纽约州布法罗的豪普特曼•伍德沃德医学研究所(Hauptman-Woodward Medical Research Institute)的科学家。
该项目的首席科学家Igor Jurisica表示,研制新的治癌疗法需要分析蛋白质之间的相互关系;如果显示在屏幕上,这些蛋白质的相互关系非常像“巨大的黑色毛团”。然后必须运用不同的算法,帮助解释大量数据。
这项研究的另一个方面需要了解蛋白质的结构,那样才能研制出治癌疗法。这就需要形成蛋白质结晶,还要确定形成优质蛋白质结晶的最佳条件。但这种方法带来了一个“严重的信息技术问题,”Jurisica如是说,因为各种蛋白质和条件的组合会导致超过9000万个图像需要分析及解释。
Jurisica说:“所以我们的工作就是运用算法翻阅所有这些图像,并进行分类,以找出试验结果。这时候,我们需要能够处理这种复杂情况的强大计算功能。”
安大略癌症研究所如今使用一台IBM System Cluster 1350超级计算机,该超级计算机采用了DCS9550磁盘存储系统。IBM的深度计算可视化(Deep Computing Visualization)软件生成研究分析所需的高清晰度图像。该系统还包括Linux集群中的1344个处理器核心,运行速度达到了每秒12.5万亿次运算,存储容量高达150TB。
之所以能够部署这套系统,多亏加拿大创新基金会(Canada Foundation for Innovation)和安大略省研究和创新部(Ontario Ministry of Research and Innovation)下拨了专项资金。IBM为硬件、软件和服务提供了实物捐赠。
IBM公司的战略项目主管Chris Pratt认为,与这个研究小组保持的长期关系是一种合作关系,IBM的角色绝不仅仅是提供IT基础设施。Pratt说:“这需要概念设计和范围确定,从而解决设备的供应及配置问题,并确保结果切实可行。”
他补充说:“这可不是一般的Exchange服务器;这是一类非常复杂的问题,需要特定的技能。”
截至去年11月,这个项目已在世界公共网格(World Community Grid)由25万台个人电脑组成的网络上执行了9000万次分析。Jurisica说:“即便拥有如此强大的功能,我们还是要到2014年才能完成项目。”
过去在旧基础设施上需要几个月来处理的计算工作现在只要几天。Jurisica说:“所以这确实是重大变化,时间缩短了一个数量级,现在我们可以迅速进行这些分析。”
IBM热衷研究项目体现了它信奉的这个观点:一个领域里面的创新可以运用到其他领域。Pratt说:“综观各项研究,我们认为研究的专业性非常强,但一个研究领域的发现成果可以带来毫不相干的其他领域领导取得重大进展和突破。”
他表示,图像分析也许最初只与摄像领域有关,与癌症研究领域无关。
Jurisica回忆,在项目的早期阶段,蛋白质结晶过程由研究人员用玻璃吸管手动完成。但超级计算机改变了这种情况,大大提高了这项工作的速度和准确性。
他说:“要不是信息技术,无法解读这些结果,因为机器每秒都在生成大量数据;你必须有足够的存储容量来存储大量数据,并且分析及解读结果。”
“要不是自动化技术,生物技术其实根本无法向前发展。”