图形工作站、集群应用方案
  • 网站首页
  • 商城
  • 产品
  • 行业计算
  • 科学工程计算
  • 化学&生物
  • 图形设计
  • 图像处理
  • 视景仿真
  • 人工智能
  • 影视后期
全球领先的高端图形工作站供应商

免费测试 热线 : 400-7056-800 【 为任何应用提供 最快计算设备 如不符,退货】【最新报价】【选购指南】【京东商城】



企业通用模版网站

  • 科研团队全能超算平台25v1
  • 超高分拼接 数字孪生
  • 科学计算MatLAB工作站24
  • 地质建模 油藏模拟工作站
  • 工业CT扫描 机器视觉计算
  • 电力系统关键应用配置24
  • 网站首页
  • 商城
  • 产品
  • 行业计算
  • 科学工程计算
  • 化学&生物
  • 图形设计
  • 图像处理
  • 视景仿真
  • 人工智能
  • 影视后期
  • 送无人机啦 8核6.4GHz  96核4.8GHz 加速改装 

  • 高性能集群 虚拟并行计算 芯片设计 光学仿真 

  • 蛋白质预测 生物信息 冷冻电镜 材料模拟

  • RSS订阅
  • 理科计算推荐
  • 仿真计算最快最完美25v1
  • 电磁仿真单机与集群25v1
  • 航拍实景建模单机集群
  • 遥感图像处理工作站集群
  • 4K/8K剪辑特效调色24v1
  • AI大模型工作站集群25v1
  • Abaqus硬件配置大全24v3
  • CST电磁仿真工作站25v1
  • 多物理场仿真单机与集群
  • 流体/空气动力学仿真25v1
  • 量子化学 分子动力模拟
  • 三维设计24v2  3D打印

 

您的位置:UltraLAB图形工作站方案网站 > 人工智能 > 深度学习 > 东工大采用GPU构筑超级计算机,单精度性能居世界前列

东工大采用GPU构筑超级计算机,单精度性能居世界前列

时间:2008-12-11 19:05:00   来源:UltraLAB图形工作站方案网站   人气:9627 作者:admin
东京工业大学采用美国NVIDIA的最新图形处理LSI(GPU)构筑了高性能计算机(HPC)系统,并已开始运行。这一消息是在目前正在举行的高性能计算机相关国际会议及展会“Super Computing 2008”上透露的。

  该大学曾于2006年构筑过名为“TSUBAME Grid Cluster(TSUBAME)”的HPC系统,在能够处理长度超过64bit的数字的“双精度”浮点运算中,运算速度达到38.18TFLOPS,在06年6月的HPC排名“TOP500”中位居全球第7位(参阅本站报道)。虽然之后也提高了性能,但很难赶上全球HPC系统迅速实现的高速化,在08年6月公布的TOP500中,运算速度为67.7TFLOPS,排名跌至第24位。

  此次的系统在已有的TSUBAME上,追加了170个NVIDIA公司于08年11月18日刚刚宣布上市的由4台GPU组成的机架用运算单元“Tesla S1070”。“追加工作是在10月中旬花费一周左右的时间完成的。当时认为只要去做就能成功”(东京工业大学学术国际信息中心教授松冈聪)。

  在长度为32bit的单精度运算中,单个Tesla S1070的运算能力最大可达到4.1TFLOPS。170个合计的峰值性能为4.1TFLOPS×170=697TFLOPS。加上现有的TSUBAME的运算能力,整体峰值性能达到910TFLOPS。单从数字来看,只差一点就达到1PFLOPS,可以说是全球最高水平的运算能力。“如果按照单精度来排名的话,可进入全球前10名”(东京工业大学研究人员)。

  但是,TOP500评价必须包括双精度计算。另一方面,NVIDIA公司的GPU从此次才开始正式支持双精度运算,其运算速度大大低于单精度。此次追加系统部分的双精度运算能力的峰值性能为59TFLOPS。

  结果,整个系统的双精度运算的峰值性能仅为170TFLOPS。在求解用于TOP500评价的联立线性方程的程序“Linpack”中,有效性能为77.48TFLOPS,在最新排名中位居第29位,未能实现提升。

  松冈排名未提升的原因归结为以下两点,(1)因突击工程调整不足;(2)Linpack与此次的系统不匹配。松冈表示,“如果仔细调整,Linpack速度也能达到90TFLOPS左右。但在此次的系统中,Linpack是一个会产生轻微不良后果的应用程序。通过下工夫,多数科学计算都可以单精度运算获得出色结果。实际上,可以说此次通过一些提高性能的措施,获得了位居全球前列的高运算能力”。

  另外,NVIDIA公司上市的最新GPU产品方面,用于工作站的产品称为“Tesla C1060”,工作频率为1.296GHz。在此次的Tesla S1070中,虽然采用相同的硬件,但工作频率却达到了1.44GHz,运算性能也稍高。(记者:野泽 哲生)
关闭此页
上一篇:CUDA wins awards at Supercomputing
下一篇:128节点GPU集群超过4000节点CPU集群性能

相关文章

  • 05/09Xeon6代+4块GPU--图灵超算工作站GT450M介绍
  • 05/09汽车风阻测试模拟分析、算法,及服务器/工作站计算设备硬件配置推荐
  • 04/26高频交易(HFT)应用分析、算法,服务器/工作站硬件配置推荐
  • 04/25衍生品定价与风险对冲应用分析、算法,及服务器工作站硬件配置
  • 04/25量化交易策略应用算法分析、服务器工作站硬件配置
  • 04/24金融风险管理应用算法分析、服务器/工作站硬件配置推荐
  • 04/19油藏模拟软件的算法分析以及图形工作站/服务器硬件配置推荐25v2
  • 04/17大型3D设计软件CATIA-算法分析与图形工作站硬件配置
  • 04/17Cadence EDA主要软件计算特点分析,服务器/工作站硬件配置推荐
  • 04/16Synopsys EDA主要软件计算特点分析,服务器/工作站硬件配置推荐

工程技术(工科)专业工作站/服务器硬件配置选型

    左侧广告图2

新闻排行榜

  • 1如何在本地运行 Llama 3 8B 和 Llama 3 70B及硬件配置推荐
  • 2NVIDIA GeForce GTX 280测试报告
  • 3比GTX280快10倍-Quadro VX200专业卡评测
  • 4深度学习训练与推理计算平台硬件配置完美选型2020v1
  • 5高性能仿真计算集群(结构、流体、多物理场耦合)配置推荐2024v1
  • 62019年最快最全深度学习训练硬件配置推荐
  • 7Llama-2 LLM的所有版本和硬件配置要求
  • 8支持7块RTX3090静音级深度学习工作站硬件配置方案2021v2
  • 9HFSS电磁仿真应用与工作站配置方案
  • 10解锁最大推理能力:深入研究80GB A100 GPU 上的Llama2–70B

最新信息

  • 性能直逼6710亿参数DeepSeek R1--- QwQ-32B推理模型本地硬件部署
  • 史上最神的AI静音工作站---算命、炒股、看病、程序设计、销售策划、仿真计算、3D设计、药物设计、基因测序、大数据分析
  • 用中文训练更快-满血版Deepseek R1本地部署服务器/工作站硬件配置精准分析与推荐
  • DeepSeek R1训练和推理一体式服务器/工作站硬件配置、部署具体步骤
  • DeepSeek V3推理和训练一体式服务器/工作站硬件配置、部署具体步骤
  • DeepSeek R1/V3应用-服务器/工作站/集群配置推荐
  • 生成式AI热门应用、算法及对计算机硬件配置要求
  • llama3.2本地系统+软件安装运行、主要应用、计算硬件要求、最新GPU服务器配置参考

应用导航:

工作站产品中心 京东商城 中关村商城 淘宝商城 超高分可视化商城 便携工作站商城 ANSYS CATIA Microsoft INTEL NVIDIA 网站统计

公司简介-业务咨询-招聘英才-资料下载-UM-

本网站所有原创文字和图片内容归西安坤隆计算机科技有限公司版权所有,未经许可不得转载
陕ICP备16019335号 陕公网安备61010302001314号
Copyright © 2008-2023 , All Rights Reserved

首页
热线
商城
分类
联系
顶部