NVIDIA Tesla P100为高效能运算应用挹注超过3



  • NVIDIA Tesla P100为高效能运算应用挹注超过30倍的效能

    NVIDIA Tesla P100为高效能运算应用挹注超过3

    Pascal架构打造的Tesla P100大幅跃升资料中心处理量

    NVIDIA (辉达)今天针对 PCIe 介面的伺服器推出NVIDIA® Tesla® P100 GPU加速器以因应各界对现今资料中心前所未有的运算需求,其效能与价值均远远超越仅搭载CPU的系统。

    美国国家科学基金会 (National Science Foundation) 报告指出,超级电脑运算资源需求超越以往,极大比例的科学家反应利用超级电脑运算进行研究计画1的时间不敷使用。此外,各种高效能运算 (HPC) 技术越来越需要执行各种密集运算的深度学习应用,而许多研究人员正运用各类人工智慧技术以驱动各个传统科学领域的进展。

    Tesla P100 GPU 加速器 PCIe 版藉由 NVIDIA Pascal™ GPU 架构发挥无与伦比的效能与效率,成功满足这些运算要求。此外,用户得以建构出「超级节点」,其吞吐量甚至超越 32 部仅搭载 CPU 的市售节点,并能降低资金与营运成本达70%2。

    NVIDIA 公司加速运算部门副总裁Ian Buck表示:「想要跟上研究人员对 HPC 与 AI 超级运算效能永无止境的渴求,唯一的途径就是加速运算技术。若部署仅搭载 CPU 的系统来满足这方面的需求必须动用数量可观的市售型运算节点,这将耗费大幅攀升的成本但效能提升幅度却不成比例。运用数量较少但效能强大的Tesla P100 节点不仅能大幅扩充效能,用户所投入的的资金绝大部分都是花在运算资源上,而不是虚掷在庞大的基础建设上。」

    Tesla P100 PCIe 版推出标準 PCIe 板卡规格,能相容于现今透过 GPU 加速的伺服器。全新产品经过优化设计,能运行各种运算最密集的人工智慧与 HPC 资料中心应用。单台搭载 Tesla P100 的伺服器在执行 AMBER 分子动力学模拟程式时,达到的效能甚至超越 50 个仅搭载 CPU 的伺服器节点,而在执行 VASP 材料科学程式时,速度亦超越 32 个仅搭载CPU的节点4。

    位于瑞士卢加诺的瑞士国家超级运算中心的欧洲现今最快超级电脑 Piz Daint将于今年稍后进行升级,换装的新核心正是 PCIe 介面的 Tesla P100 加速器。

    苏黎士联邦理工学院运算物理系教授,同时也是瑞士国家超级运算中心主任的 Thomas Schulthess 表示:「Tesla P100 加速器将效能与效率提升至全新境界,成功克服当代许多最重要的运算挑战。Piz Daint 超级电脑升级成 4,500 个 GPU 加速器节点至 Tesla P100 GPU 后,整部系统效能将加倍,将协助研究人员在宇宙学、材料科学、地震学、以及气象等领域获得众多研究突破。」

    NVIDIA Tesla P100为高效能运算应用挹注超过3

    Tesla P100 PCIe 版是 NVIDIA Tesla 加速运算平台的最新成员,其主要特色包含:

    为混合 HPC 运算作业发挥前所未有的应用效能:双精度与单精度尖峰效能分别达到 4.7 teraflops 与 9.3 teraflops,光是一个 Pascal 架构的 Tesla P100 节点,其运算效能就足以媲美超过 32 部仅搭载 CPU 的市售伺服器。CoWoS 封装的 HBM2 记忆体发挥前所未有的效率:Tesla P100 将处理器与资料元件嵌入在一个封包内以发挥前所未有的运算效率。创新的记忆体设计CoWoS (chip on wafer on substrate) 结合 HBM2 记忆体,使记忆体频宽效能比NVIDIA Maxwell™ 架构高出3倍,达到每秒720GB。 Page Migration Engine 简化平行运算程式开发流程:程式开发者能专心进行调校工作,以提升运作效能,减少在资料搬移所花费的时间,并藉由支援虚拟记忆体分页配置,让程式的定址空间扩展至超越 GPU 实体记忆体容量以外的範围。统合记忆体技术能大幅改进生产力,开发者看到的是整个节点一体化的连续记忆体空间。无与伦比的应用支援能力:拥有 410 个 GPU 加速的应用,在全球十大 HPC 应用排行榜中囊括九个席位,Tesla平台足堪担当全球顶尖HPC运算平台

    Tesla P100 PCIe 版产品规格

    透过 NVIDIA GPU Boost™ 技术,双精度运算效能达到 4.7 teraflops,单精度运算效能达到 9.3 teraflops,半精度运算效能达到 18.7 teraflops支援 PCIe Gen 3 互连技术 (每秒 32GB 的双向传输频宽)藉由 Page Migration Engine 与统合记忆体提升可编程性ECC 校正码机制提高资料的可靠度伺服器优化的目标以达到最高的资料中心吞吐量与可靠度推出两种组态版本:16GB的CoWoS封装HBM2堆叠式记忆体,记忆体频宽达到每秒720GB12GB的CoWoS封装HBM2堆叠式记忆体,记忆体频宽达到每秒540GB

    供应时程

    PCIe 介面系统专属 NVIDIA Tesla P100 GPU 加速器预计在 2016 年第 4 季开始供货,届时将透过NVIDIA 零售商伙伴以及伺服器製造商销售,包括 Cray、戴尔、惠普、IBM 以及 SGI。



    上一篇: 下一篇:



    • 热门文章
    编辑推荐