新聞動態
News
首頁 > 新聞動態 > 產品資訊
返回

NVIDIA 首款深度學習超級計算機:可媲美 250 臺服務器!


2016-4-8


    GTC 2016 首日,NVIDIA 推出了基于全新 Tesla P100 GPU 加速器的 DGX-1 超級計算機,用于滿足人工智能研究的無限計算需求。


2-210Q0095305139.jpg


    NVIDIA DGX-1 是首款專為深度學習量身定制的系統,它具備充分集成的硬件、深度學習軟件以及開發工具,讓開發者能夠快速而輕松地進行開發,其吞吐量相當于 250 臺 x86 服務器!

    NVIDIA DGX-1 深度學習系統讓研究人員和數據科學家能夠輕松利用 GPU 加速計算的強大性能來打造全新級別的智能機器,使得這些機器能夠像人類一樣學習、觀察和感知這個世界。DGX-1 可提供史無前例的強大計算性能來驅動下一代人工智能應用,讓研究人員能夠在更大更復雜的深度神經網絡上大幅縮短訓練耗時。

    NVIDIA 聯合創始人兼首席執行官黃仁勛先生表示:“人工智能是目前為止意義最為深遠的技術進步,它改變了每一個行業、每一家公司,甚至每一件事,并惠及每一個人。數據科學家及人工智能研究人員在以往的高性能解決方案平臺上往往要花費太多的時間,DGX-1 不但易于部署,而且專為一個目的而生,就是釋放超人般的無窮威力,并將這種威力應用到之前未被解決的難題上來。”


2-210Q0095421547.jpg


成就DGX-1,源于五大突破


    NVIDIA DGX-1 基于全新 Tesla P100 GPU 打造,其吞吐量相當于 250 臺基于 CPU 的服務器,這次,我們把如此龐大的吞吐量囊括到了單個機箱之內。

2-210Q0095624S9.jpg


    另外四項突破性的技術包括可最大限度提升應用程序擴展能力的 NVIDIA NVLink,可帶來空前節能特性的 16nm FinFET 制造工藝,可承擔繁重數據負荷的 HBM2 內存以及可為深度學習提供高達 21 Teraflops 以上的峰值性能的指令集。

    這些突破性的技術結合到一起,讓配備 Tesla P100 GPU 的 DGX-1 系統能夠比一年前問世的 NVIDIA Maxwell 架構四路解決方案快 12 倍以上!


2-210Q0095605640.jpg



在人工智能生態系統中廣受追捧


    Facebook 人工智能研究總監 Yann LeCun 指出,NVIDIA GPU 正在加速人工智能的發展進程。隨著神經網絡變得越來越大,我們不僅需要更快的 GPU,更高容量、更快速度的內存,而且需要大幅提升的 GPU 間通信速度以及能夠利用低精度算術的硬件。這些正是 Pascal 所具備的特點。

    百度首席科學家吳恩達表示,人工智能計算機就像航天火箭一樣,越快越好。Pascal 架構的吞吐量和互聯技術將造就出我們所見過的最快的火箭。

    微軟研究院首席語音科學家黃學東表示,微軟正在開發具有 1000 多層的超級深度神經網絡。NVIDIA Tesla P100 的驚人性能將讓微軟 CNTK 能夠加速實現人工智能的巨大突破。


全面的深度學習軟件


    NVIDIA DGX-1 包含一整套優化的深度學習軟件,這些軟件讓研究人員和數據科學家能夠快速而輕松地訓練深度神經網絡。它包括 NVIDIA 深度學習 GPU 訓練系統(DIGITS),這是一款完整的,可交互的系統,可用于設計深度神經網絡(DNN)。它還包括新發布的 NVIDIA CUDA 8 以及深度神經網絡庫(cuDNN)第 5 版。

    DGX-1 還包括多個使用廣泛的深度學習框架的優化版本,如 Caffe、Theano 以及 Torch。此外,DGX-1 還可以訪問云管理工具、軟件更新以及用于容器化應用程序的資源庫。


2-210Q0095R9559.jpg



全新 Tesla P100 GPU 加速器的 DGX-1 超級計算機,用于滿足人工智能研究的無限計算需求。


NVIDIA DGX-1規格如下:


    半精度(FP16)峰值性能最高可達 170 Teraflops

    8 個 Tesla P100 GPU 加速器,每顆 GPU 配備 16GB 內存,支持 ECC

    NVLink Hybrid Mesh Cube

    7TB 固態硬盤,用于深度學習高速緩存

    雙萬兆以太網,四路InfiniBand 100Gb網絡連接

    3U,配備 3200W 電源


DevTop:全球最快的桌邊型深度學習機器


    由容天工程開發團隊為深度學習研發工作開發的 Rt. DevTop 是一個全功能的、可用于加速深度學習研究的平臺。從內存到 I/O 到電源的每個 Rt. DevTop 組件都進行了優化配置,可為最嚴苛的深度學習研究提供最出色的性能。它預裝了數據科學家和研究人員開發深度神經網絡所需的所有軟件。其中包括 DIGITS 軟件包以及最流行的深度學習框架:Caffe、Theano 和 Torch 以及 CUDNN(NVIDIA 加強版 GPU 加速深度學習庫)。

    所有這些都集結在這個高能效、靜默、運行流暢且外形優美的軟件包中,只需要普通的電源插座,低調安置在您的桌下即可。

    對比早期的多 GPU 訓練成果顯示,在關鍵深度學習測試中,使用 Rt. DevTop 訓練 AlexNet 模型只需 13 個小時,而最好的單 GPU PC 也需要超過 2 天,單 CPU 系統更是需要超過 1 個月的時間才能完成。


上一篇:材料科學領域最受歡迎應用!GPU 為 VASP 帶來 8 倍
豆奶视频的下载-豆奶视频app安卓版下载-豆奶视频app