nvidia Tesla K80 24G
日期:2017-05-23 11:17:38 / 人氣: 3156
Tesla K80的參數(shù)
Tesla K80 雙GPU 加速器可透過一卡雙 GPU 提供雙倍傳輸量,內(nèi)置24GB GDDR5 存儲器,每顆 GPU 有 12GB 存儲器,比上代Tesla K40 GPU 提供多兩倍存儲器處理更大的資料集分析。Tesla K80 內(nèi)建4,992 CUDA 平行運算核心,可比僅用CPU 運算提升高達10 倍應用加速效能,加上采用動態(tài)NVIDIA GPU Boost 技術,可根據(jù)個別應用靈活提升GPU 時脈,而且更透過動態(tài)平行運算架構,讓用戶可快速分析關聯(lián)式和動態(tài)的資料結構。
英偉達 NVIDIA Tesla K80 24GB GPU加速運算卡
最高實際性能
實際應用性能高于純浮點性能 (Raw Flops)。 計算專業(yè)人士依賴舉足輕重的應用來加速探索與深入了解。 這一平臺從全球最快的加速器開始,現(xiàn)已包含可靠的基礎架構、監(jiān)控和管理基礎架構的能力以及在需要時快速移動數(shù)據(jù)的能力。 NVIDIA Tesla 加速計算平臺可提供所有這些特性,在科學、分析、工程、消費級以及企業(yè)應用中帶來前所未有的性能。
全球最快的 GPU 加速器
- Tesla K80 GPU 加速器上的雙精度性能高達 2.91 TFlops,單精度性能高達 8.74 TFlops
- 利用 NVIDIA® GPUBoost™ 技術時每一款應用的最高性能
- 大容量板載內(nèi)存可提升大型數(shù)據(jù)集的性能 (Tesla K80 GPU 加速器為 24 GB)
- 極高的內(nèi)存帶寬可提升吞吐量以便在需要時確保數(shù)據(jù)可用 (Tesla K80 GPU 加速器為 480 GB/s)
- 糾錯碼(ECC)為內(nèi)部GPU內(nèi)存提供了強大的數(shù)據(jù)可靠性并為外部GDDR5內(nèi)存提供了ECC保護盒動態(tài)頁面引退機制。
用于服務器的 TESLA K40 與 K80 GPU 加速器
利用 NVIDIA® Tesla® GPU 加速器為你最苛刻的數(shù)據(jù)分析與科學計算應用加速。 Tesla GPU 基于 NVIDIA Kepler™ 架構,旨在提供更快、更高效的計算性能。
從能源勘探到機器學習,數(shù)據(jù)科學家利用 Tesla 加速器可以輕松處理多達拍字節(jié) (Petabytes) 的數(shù)據(jù),而且速度比使用 CPU 時快 10 倍。 對計算科學家來說,Tesla 加速器可提供所需的處理動力,能夠以前所未有的速度運行更大型的模擬。
CPU: 12 cores, E5-2697v2 @ 2.70GHz. 64GB System Memory, CentOS 6.2. GPU: Single Tesla K80, Boost enabled or Single Tesla K40, Boost Enabled
SELECT THE TESLA GPU THAT'S RIGHT FOR YOU
Tesla K80 GPU 加速器
Tesla K80 GPU 是一款雙 GPU 卡,它把帶寬超高的 24 GB 內(nèi)存和高達 2.91 TFlops 的雙精度性能與 NVIDIA GPUBoost™ 結合到了一起,它是專為最苛刻的計算任務而設計的。 它十分適合那些不但需要一流計算性能而且還要求數(shù)據(jù)吞吐量大的單精度和雙精度計算 馬上免費試用Tesla K80加速器.
Tesla K40 GPU 加速器
Tesla K40 加速器配有 12 GB 內(nèi)存,可提供 1.43 TFlops 的雙精度性能。 Tesla K40 加速器是一款用于高性能計算與數(shù)據(jù)分析的靈活解決方案,它能夠毫不費力地運行高性能計算與數(shù)據(jù)分析應用。
選擇合適的 TESLA GPU
特性 | Tesla K801 | Tesla K40 |
GPU | 2 顆 Kepler GK210 | 1 Kepler GK110B |
峰值雙精度浮點性能 |
2.91 Tflops (GPU 動態(tài)提速頻率) 1.87 Tflops (基礎頻率) |
1.66 Tflops (GPU 動態(tài)提速頻率) 1.43 Tflops (基礎頻率) |
峰值單精度浮點性能 |
8.74 Tflops (GPU 動態(tài)提速頻率) 5.6 Tflops (基礎頻率) |
5 Tflops (GPU 動態(tài)提速頻率) 4.29 Tflops (基礎頻率) |
存儲器帶寬 (ECC關閉)2 | 480 GB/s (每顆 GPU 240 GB/s) | 288 GB/sec |
存儲器容量 (GDDR5) | 24 GB (每顆 GPU 12GB) | 12 GB |
CUDA 核心數(shù)量 | 4992 個 (每顆 GPU 2496個) | 2880 |
1 所示的 Tesla K80 的規(guī)格參數(shù)是兩顆 GPU 的總和。
2 在啟用 ECC 的情況下,6.25%的 GPU 內(nèi)存用于 ECC 數(shù)據(jù)位。 例如,在啟用 ECC 的情況下,如果內(nèi)存總容量為 6 GB,那么用戶可用內(nèi)存容量為 5.25 GB。
Tesla 軟件功能
NVIDIA® Tesla® GPU計算產(chǎn)品專為工作站以及數(shù)據(jù)中心的高性能計算而設計。 有許多 CUDA 軟件特性都是專為 GPGPU 而設計的,而且只有 Tesla 產(chǎn)品才支持這些特性。 下表對此進行了總結。
軟件應用程序
|
描述 | 支持 Matrix | 下載 | ||||||||||||||||||
Windows 的高性能驅(qū)動程序: TCC 驅(qū) 動程序
|
|
|
|
||||||||||||||||||
GPU 監(jiān)控: nvsmi
|
|
|
|
||||||||||||||||||
GPU 集群管理
|
|
|
|
||||||||||||||||||
NVIDIA GPUDirect™ v1.0
|
|
|
下載
|
||||||||||||||||||
NVIDIA GPUDirect™ v2.0
|
|
|
|
注: CUDA 注冊開發(fā)者 現(xiàn)在可以下載 CUDA 4.1 候選版本。
針對 WINDOWS 的 TCC 驅(qū)動程序
TCC (Tesla 計算機集群)驅(qū)動程序是一種用于 CUDA C/C++ 的 Windows 驅(qū)動程序,該驅(qū)動程序可實現(xiàn)遠程桌面、服務并能夠在 Windows 上減少 CUDA 內(nèi)核啟動的系統(tǒng)總開銷。 請注意,TCC 驅(qū)動程序可禁用 Tesla 產(chǎn)品上的圖形功能。
GPU 監(jiān)控
針對 Tesl a的 GPU 監(jiān)控軟件可以利用 nvsmi 工具來獲得。 該工具目前能夠給出 GPU 溫度、風扇轉(zhuǎn)速以及 ECC 信息。 隨著我們新增更多的 GPU 監(jiān)控特性,nvsmi 將不斷發(fā)展。
GPU 集群管理
NVIDIA® 與多家集群管理軟件供應商均保持著合作關系,這些供應商支持基于GPU 的系統(tǒng):
– | Bright Computing |
– | ClusterCorp Rocks |
– | Platform Computing |
除了這些以外,CUDA 驅(qū)動程序還支持兩種重要的特性:
– | 排他模式: 只讓特定應用程序訪問某一 GPU |
– | GPU 可視設備: 通過控制應用程序能夠使用哪些 GPU,從而讓集群管理軟件能夠管理 GPU 資源。 |
NVIDIA® GPUDIRECT™
通過消除不必要的 CPU 處理時間,NVIDIA GPUDirect 技術讓 GPU 能夠與 PCIe 總線上的其它設備更快地通信。 GPUDirect v1.0 讓第三方設備驅(qū)動程序 (例如用于 InfiniBand 適配器的驅(qū)動程序) 能夠直接與 CUDA 驅(qū)動程序通信,消除了在 CPU 上復制數(shù)據(jù)所需的處理時間。 GPUDirect v2.0 讓同一系統(tǒng)中的多個 GPU 之間能夠?qū)崿F(xiàn)點對點 (P2P) 通信,避免了額外的 CPU 處理時間。