產品特性
Pascal 架構帶來巨大的性能飛躍
NVIDIA Pascal 架構使 Tesla P100 能為 HPC 和超大規模工作負載提供卓越性能。憑借每秒超過 21 萬億次的 16 位浮點 (FP16) 運算性能,經過優化的 Pascal 為深度學習應用程序帶來了令人興奮的新可能。Pascal 還可為 HPC 工作負載提供超過 5 萬億次的雙精度浮點運算和 10 萬億次的單精度浮點運算能力。
通過采用 HBM2 的 CoWoS 技術實現更高效率
通過加入采用 HBM2 的晶圓基底芯片 (CoWoS) 技術,Tesla P100 將計算性能和數據緊密集成在同一個程序包內,提供的內存性能是 NVIDIA Maxwell? 架構的三倍以上。這大幅縮短了為數據密集型應用程序算出解決方案的時間。
頁面遷移引擎使編程更簡單
頁面遷移引擎可使開發人員從管理數據移動的工作中騰出時間,將精力更多地放在計算性能的調整上。應用程序現在可以突破 GPU 物理顯存的容量限制,達到幾乎無限量的顯存。
適用于混合型工作負載 HPC 的 NVIDIA Tesla P100
適用于 PCIe 的 Tesla P100 使混合型工作負載 HPC 數據中心能在節省資金的同時大幅提升吞吐量。例如,一個由四個與 PCIe 互聯的 Tesla P100 驅動的 GPU 加速節點,可以替代各種應用程序的多達 32 個通用 CPU 節點。利用數量大幅減少而性能強大的節點完成各種作業,意味著客戶可以節省多達 70% 的整體數據中心成本。
產品參數
產品型號 | P100-PCIe |
CUDA核心數量 | 3584 |
CUDA核心頻率 | 1126MHz |
顯存容量 | 16GB/12GB |
顯存帶寬 | 549GB/s(12GB) |
顯存類型 | HBM2 |
半精度性能(峰值) | 18.7TFLOFPS |
單精計算性能(峰值) | 9.3TFLOFPS |
雙精計算性能(峰值) | 4.7TFLOFPS |
互聯帶寬(雙向) | 32GB/s |
功耗 | 250W |