由Fermi世代的CUDA架構挹注威力的繪圖處理器 相較於採用最新四核心CPU的純CPU系統,能以二十分之一的功耗和十分之一的成本提供叢集效能。 448個CUDA核心 在每一顆GPU中傳輸高達 515 Gigaflops 的雙精密度最高效能,讓每一台獨立工作站可提供超越 1 Teraflop的效能。每一顆繪圖處理器的單精密度最高效能可達 1 Teraflop。 錯誤修正檢查碼(ECC) 的記憶模組支援 符合工作站的運算精確性和信賴度的嚴格要求。提供記憶體的資料防護,強化應用所需資料的完整度和可靠度。註冊文件、L1/L2快s取、共享記憶體,以及DRAM等接受到ECC保護。 桌上型電腦叢集效能 透過多重繪圖處理器,可比單一工作站中的小型伺服器叢集更快速地解決大量問題。 每一GPU具有高達6GB的GDDR5記憶體容量 透過將龐大資料集保存於直接與繪圖處理器接取的私屬記憶體中,將效能提升至最佳狀態,並減低資料傳輸速度。 NVIDIA平行DataCache™ 加速如物理解答器 (physics solvers)、光線追蹤及稀疏矩陣乘法 (sparse matrix multiplication) 等演算法,其數據位址無法事先得知。這其中包括每塊流式多處理器中的可配置L1快取記憶體,以及所有處理器核心的統一L2快取。 NVIDIA GigaThread™ 引擎 藉由比前一代架構快10倍之更快速的上下文切換、並存核心執行,以及加強的執行緒封鎖排程,進而最大化吞吐率。
異步傳輸 在運算核心忙碌時同時透過PCIe匯流排執行數據傳輸,如此可大幅強化系統效能。即使是像地震處理等需要大量資料傳輸的應用程式,亦可透過在需求出現之前將資料傳輸至私屬記憶體中,將運算效率提升至絕佳狀態。 支援廣泛編程語言和應用程式介面(API)的CUDA編程環境 可選擇C、C++、OpenCL、DirectCompute或Fortran表達應用並行機制,並可利用“Fermi”繪圖處理器的創新架構。NVIDIA平行Nsight工具已針對Microsoft Visual Studio開發者開放。 高速、PCI-Express Gen 2.0 數據傳輸 最大化主系統和Tesla處理器之間的頻寬。讓Tesla系統能和具有開放PCI-E x16插槽、PCIe相容的任一主系統共同實際運作。
3GB GDDR5 6GB GDDR5