顯卡是個人計算機基礎的組成部分之一,將計算機系統需要的顯示信息進行轉換驅動顯示器,并向顯示器提供逐行或隔行掃描信號,控制顯示器的正確顯示,是連接顯示器和個人計算機主板的重要組件,是“人機”的重要設備之一,其內置的并行計算能力現階段也用于深度學習等運算。 內容 最近,我正在考慮將哪種圖形卡用于AI培訓。我不想太麻煩,但我也希望擁有強大的計算能力。 是否堅持使用游戲筆記本,臺式計算機或云計算平臺?我在Internet上檢查了一些信息,并對其進行了整理,以方便將來進行比較和查詢,以及為有需要的朋友提供一些便利。 對于圖形卡的深度學習訓練功能,我們不僅要關注其具有多少CUDA內核,還要關注其頻率,視頻內存,視頻內存位寬等。更客觀的指標是看一下它的單精度性能(FP3 2)性能有多少Tflops。 觸發器的理論峰值: 單精度理論峰值= GPU芯片數* GPU Boost頻率*內核數*單個時鐘周期內可以處理的浮點計算的數量。 單精度理論峰值= FP32內核* GPU Boost Clock * 2。 筆記本圖形卡: 人工智能大咖啡的性能比較: 云服務器顯卡比較: 這是特定云服務器平臺使用的圖形卡參數的比較。 在NVIDIA網站上,您可以看到上述圖形卡仍在許多云平臺中使用。 MX450對抗GTX1650: 網頁給出的索引顯示,超頻MX450的FP32計算能力已超過GTX1650。 GTX1650:128位寬,192GB / s帶寬,896個流處理器,頻率1350?1486MHZ,4G顯存; MX450:64位寬和80GB / s帶寬(支持PCIE 4. 0),896個流處理器,頻率1395?1575MHz,2G視頻內存; 實際上,MX450視頻內存減少了一半。盡管流處理器的數量還不錯,但是圖形卡的位寬減少了一半,而視頻內存的帶寬也減少了一半。在某些情況下仍然存在差距。 新一代移動圖形卡的性能比較: GeForce MX 450:896 * 1. 575GHz * 2 = 2. 8 TFlops GeForce RTX 3060:3840 * 1. 70GHz * 2 = 1 3. 1 TFlops GeForce RTX 3070:5120 * 1. 62GHz * 2 = 1 6. 6 TFlops GeForce RTX 3080:6144 * 1. 71GHz * 2 = 2 1. 0 TFlops RTX30系列臺式機圖形性能比較: GeForce RTX 3060:3584 * 1. 78GHz * 2 = 1 2. 8 TFlops GeForce RTX 3060Ti:4864 * 1. 67GHz * 2 = 1 6. 2 TFlops GeForce RTX 3070:5888 * 1. 73GHz * 2 = 2 0. 4 TFlops GeForce RTX 3080:8704 * 1. 71GHz * 2 = 2 9. 8 TFlops GeForce RTX 3090:10496 * 1. 7GHz * 2 = 3 5. 7 TFlops JD上報價的顯卡基本上沒有貨,因此借用兩張圖片并記錄價格。 許多商店都有商品,但價格相對較高。某商店技嘉/技嘉RTX3080 10G游戲顯卡RTX3080 GAMING OC-10GD Magic Eagle,報價:¥ 1409 9. 00。 每個人都是自由的,坐在長凳上,經常看一下,慢慢地等待,有一天你可以買一個合適的! 摘要: 俗話說,買新的顯卡而不是舊的顯卡。新的架構更加高效,并且具有更多的計算能力。如您所見,MX450已經能夠選出GTX1650。新的RTX30系列移動版本還可以與原始的Daniel Tesla V100和P40競爭。 在選擇時,除了要選擇哪張顯卡外,它還具有多少個獨立的視頻內存,這還取決于顯卡可以運行的最大頻率。一些筆記本電腦會限制頻率以控制散熱問題,而某些游戲制造商將使用臺式機圖形卡來提高性能。這種游戲本的性能更強,但通常體積更大。 從我的角度來看,為了便于攜帶,可以使用全功能的RTX3060和較低頻率的RTX3070。性能沒有太大差異。如果頻率很高,則散熱是個問題,而且體積會更大。對于臺式計算機,RTX3080更好。適當地,RTX3090的性能并沒有增加太多,但是價格卻要高得多。 徐老2021/3 / 17
|
溫馨提示:喜歡本站的話,請收藏一下本站!