1. 1650顯卡夠用嗎
GTX1650顯卡性能在上一代的GTX1050ti和1060之間,整體能效比又有一定的進步,移動版1650相比桌面版只是頻率有所下降,總體性能幾乎相當,可以說是非常適合筆記本電腦的顯卡,不僅有一定的游戲性能,而且用來繪圖和剪輯視頻也完全沒問題。
GeForce GTX 1650顯卡擁有1024個Shaders單元、32個光柵單元以及85個紋理單元,搭配有4GB容量、128Bit位寬的GDDR5顯存。GPU默認頻率為1395MHz,Boost頻率為1560MHz,Fire Strike的成績大約為6800分左右,Time Spy的成績大約為2500分左右,這樣的性能完全能滿足大部分游戲性能需求。
對於繪圖和剪輯這類專業應用而言,GTX1650因為使用了最新的圖靈架構和cuda計算單元,所以可以在許多支持cuda加速的軟體中獲得更強的性能表現,像常用的PS和PR最新版都可以支持cuda顯卡加速,從而加快我們的工作效率,當然,除了顯卡以外,最好也配備一顆4-6核的主流CPU和不低於16G的內存,這樣才能充分保證繪圖和視頻剪輯時的性能。
2. cuda 計算力查看
原文鏈接: https://www.cnblogs.com/wmr95/articles/8846749.html
序號名稱值解釋
1Detected 1 CUDA Capable device(s)1檢測到1個可用的NVIDIA顯卡設備
2Device 0: "GeForce 930M"GeForce 930M當前顯卡型號為" GeForce 930M "
3CUDA Driver Version / Runtime Version7.5/7.5CUDA驅動版本
4 CUDA Capability Major/Minor version number 5.0CUDA設備支持的計算架構版本,即計算能力,該值越大越好
5 Total amount of global memory 4096MbytesGlobal memory全局存儲器的大小。使用CUDA RUNTIME API調用函數cudaMalloc後,會消耗GPU設備上的存儲空間,合理分配和釋放空間避免程序出現crash
6 (3) Multiprocessors, (128) CUDA Cores/MP 384 CUDA Cores3個流多處理器(即SM),每個多處理器中包含128個流處理器,共384個CUDA核
7GPU Max Clock rate941 MHzGPU最大頻率
8Memory Clock rate900 MHz顯存的頻率
9Memory Bus Width64-bit
10L2 Cache Size1048576 bytes
11Maximum Texture Dimension Size (x, y, z)1D=(65535)
2D=(65535, 65535)
3D=(4096,4096,4096)
12Maximum Layered 1D Texture Size, (num) layers1D=(16384),2048 layers
13Maximum Layered 2D Texture Size, (num) layers2D=(16384,16384), 2048 layers
14 Total amount of constant memory 65535 bytes常量存儲器的大小
15 Total amount of shared memory per block 49152 bytes共享存儲器的大小,共享存儲器速度比全局存儲器快;多處理器上的所有線程塊可以同時共享這些存儲器
16Total number of registers available per block65535
17 Warp Size 32Warp,線程束,是SM運行的最基本單位,一個線程束含有32個線程
18 Maximum number of threads per multiprocessor 2048一個SM中最多有2048個線程,即一個SM中可以有2048/32=64個線程束Warp
19 Maximum number of threads per block 1024一個線程塊最多可用的線程數目
20 Max dimension size of a thread block (x, y, z) (1024,1024,64)ThreadIdx.x<=1024,
ThreadIdx.y<=1024,
ThreadIdx.z<=64
Block內三維中各維度的最大值
21 Max dimension size of a grid size (x, y, z)(2147483647,65535,65535)Grid內三維中各維度的最大值
22Maximum memory Pitch2147483647 bytes顯存訪問時對齊時的pitch的最大值
23Texture alignment512 bytes紋理單元訪問時對其參數的最大值
24Concurrent and kernel executionYes with 1 engine(s)
25Run time limit on kernelsYes
26Integrated GPU sharing Host MemoryNo
27Support host page-locked memory mappingYes
28Alignment requirement for SurfacesYes
29Device has ECC supportDisabled
30其他
3. gtx1650支持深度學習嗎
支持。
GTX 1650基於圖靈架構的小核心12nm TU117,桌面896個流處理器,筆記本1024個流處理器,搭配128-bit 4GB GDDR5顯存,功耗在桌面上60-80W,筆記本上35-50W。
除了繼續精簡流處理器和顯存,並且不支持光線追蹤、DLSS深度學習抗鋸齒(至少目前沒有說會開放),GTX 1650其實還偷偷地在多媒體編碼上縮了水。
卷積運算受計算速度的約束比較大。因此,要衡量GPU運行ResNets等卷積架構的性能,最佳指標就是FLOPs。張量核心可以明顯增加FLOPs。Transformer中用到的大型矩陣乘法介於卷積運算和RNN的小型矩陣乘法之間,16位存儲、張量核心和TFLOPs都對大型矩陣乘法有好處,但它仍需要較大的顯存帶寬。
需要特別注意,如果想藉助張量核心的優勢,一定要用16位的數據和權重,避免使用RTX顯卡進行32位運算!GPU和TPU的標准性能數據,值越高代表性能越好。RTX系列假定用了16位計算,Word RNN數值是指長度<100的段序列的biLSTM性能。