nvidia-smi指令解析


對於一些游戲玩家來說買到好配置的主機,首先一件事就是拿一些跑分軟件來跑個分,如3DMark,國際象棋等。
像我們搞CUDA的喜歡用NVIDIA自帶可視化工具Visual Profiler 來看程序對GPU的應用效率,對於一些已經搭好的框架如tensorflow和caffe等,想到監控的方法就是在訓練或者測試時直接用命令:

nvidia-smi

在終端中打印出GPU的各種屬性。
如下圖是打印的結果:
這里寫圖片描述
第一行Driver Version:384.90表示我用的驅動是384.90
第二行中:
第一行表示GPU序號,名字,Persisitence-M(持續模式狀態),如我中有一個GPU序號為0;名字為GeForce系列的GTX1060;持續模式的狀態,持續模式雖然耗能大,但是在新的GPU應用啟動時,花費的時間更少,這里顯示的是off的狀態。
第一欄Fan:N/A是風扇的轉速,從0到100%之間變動。有的nvidia設備如筆記本,tesla系列不是主動散熱的可能顯示不了轉速
第二欄Temp:溫度,35攝氏度
第三欄Perf:是性能狀態,從P0到P12,P0表示最大性能,P12表示最小性能地
第四欄中Pwr表示能耗,22瓦
第五欄中Bus-Id是表示GPU總線的東西
第六欄中Disp.A是DisPlay Active ,表示GPU是否有初始化
下方的Memory-Usage表示顯存的使用率:共6GB 我已經使用了220MB(當初買電腦時電腦城的人一直把我往3GB顯存的閹割版的1060上拉,說顯存是浮動的,可能顯存浮動只有像英偉達jetson系列的移動嵌入式平台上顯存與內存共享的形式才能做到吧)
第七欄Volatile GPU-Util表示GPU的利用率
第八欄Uncorr.ECC是表示ECC的相關東西,ECC即 Error Correcting Code 錯誤檢查和糾正,在服務器和工作站上的內存中才有的技術
再下面是關於進程的相關GPU使用率,如這邊有三個進程對GPU進行了利用,Xorg,compiz和FireFox和各自調用時顯存的使用量


注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2021 ITdaan.com