13個算法工程師必須掌握的PyTorch Tricks

2021-01-11 酷扯兒

本文轉載自【微信公眾號:機器學習算法與Python精研 ,ID:AITop100】,經微信公眾號授權轉載,如需轉載原文作者聯繫

目錄

1、指定GPU編號

2、查看模型每層輸出詳情

3、梯度裁剪

4、擴展單張圖片維度

5、one hot編碼

6、防止驗證模型時爆顯存

7、學習率衰減

8、凍結某些層的參數

9、對不同層使用不同學習率

10、模型相關操作

11、Pytorch內置one hot函數

12、網絡參數初始化

13、加載內置預訓練模型

1、指定GPU編號

設置當前使用的GPU設備僅為0號設備,設備名稱為 /gpu:0:os.environ["CUDA_VISIBLE_DEVICES"] = "0"設置當前使用的GPU設備為0,1號兩個設備,名稱依次為 /gpu:0、/gpu:1:os.environ["CUDA_VISIBLE_DEVICES"] = "0,1" ,根據順序表示優先使用0號設備,然後使用1號設備。指定GPU的命令需要放在和神經網絡相關的一系列操作的前面。

2、查看模型每層輸出詳情

Keras有一個簡潔的API來查看模型的每一層輸出尺寸,這在調試網絡時非常有用。現在在PyTorch中也可以實現這個功能。

使用很簡單,如下用法:

from torchsummary import summary

summary(your_model, input_size=(channels, H, W))

input_size

是根據你自己的網絡模型的輸入尺寸進行設置。

3、梯度裁剪(Gradient Clipping)

import torch.nn as nn

outputs = model(data)

loss= loss_fn(outputs, target)

optimizer.zero_grad()

loss.backward()

nn.utils.clip_grad_norm_(model.parameters(), max_norm=20, norm_type=2)

optimizer.step()

nn.utils.clip_grad_norm_

的參數:

parameters – 一個基於變量的迭代器,會進行梯度歸一化max_norm – 梯度的最大範數norm_type – 規定範數的類型,默認為L2@不橢的橢圓 提出:梯度裁剪在某些任務上會額外消耗大量的計算時間,可移步評論區查看詳情。

4、擴展單張圖片維度

因為在訓練時的數據維度一般都是 (batch_size, c, h, w),而在測試時只輸入一張圖片,所以需要擴展維度,擴展維度有多個方法:

import cv2

import torch

image = cv2.imread(img_path)

image = torch.tensor(image)

print(image.size())

img = image.view(1, *image.size())

print(img.size())

# output:

# torch.Size([h, w, c])

# torch.Size([1, h, w, c])

import cv2

import numpy as np

image = cv2.imread(img_path)

print(image.shape)

img = image[np.newaxis, :, :, :]

print(img.shape)

# output:

# (h, w, c)

# (1, h, w, c)

或(感謝 @coldleaf 的補充)

import cv2

import torch

image = cv2.imread(img_path)

image = torch.tensor(image)

print(image.size())

img = image.unsqueeze(dim=0)

print(img.size())

img = img.squeeze(dim=0)

print(img.size())

# output:

# torch.Size([(h, w, c)])

# torch.Size([1, h, w, c])

# torch.Size([h, w, c])

tensor.unsqueeze(dim)

:擴展維度,dim指定擴展哪個維度。

tensor.squeeze(dim)

:去除dim指定的且size為1的維度,維度大於1時,squeeze()不起作用,不指定dim時,去除所有size為1的維度。

5、獨熱編碼

在PyTorch中使用交叉熵損失函數的時候會自動把label轉化成onehot,所以不用手動轉化,而使用MSE需要手動轉化成onehot編碼。

import torch

class_num = 8

batch_size = 4

def one_hot(label):

"""

將一維列錶轉換為獨熱編碼

"""

label = label.resize_(batch_size, 1)

m_zeros = torch.zeros(batch_size, class_num)

# 從 value 中取值,然後根據 dim 和 index 給相應位置賦值

onehot = m_zeros.scatter_(1, label, 1) # (dim,index,value)

return onehot.numpy() # Tensor -> Numpy

label = torch.LongTensor(batch_size).random_() % class_num # 對隨機數取餘

print(one_hot(label))

# output:

[[0. 0. 0. 1. 0. 0. 0. 0.]

[0. 0. 0. 0. 1. 0. 0. 0.]

[0. 0. 1. 0. 0. 0. 0. 0.]

[0. 1. 0. 0. 0. 0. 0. 0.]]

註:第11條有更簡單的方法。

6、防止驗證模型時爆顯存

驗證模型時不需要求導,即不需要梯度計算,關閉autograd,可以提高速度,節約內存。如果不關閉可能會爆顯存。

with torch.no_grad():

# 使用model進行預測的代碼

pass

感謝@zhaz 的提醒,我把 torch.cuda.empty_cache() 的使用原因更新一下。

這是原回答:

Pytorch 訓練時無用的臨時變量可能會越來越多,導致 out of memory,可以使用下面語句來清理這些不需要的變量。

官網 上的解釋為:

Releases all unoccupied cached memory currently held by the caching allocator so that those can be used in other GPU application and visible innvidia-smi. torch.cuda.empty_cache()

意思就是PyTorch的緩存分配器會事先分配一些固定的顯存,即使實際上tensors並沒有使用完這些顯存,這些顯存也不能被其他應用使用。這個分配過程由第一次CUDA內存訪問觸發的。

torch.cuda.empty_cache()

的作用就是釋放緩存分配器當前持有的且未佔用的緩存顯存,以便這些顯存可以被其他GPU應用程式中使用,並且通過

nvidia-smi

命令可見。注意使用此命令不會釋放tensors佔用的顯存。

對於不用的數據變量,Pytorch 可以自動進行回收從而釋放相應的顯存。

更詳細的優化可以查看 優化顯存使用 和 顯存利用問題。

7、學習率衰減

import torch.optim as optim

from torch.optim import lr_scheduler

# 訓練前的初始化

optimizer = optim.Adam(net.parameters(), lr=0.001)

scheduler = lr_scheduler.StepLR(optimizer, 10, 0.1) # # 每過10個epoch,學習率乘以0.1

# 訓練過程中

for n in n_epoch:

scheduler.step()

...

可以隨時查看學習率的值:

optimizer.param_groups[0]['lr']

還有其他學習率更新的方式:

1、自定義更新公式:

scheduler = lr_scheduler.LambdaLR(optimizer, lr_lambda=lambda epoch:1/(epoch+1))

2、不依賴epoch更新學習率:

lr_scheduler.ReduceLROnPlateau()

提供了基於訓練中某些測量值使學習率動態下降的方法,它的參數說明到處都可以查到。

提醒一點就是參數 mode='min' 還是'max',取決於優化的的損失還是準確率,即使用

scheduler.step(loss)

還是

scheduler.step(acc)

8、凍結某些層的參數

參考:https://www.zhihu.com/question/311095447/answer/589307812

在加載預訓練模型的時候,我們有時想凍結前面幾層,使其參數在訓練過程中不發生變化。

我們需要先知道每一層的名字,通過如下代碼列印:

net = Network() # 獲取自定義網絡結構

for name, value in net.named_parameters():

print('name: {0}, grad: {1}'.format(name, value.requires_grad))

假設前幾層信息如下:

name: cnn.VGG_16.convolution1_1.weight, grad: True

name: cnn.VGG_16.convolution1_1.bias, grad: True

name: cnn.VGG_16.convolution1_2.weight, grad: True

name: cnn.VGG_16.convolution1_2.bias, grad: True

name: cnn.VGG_16.convolution2_1.weight, grad: True

name: cnn.VGG_16.convolution2_1.bias, grad: True

name: cnn.VGG_16.convolution2_2.weight, grad: True

name: cnn.VGG_16.convolution2_2.bias, grad: True

後面的True表示該層的參數可訓練,然後我們定義一個要凍結的層的列表:

no_grad = [

'cnn.VGG_16.convolution1_1.weight',

'cnn.VGG_16.convolution1_1.bias',

'cnn.VGG_16.convolution1_2.weight',

'cnn.VGG_16.convolution1_2.bias'

]

凍結方法如下:

net = Net.CTPN() # 獲取網絡結構

for name, value in net.named_parameters():

if name in no_grad:

value.requires_grad = False

else:

value.requires_grad = True

凍結後我們再列印每層的信息

name: cnn.VGG_16.convolution1_1.weight, grad: False

name: cnn.VGG_16.convolution1_1.bias, grad: False

name: cnn.VGG_16.convolution1_2.weight, grad: False

name: cnn.VGG_16.convolution1_2.bias, grad: False

name: cnn.VGG_16.convolution2_1.weight, grad: True

name: cnn.VGG_16.convolution2_1.bias, grad: True

name: cnn.VGG_16.convolution2_2.weight, grad: True

name: cnn.VGG_16.convolution2_2.bias, grad: True

可以看到前兩層的weight和bias的requires_grad都為False,表示它們不可訓練。

最後在定義優化器時,只對requires_grad為True的層的參數進行更新。

optimizer = optim.Adam(filter(lambda p: p.requires_grad, net.parameters()), lr=0.01)

9、對不同層使用不同學習率

我們對模型的不同層使用不同的學習率。

還是使用這個模型作為例子:

net = Network() # 獲取自定義網絡結構

for name, value in net.named_parameters():

print('name: {}'.format(name))

# 輸出:

# name: cnn.VGG_16.convolution1_1.weight

# name: cnn.VGG_16.convolution1_1.bias

# name: cnn.VGG_16.convolution1_2.weight

# name: cnn.VGG_16.convolution1_2.bias

# name: cnn.VGG_16.convolution2_1.weight

# name: cnn.VGG_16.convolution2_1.bias

# name: cnn.VGG_16.convolution2_2.weight

# name: cnn.VGG_16.convolution2_2.bias

對 convolution1 和 convolution2 設置不同的學習率,首先將它們分開,即放到不同的列表裡:

conv1_params = []

conv2_params = []

for name, parms in net.named_parameters():

if "convolution1" in name:

conv1_params += [parms]

else:

conv2_params += [parms]

# 然後在優化器中進行如下操作:

optimizer = optim.Adam(

[

{"params": conv1_params, 'lr': 0.01},

{"params": conv2_params, 'lr': 0.001},

],

weight_decay=1e-3,

)

我們將模型劃分為兩部分,存放到一個列表裡,每部分就對應上面的一個字典,在字典裡設置不同的學習率。當這兩部分有相同的其他參數時,就將該參數放到列表外面作為全局參數,如上面的`weight_decay`。

也可以在列表外設置一個全局學習率,當各部分字典裡設置了局部學習率時,就使用該學習率,否則就使用列表外的全局學習率。

10、模型相關操作

這個內容比較多,我寫成了一篇文章:https://zhuanlan.zhihu.com/p/73893187

11、Pytorch內置one_hot函數

感謝@yangyangyang 補充:Pytorch 1.1後,one_hot可以直接用

torch.nn.functional.one_hot

然後我將Pytorch升級到1.2版本,試用了下 one_hot 函數,確實很方便。

具體用法如下:

import torch.nn.functional as F

import torch

tensor = torch.arange(0, 5) % 3 # tensor([0, 1, 2, 0, 1])

one_hot = F.one_hot(tensor)

# 輸出:

# tensor([[1, 0, 0],

# [0, 1, 0],

# [0, 0, 1],

# [1, 0, 0],

# [0, 1, 0]])

F.one_hot

會自己檢測不同類別個數,生成對應獨熱編碼。我們也可以自己指定類別數:

tensor = torch.arange(0, 5) % 3 # tensor([0, 1, 2, 0, 1])

one_hot = F.one_hot(tensor, num_classes=5)

# 輸出:

# tensor([[1, 0, 0, 0, 0],

# [0, 1, 0, 0, 0],

# [0, 0, 1, 0, 0],

# [1, 0, 0, 0, 0],

# [0, 1, 0, 0, 0]])

升級 Pytorch (cpu版本)的命令:

conda install pytorch torchvision -c pytorch

(希望Pytorch升級不會影響項目代碼)

12、網絡參數初始化

神經網絡的初始化是訓練流程的重要基礎環節,會對模型的性能、收斂性、收斂速度等產生重要的影響。

以下介紹兩種常用的初始化操作。

(1) 使用pytorch內置的torch.nn.init方法。

常用的初始化操作,例如正態分布、均勻分布、xavier初始化、kaiming初始化等都已經實現,可以直接使用。具體詳見PyTorch 中 torch.nn.init 中文文檔。

init.xavier_uniform(net1[0].weight)

(2) 對於一些更加靈活的初始化方法,可以藉助numpy。

對於自定義的初始化方法,有時tensor的功能不如numpy強大靈活,故可以藉助numpy實現初始化方法,再轉換到tensor上使用。

for layer in net1.modules():

if isinstance(layer, nn.Linear): # 判斷是否是線性層

param_shape = layer.weight.shape

layer.weight.data = torch.from_numpy(np.random.normal(0, 0.5, size=param_shape))

# 定義為均值為 0,方差為 0.5 的正態分布

13、加載內置預訓練模型

torchvision.models

模塊的子模塊中包含以下模型:

AlexNetVGGResNetSqueezeNetDenseNet導入這些模型的方法為:

import torchvision.models as models

resnet18 = models.resnet18()

alexnet = models.alexnet()

vgg16 = models.vgg16()

有一個很重要的參數為

pretrained

,默認為

False

,表示只導入模型的結構,其中的權重是隨機初始化的。

如果

pretrained

True

,表示導入的是在

ImageNet

數據集上預訓練的模型。

import torchvision.models as models

resnet18 = models.resnet18(pretrained=True)

alexnet = models.alexnet(pretrained=True)

vgg16 = models.vgg16(pretrained=True)

相關焦點

  • 算法工程師路線圖(經驗濃縮,純乾貨!)
    而網際網路公司的算法工程師崗位中這個算法則是機器學習算法,說的通俗點,就是人工智慧領域中的算法,它是關於如何讓機器自動學習和挖掘數據中的規律,並使用算法和模型對未來進行預測。目前來說這也是網際網路行業中最熱門的一個崗位,開出的薪酬也普遍高於開發崗。今天我就來分享下算法工程師的學習路徑,並推薦一些我認為特別有價值的學習資料和學習方法。
  • 圖像算法工程師必備:灰度直方圖
    圖像的灰度直方圖,大概是數字圖像處理專業課接觸到的第一節講圖像具體算法的一堂課了。所謂的灰度直方圖,就是統計一個8比特的灰度圖像,其灰度等級從0到255的像素的分布情況。圖像算法方向的研究生在研一的課程學習中大多可以用C語言等編成語言寫出最簡單的灰度直方圖的代碼來,因為這實在是太簡單了,不過是for循環和if else的區區二三十行代碼,但更複雜的算法,像圖像拼接、融合等,他們都是用的opencv等圖像庫,雖然後來又出現了tensorflow和pytorch等深度學習框架,但在國內也不過是調參數,雖然調參數也不是簡單的事,但畢竟還是調參數
  • PyTorch 1.7發布,支持CUDA 11、Windows分布式訓練
    PyTorch 1.7 部分新特性,詳情參見 https://github.com/pytorch/pytorch/releases/tag/v1.7.0。參考連結:https://pytorch.org/blog/pytorch-1.7-released/https://github.com/pytorch/pytorch/releases/tag/v1.7.0https://www.reddit.com/r/MachineLearning
  • JAVA必須掌握的數據結構和算法
    貝爾曼-福特算法(略)貝爾曼-福特(Bellman-Ford)算法是一種在圖中求解最短路徑問題的算法狄克斯特拉算法(略)A*算法(略)安全算法:深度搜索和廣度搜索(必學)最短路徑算法:Floyd,Dijkstra(必學)最小生成樹算法:Prim,Kruskal(必學)實際常用算法:關鍵路徑、拓撲排序(原理與應用)二分圖匹配:配對、匈牙利算法(原理與應用)拓展:中心性算法、社區發現算法(原理與應用)
  • 語音識別開源工具PyTorch-Kaldi:兼顧Kaldi效率與PyTorch靈活性
    它包含 4 個組成部分:信號處理和特徵提取、聲學模型、語言模型和解碼搜索。聲學模型是其中的核心部分,我們可以把它理解為說話聲音和語言發音之間的映射。而信號處理和特徵提取就是用於構建聲學模型的材料了,它主要依靠數位訊號處理相關的技術。語言模型則可以被看作是語言先驗知識。語音識別的最終結果就是在聲學模型得分和語言模型得分上進行搜索得到的。具體的內容這裡不做展開。
  • PyTorch官方出品了一本深度學習書,免費提供給開發者
    根據出版商Manning出版社的介紹,這本書的核心,是教你如何使用Python 和 PyTorch 實現深度學習算法。所以出版商介紹稱,想要更好的消化這本書,需要對Python知識和基本線性代數有了解,對深度學習有一些理解更好,但並不需要你具備使用PyTorch或其他深度學習框架的經驗。
  • 初學AI神經網絡應該選擇Keras或是Pytorch框架?
    Powerful,是深度學習入門的絕佳技術路線舉個tensorflow1.0的例子(偽代碼)定義Variable、constant、placeholder等。 初始化global_variables_initializersession回話狀態。
  • 用Java實現目標檢測|PyTorch
    這篇來自AWS軟體工程師的投稿,結合實例,詳細介紹了DJL這個為Java開發者設計的深度學習庫:5分鐘,你就能在PyTorch上,用Java實現目標檢測。5分鐘,用Java實現目標檢測文 / 知乎用戶@LankingPyTorch在深度學習領域中的應用日趨廣泛,得益於它獨到的設計。無論是數據的並行處理還是動態計算圖,一切都為Python做出了很多簡化。
  • 圖靈獎得主力推:PyTorch 1.3 今天發布
    PyTorch 1.3 項目地址:https://github.com/pytorch/pytorch/releases/tag/v1.3.0茁壯成長的 PyTorch由於 PyTorch 一直致力於滿足研究者的需求,因此它在不斷地進行版本迭代,現在已經成為開源社區僅次於 TensorFlow 的深度學習框架。
  • 用Java實現目標檢測 | PyTorch
    這篇來自AWS軟體工程師的投稿,結合實例,詳細介紹了DJL這個為Java開發者設計的深度學習庫:5分鐘,你就能在PyTorch上,用Java實現目標檢測。5分鐘,用Java實現目標檢測文 / 知乎用戶@LankingPyTorch在深度學習領域中的應用日趨廣泛,得益於它獨到的設計。
  • 重磅| Torch7團隊開源PyTorch:Python優先的深度學習框架
    官網:http://pytorch.orgGitHub:https://github.com/pytorch/pytorchPyTorch 是一個 Python 軟體包,其提供了兩種高層面的功能:使用強大的 GPU 加速的 Tensor 計算(類似 numpy)構建於基於 tape 的 autograd 系統的深度神經網絡如有需要,你也可以復用你最喜歡的
  • 算法工程師和數據科學家處理大規模的交易數據
    這一次,終於可以搭建一個三個多月的長期服務,來幫助新入門的開發者更快學習自動駕駛。人工智慧並不是計算機科學的延伸,但藉助人工智慧來讓機器達到真正的自主性,是前沿技術探索的目標。基於深度學習的自動駕駛方法,不僅能改善開發人員在交通中的控制,同時也能解決路況複雜情況下的駕駛難題。
  • PyTorch框架歷史和特性更迭與安裝過程
    在使用GPU(CUDA)運行環境的情況下,可以通過運行命令conda install pytorch torchvision cudatoolkit=10.0-c pytorch來安裝PyTorch和相關的依賴包。如果僅僅使用CPU來運行深度學習模型,可以通過運行命令conda install pytorch torchvision-c pytorch來安裝PyTorch和相關的依賴包。
  • 新版PyTorch 1.2 已發布:功能更多、兼容更全、操作更快!
    (https://pytorch.org/docs/stable/jit.html)而現在,我們很高興地宣布我們已經成功開發了四個新版本,包括 PyTorch 1.2,torchvision 0.4,torchaudio 0.3 和 torchtext 0.4。
  • 雲計算學習:用PyTorch實現一個簡單的分類器
    所以我總結了一下自己當初學習的路線,準備繼續深入鞏固自己的 pytorch 基礎;另一方面,也想從頭整理一個教程,從沒有接觸過 pytorch 開始,到完成一些最新論文裡面的工作。以自己的學習筆記整理為主線,大家可以針對參考。第一篇筆記,我們先完成一個簡單的分類器。
  • 還不會使用PyTorch框架進行深度學習的小夥伴,看過來
    深度學習是機器學習的一個子領域,其算法受到了人類大腦工作機制的啟發。這些算法被稱為人工神經網絡。這樣的神經網絡包括用於圖像分類的卷積神經網絡、人工神經網絡和循環神經網絡。與 TensorFlow 等其它在運行模型之前必須先定義整個計算圖的庫不同,PyTorch 允許動態定義圖。2. PyTorch 也非常適合深度學習研究,提供了最大的靈活性和運行速度。PyTorch TensorsPytorch 張量PyTorch 張量與 NumPy 數組非常相似,而且它們可以在 GPU 上運行。
  • 加快Python算法的四個方法(一)PyTorch
    CDA數據分析師 出品相信大家在做一些算法經常會被龐大的數據量所造成的超多計算量需要的時間而折磨的痛苦不已,接下來我們圍繞四個方法來幫助大家加快一下Python的計算時間,減少大家在算法上的等待時間。下面為大家講述有關PyTorch的內容。
  • 員工竊取前東家算法,還拿到 PyTorch 開源?Facebook 被 MIT 教授起訴
    不到 6 個月後,2019 年 12 月,Facebook 向世界宣布並開源了一個編譯器,可以通過調查揭示,這其中包括了和神經魔法相同的專有算法。Facebook 甚至還在發行公告裡向茲拉特斯基表示感謝:「團隊認可並高度讚賞茲拉特斯基對稀疏內核和統一代碼緩存的貢獻。」
  • Pytorch 中文文檔和中文教程
    簡單介紹GitHub項目管理:https://github.com/apachecn/pytorch-doc-zhPytorch 版本地址:https://pytorch.apachecn.org項目所翻譯的Pytorch版本
  • 菜鳥入門:射頻工程師必須掌握的「工作語言」
    本文引用地址:http://www.eepw.com.cn/article/201710/366006.htm  要想進行全面的生產測試並提高測試產能,測試工程師們必須要理解射頻基本原理,清楚測試的內容,並懂得選用最適合 的儀器完成這些測試工作。問題是,大多數從事低頻應用(工作頻率在1MHz以下)的工程師不太熟悉高頻的應用特點。