nn.model是所有網(wǎng)絡(luò)(net)層的父類,我們自己如果要實現(xiàn)層的話,需要繼承該類。
比如:
我們自己實現(xiàn)一個線性層(MyLinear)
class MyLinear(nn.Model):
def __init__(self, input, output):
super(MyLinear, self).__init__()
self.w = nn.Parameters(torch.randn(output, input))
self.b = nn.Parameters(torch.randn(output))
def forward(self, x):
x = x@self.w.t() + self.b
return x
- 對于上面?zhèn)€的代碼,很明顯,我們需要優(yōu)化的參數(shù)是w和b,我們初始化的時候,沒有指定需要梯度信息,這是為什么?
因為,nn.Parameters會自動加上梯度信息,也即是,我們把這梯度信息交給網(wǎng)絡(luò)來管理,這樣,在給優(yōu)化器傳遞參數(shù)的時候,可以直接net.parameters(),就直接可以把所有的參數(shù)收集到了,如果我們自己管理的話,net.parameters()就無法收集到。特別,我們使用nn.Sequential的時候,把我們自己自定義的網(wǎng)絡(luò)加到容器的時候,如果收集不到自己定義的網(wǎng)絡(luò)中的梯度信息的時候,網(wǎng)絡(luò)就沒有辦法優(yōu)化。所以,我們自己定義網(wǎng)絡(luò)的時候,一定要把網(wǎng)絡(luò)中需要優(yōu)化的參數(shù)交給網(wǎng)絡(luò)去管理。
2. def forward(self, x):
x = x@self.w.t() + self.b
return x
這里的x是什么?
我們都知道,網(wǎng)絡(luò)是要堆疊起來的,這里的x是上一層網(wǎng)絡(luò)的輸出
- nn.Sequential是什么,為什么需要?
當我們自己手動定義一個網(wǎng)絡(luò)的時候,舉例來說,我們要處理圖片,我們需要一層卷積,一層池化,再次卷積再次池化的四個操作,我們在init中定義
def __init__(self, input, output):
super(MyLinear, self).__init__()
self.conv1 = ****
self.pool1 = ***
self.conv2 = ****
self.pool2 = ***
我們就需要在
def forward(self, x):
x = x@self.conv1
x = self.pool1(x)
x = x@self.conv2
x = self.pool2(x)
return x
試想一下,如果網(wǎng)絡(luò)層數(shù)很多,我們就需要一一處理,很繁瑣
nn.Model提供了很多類,比如激活函數(shù),卷積操作.......比較方便,拿來就可以用
nn.Model還可以嵌套,nn.Model可以打印出每一層的信息,很方便查看各個層的權(quán)值,這樣我們就可以在訓(xùn)練的時候查看信息,只需要調(diào)用net.named_parameters()就可以了。
- nn.Model的模型的保存操作?
net.save(net.state_dict(),"./ckpt.mdl")
保存操作
net.load_state_dict(torch.load("./ckpt.mdl"))
讀取保存的結(jié)果