Pytorch中的数据集划分&正则化方法(数据训练)

1.训练集&验证集&测试集

训练集：训练数据

验证集：验证不同算法（比如利用网格搜索对超参数进行调整等），检验哪种更有效

测试集：正确评估分类器的性能

正常流程：验证集会记录每个时间戳的参数，在加载test数据前会加载那个最好的参数，再来评估。比方说训练完6000个epoch后，发现在第3520个epoch的validation表现最好，测试时会加载第3520个epoch的参数。

import  torch
import  torch.nn as nn
import  torch.nn.functional as F
import  torch.optim as optim
from torchvision import datasets, transforms
#超参数
batch_size=200
learning_rate=0.01
epochs=10
#获取训练数据
train_db = datasets.MNIST('../data', train=True, download=True,#train=True则得到的是训练集
 transform=transforms.Compose([  #transform进行数据预处理
  transforms.ToTensor(),#转成Tensor类型的数据
  transforms.Normalize((0.1307,), (0.3081,)) #进行数据标准化(减去均值除以方差)
 ]))
#DataLoader把训练数据分成多个小组，此函数每次抛出一组数据。直至把所有的数据都抛出。就是做一个数据的初始化
train_loader = torch.utils.data.DataLoader(train_db, batch_size=batch_size, shuffle=True)
#获取测试数据
test_db = datasets.MNIST('../data', train=False,
 transform=transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.1307,), (0.3081,))
 ]))
test_loader = torch.utils.data.DataLoader(test_db, batch_size=batch_size, shuffle=True)
#将训练集拆分成训练集和验证集
print('train:', len(train_db), 'test:', len(test_db))  #train: 60000 test: 10000
train_db, val_db = torch.utils.data.random_split(train_db, [50000, 10000])
print('db1:', len(train_db), 'db2:', len(val_db))#db1: 50000 db2: 10000
train_loader = torch.utils.data.DataLoader(train_db, batch_size=batch_size, shuffle=True)
val_loader = torch.utils.data.DataLoader(val_db, batch_size=batch_size, shuffle=True)
class MLP(nn.Module):
 def __init__(self):
  super(MLP, self).__init__()
  self.model = nn.Sequential(#定义网络的每一层,
nn.Linear(784, 200),
nn.ReLU(inplace=True),
nn.Linear(200, 200),
nn.ReLU(inplace=True),
nn.Linear(200, 10),
nn.ReLU(inplace=True),
  )
 def forward(self, x):
  x = self.model(x)
  return x
net = MLP()
#定义sgd优化器,指明优化参数、学习率，net.parameters()得到这个类所定义的网络的参数[[w1,b1,w2,b2,...]
optimizer = optim.SGD(net.parameters(), lr=learning_rate)
criteon = nn.CrossEntropyLoss()
for epoch in range(epochs):
 for batch_idx, (data, target) in enumerate(train_loader):
  data = data.view(-1, 28*28) #将二维的图片数据摊平[样本数,784]
  logits = net(data) #前向传播
  loss = criteon(logits, target) #nn.CrossEntropyLoss()自带Softmax
  optimizer.zero_grad() #梯度信息清空
  loss.backward() #反向传播获取梯度
  optimizer.step()#优化器更新
  if batch_idx % 100 == 0: #每100个batch输出一次信息
print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
 epoch, batch_idx * len(data), len(train_loader.dataset),
  100. * batch_idx / len(train_loader), loss.item()))
 #验证集用来检测训练是否过拟合
 val_loss = 0
 correct = 0
 for data, target in val_loader:
  data = data.view(-1, 28 * 28)
  logits = net(data)
  val_loss += criteon(logits, target).item()
  pred = logits.data.max(dim=1)[1]
  correct += pred.eq(target.data).sum()
 val_loss /= len(val_loader.dataset)
 print('\nVAL set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
  val_loss, correct, len(val_loader.dataset),
  100. * correct / len(val_loader.dataset)))
#测试集用来评估
test_loss = 0
correct = 0 #correct记录正确分类的样本数
for data, target in test_loader:
 data = data.view(-1, 28 * 28)
 logits = net(data)
 test_loss += criteon(logits, target).item()  #其实就是criteon(logits, target)的值，标量
 pred = logits.data.max(dim=1)[1] #也可以写成pred=logits.argmax(dim=1)
 correct += pred.eq(target.data).sum()
test_loss /= len(test_loader.dataset)
print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
 test_loss, correct, len(test_loader.dataset),
 100. * correct / len(test_loader.dataset)))

2.正则化

正则化可以解决过拟合问题。

2.1L2范数（更常用）

在定义优化器的时候设定weigth_decay，即L2范数前面的λ参数。

optimizer = torch.optim.SGD(net.parameters(), lr=learning_rate, weight_decay=0.01)

2.2L1范数

Pytorch没有直接可以调用的方法，实现如下：

3.动量（Momentum）

Adam优化器内置了momentum，SGD需要手动设置。

optimizer = torch.optim.SGD(model.parameters(), args=lr, momentum=args.momentum, weight_decay=args.weight_decay)

4.学习率衰减

torch.optim.lr_scheduler 中提供了基于多种epoch数目调整学习率的方法。

4.1torch.optim.lr_scheduler.ReduceLROnPlateau：基于测量指标对学习率进行动态的下降

torch.optim.lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', factor=0.1, patience=10, verbose=False, threshold=0.0001, threshold_mode='rel', cooldown=0, min_lr=0, eps=1e-08)

训练过程中，optimizer会把learning rate 交给scheduler管理，当指标（比如loss）连续patience次数还没有改进时，需要降低学习率，factor为每次下降的比例。

scheduler.step(loss_val)每调用一次就会监听一次loss_val。

4.2torch.optim.lr_scheduler.StepLR：基于epoch

torch.optim.lr_scheduler.StepLR(optimizer, step_size, gamma=0.1, last_epoch=-1)

当epoch每过stop_size时，学习率都变为初始学习率的gamma倍。

5.提前停止（防止overfitting）

基于经验值。

6.Dropout随机失活

遍历每一层，设置消除神经网络中的节点概率，得到精简后的一个样本。

torch.nn.Dropout(p=dropout_prob)

p表示的示的是删除节点数的比例（Tip：tensorflow中keep_prob表示保留节点数的比例，不要混淆）

测试阶段无需使用dropout，所以在train之前执行net_dropped.train()相当于启用dropout，测试之前执行net_dropped.eval()相当于不启用dropout。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持本站。

美国服务器租用

动态拨号：关键词排名下降是啥缘故，快速提高排名怎样做

排名优化：网站排名优化方法有什么，如何做有效果

老域名：怎样才算老域名，老域名建站有什么影响

内容优化：关键字排名要做哪些方面的优化，怎样做

技巧：网站转化率究竟是什么，有什么提升的技巧

一下吧：外贸站优化有哪些基本的做法和注意事项

概要：竞价推广费用大概要多少呢，竞价推广好不好

一下吧：SEO中site是什么意思，作用和应用是怎样的

邮箱：付费邮箱有哪些优势，付费邮箱挑选要考虑什么

集群是什么意思：集群是什么意思，都有哪些优势呢

服务器配置数据库配置服务器运维服务器安全
互联网资讯服务器公司 IDC数据中心
免费服务器香港服务器租用美国服务器租用

公司动态

产品资讯

行业资讯

Pytorch中的数据集划分&正则化方法

1.训练集&验证集&测试集

2.正则化

2.1L2范数（更常用）

2.2L1范数

3.动量（Momentum）

4.学习率衰减

4.1torch.optim.lr_scheduler.ReduceLROnPlateau：基于测量指标对学习率进行动态的下降

4.2torch.optim.lr_scheduler.StepLR：基于epoch

5.提前停止（防止overfitting）

6.Dropout随机失活

怎么删除云服务器

让文件路径提取变得更简单的Python Path库

实时开通

免备案

全天候客户服务

专属顾问服务