Pytorch dataloader在加载最后一个batch时卡死的解决(梯度权重)

问题：

自己写了个dataloader，为了部署方便，用OpenCV的接口进行数据读取，而没有用PIL，代码大致如下：

 def __getitem__(self, idx):
  sample = self.samples[idx]
 
  img = cv2.imread(sample[0])
  img = cv2.resize(img, tuple(self.input_size))
  img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
  # if not self.val and random.randint(1, 10) < 3:
  #  img = self.img_aug(img)
  img = Image.fromarray(img) 
  img = self.transforms(img)  
  ...

结果在训练过程中，在第1个epoch的最后一个batch时，程序卡死。

解决方案：

可能是因为OpenCV与Pytorch互锁的问题，关闭OpenCV的多线程，问题解决。

cv2.setNumThreads(0)
cv2.ocl.setUseOpenCL(False)

补充：pytorch 中一个batch的训练过程

# 一般情况下
optimizer.zero_grad() # 梯度清零
preds = model(inputs) # inference，前向传播求出预测值
loss = criterion(preds, targets)  # 计算loss
loss.backward() # 反向传播求解梯度
optimizer.step()# 更新权重，更新网络权重参数

此外，反向传播前，如果不进行梯度清零，则可以实现梯度累加，从而一定程度上解决显存受限的问题。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持本站。

美国快速服务器

动态拨号：关键词排名下降是啥缘故，快速提高排名怎样做

排名优化：网站排名优化方法有什么，如何做有效果

老域名：怎样才算老域名，老域名建站有什么影响

内容优化：关键字排名要做哪些方面的优化，怎样做

技巧：网站转化率究竟是什么，有什么提升的技巧

一下吧：外贸站优化有哪些基本的做法和注意事项

概要：竞价推广费用大概要多少呢，竞价推广好不好

一下吧：SEO中site是什么意思，作用和应用是怎样的

邮箱：付费邮箱有哪些优势，付费邮箱挑选要考虑什么