一个深度学习项目需要什么
创始人
2025-05-29 08:04:18
0

DataLoader

1.数据预处理

在将数据提供给模型之前,DataLoader需要对数据进行预处理。预处理可以包括数据增强、归一化、裁剪、缩放等操作。这些操作可以提高模型的性能和准确度。在处理点云数据时,可以通过最远点下采样到固定的点数。

2.读取标签文件

我 1 2 3

爱 45 6

python

matrix_file = open("D:\py_code\w123.txt", 'r', encoding='utf-8')  # 打开文件
lines = matrix_file.readlines()  # 读取文件中的所有行
print(lines)
print(len(lines))结果:
['我 1 2 3\n', '爱 45 6\n', 'python']
3

3.数据集的划分

生成数据集的训练集、测试集和全部数据集的文件列表并保存为txt文件,训练集的比例可以自行设置

4.加载数据类

MyDataset(Dataset)类包含__init__(),__len__(),__getitem__()等函数

Dataset:父类,所有开发人员训练、测试使用的所有数据集的一个模板或者抽象,该类是一个抽象类,所有的数据集想要在数据与标签之间建立映射,都需要继承这个类,所有的子类都需要重写__getitem__方法,该方法根据索引值获取每一个数据并且获取其对应的Label,子类也可以重写__len__方法,返回数据集的size大小

MyDataset:子类,是一个具体的数据集,继承父类的所有方法和属性

如何重写Dataset?

【深度学习】PyTorch Dataset类的使用与实例分析 - 知乎 (zhihu.com)

在明确如何组装路径、获取路径中的文件名以及获取具体数据对象后,重写方法

__init()存储数据目录下的所有文件名

__len__获取数据集的长度

__getitem__()返回的是数据项并非整个数据集,可以让索引与数据集中的具体数据对应起来

from torch.utils.data import Datasetclass MyDataset(Dataset):def __init__(self):#一个函数中的变量是不能拿到另外一个函数中使用的,self可以当做类中的全局变量print("1")def __len__(self):print("2")def __getitem__(self,idx):print("3")
dataset = MyDataset()#会自动调用__init__方法结果:
1

5.创建数据加载器

data = MyDataset()#实例化
DataLoader = torch.utils.data.DataLoader(data, batch_size=64, shuffle=True)

将样本按照batch_size(每个批次包含的样本数量)进行分批,并在每个epoch(所有样本被遍历一遍)开始时随机打乱数据

Train

  1. def parse_args()

参数包含batch_size/model/epoch/learning_rate/gpu/optimizier/data_path/result_savepath/check_savepath/log_dir/decay_rate等

  1. def valid(model,loader)

在验证集上测试网络模型的性能,返回精度

3.def main(args)

设置在哪个gpu上跑

创建目录

设置日志文件,记录训练过程中的一些信息

加载训练和测试数据

加载模型

修改学习率(6条消息) 【深度学习】学习率 (learning rate)_深度学习的学习速率_JNingWei的博客-CSDN博客

训练:每一个epoch训练一次

使用验证集验证:验证集专门用来看看每经过1个epoch的训练之后网络性能如何,可以用测试集代替验证集(7条消息) 测试集可用作验证集;验证集不能来自训练集!(交叉验证,留一法)_验证集可以当测试集吗_doubleslow;的博客-CSDN博客

Test

  1. def parse_args()

参数包含batch_size/model/gpu/data_path/save_path/pth_path等

2.def main(args)

创建数据保存目录

加载测试数据

加载模型:训练得到的最优模型

相关内容

热门资讯

和治友德|国医大师张大宁教授谈... 什么是健康 什么是健康 四位一体综合医学模式 什么是养生 饮食养生 行为养生 ...
端午节,不会包粽子的试试红枣大... 端午节的空气里飘着粽叶香,朋友圈开始刷屏“手工粽子大赛”——李姐晒出四角玲珑的蛋黄肉粽,邻居王婶端出...
对话伊力特:70年辉煌,新疆第... 稳中求进,彰显伊力特作为具备红色基因的兵团企业,在承担新疆第一白酒国企担当的同时,积极拥抱市场,在传...
酒鬼酒如何在至暗时刻寻找光? 近日,酒鬼酒线上召开2024年度报告业绩说明会,在白酒行业调整的大背景下,酒鬼酒的一举一动都备受关注...
河南濮阳:粽香四溢 口味多样满... 端午将至,河南濮阳各大商超迎来节前消费高峰,粽子专柜前人头攒动。除了经典口味粽子依旧备受消费者青睐,...
炸肉丸子,切记不要放面粉!教你... 炸肉丸子最忌讳的就是加面粉!老一辈传下来的这个方子坑了多少人,炸出来不是硬得像乒乓球,就是吸油吸成"...
58岁高考钉子户梁实考前发声:... 时间好快!又到高考了。这次我还是会参加,只是对结果不敢报太大期望。去年10月开始筹略火锅,火锅对我是...
“烤鸭配酸奶”火出圈!圣祥乳业... 5月29日至31日,由北京市奶业协会主办的第六届北京牛奶文化节在北京中关村移动智能服务创新园(上地?...
书讯 |《杯水之情》熹茗关于东... 从一家店到拥有477家连锁门店、服务200万茶客的行业标杆,熹茗用“一杯茶”重新定义了中国茶馆的价值...
快速出汤!10 分钟煮好鲜香紫... 忙碌的工作日晚餐、没胃口的慵懒午后,一碗热气腾腾、鲜掉眉毛的紫菜蛋花汤总能瞬间治愈身心。无需复杂食材...
新老口味齐上阵 今年端午节粽子... 中国商报(记者 贺阳)随着端午节临近,粽子作为标志性美食再次成为市场关注的焦点。5月30日,记者从多...
【二分查找】 二分查找704. 二分查找35. 搜索插入位置34. 在排序数组中查找元素的第一个和最后一个位置结语...
2025上海快递物流展:展览内... 快递物流业作为国民经济发展的重要行业,正不断朝着智能化、自动化和数字化方向大步迈进。而即将到来的 2...
缤纷泡鲁达,云南饮品文化的璀璨... 在彩云之南这片热情似火又浪漫至极的土地上,每一处角落都藏着令人心醉神迷的美好,而泡鲁达,无疑是其中最...
锦州新世界酒店璀璨启幕 山海巍... 锦州新世界酒店于渤海湾畔盛大启幕,千年辽西走廊的文脉与当代轻奢美学在此交汇。以「半边山,半边海;半城...
【STM32】STM32内存映... 一、内存映射 1、内存映射图 下图是 STM32F103xCDE 型号的内存映射图。 2、内存划分...
温州市政府驻杭招商引智办领导一... 2025年4月18日,温州市政府驻杭招商引智办领导一行莅临杭州市温州商会考察指导并参与座谈。温州市驻...
「业务架构」TOGAF建模之业... 组织分解图描述了组织树中参与者、角色和位置之间的链接。组织图应该提供组织中所有者和决策者的指挥链。虽...