python读取xls文件的库函数(Python读取txt文件画Loss曲线图---txt文件与xls文件转换)
最近在做目标检测的任务,但是由于自己训练的损失函数不是自己想要的,但是自己的程序在训练的时候每个 E p o c h Epoch E p o c h 都会生成一个模型的损失数值,所以想根据这些数值自己画图。
任务1:根据 t x t txt t x t 文件内的数值,生成损失曲线。
t x t txt t x t 文件内的数据样例如下图所示:
因为我的模型训练了150次,所以这样的数据有150个, 且只有一列 。直接在代码里详细叙述:
#导入必须的包
import matplotlib.pyplot as plt
import numpy as np
#----------- 打开txt文件 ----------
file = open('YOLOV4.txt')
#----------- 逐行读取文件内的数据 ------------
data = file.readlines()
#----------- 根据自己的需要查看data的内容 ---------
#print(data)
'''
txt文件的数值为y轴的数据
所以x要根据y的个数有序生成
'''
#------ x轴数据有序生成150个(根据自己的横坐标范围自己修改范围) ----
x = np.arange(0,150)
#---------- 新建一个空的列表,用于存储上一步逐行读取的data ------------
y = []
#---------- 用循环的方式添加进列表 -----------
for num in data:
#------split用于将每一行数据用逗号分割成多个对象-----
#------取分割后的第0列,转换成float格式后添加到列表中-------
y.append(float(num.split(',')[0]))
#--------------- 输出图 ----------------------
#--------- 可以理解为在图上加载x和y的数据 label为关于x和y曲线的标签------------
pic = plt.plot(x,y,label='Yolov4')
#--------- x轴的小标题 -------------
plt.xlabel('Epoch')
#--------- y轴的小标题 -------------
plt.ylabel('Loss')
#--------- 整个图的标题 ----------
plt.title('yolov4-loss')
plt.legend()
plt.show()
代码关于画图的每个细节写的很详细,下面生成的折线图。
任务2- 将.txt文件转换成.xls(excel)文件
需要的同学直接复制代码,代码中注释了你需要修改的地方。
import xlwt
def txt_xls(filename, xlsname):
try:
f = open(filename, 'r', encoding='utf-8')
xls = xlwt.Workbook()
sheet = xls.add_sheet('sheet1', cell_overwrite_ok=True)
x = 0
while True:
# 按行循环,读取文本文件
line = f.readline()
if not line:
break
for i in range(len(line.split('\t'))):
item = line.split('\t')[i]
sheet.write(x, i, item)
x = 1
f.close()
# 保存xls文件
xls.save(xlsname)
except:
raise
'''
下面的地址中就是自己根据自己的需要修改的地方
为什么看上去没有路径呢?因为我是把txt文件和运行的此程序放在了同一个文件夹中
所以生成的.xls文件也在同级文件下,也就是他们在同一个文件夹中
如果你没放在一起,建议使用E://Path//...
'''
if __name__ == "__main__":
#---------- 需要转化的.txt文件 -----------
filename = "YOLOV4.txt"
#---------- 转换后的.xls文件名 -----------
xlsname = "YOLOV4.xls" # 保存及命名
txt_xls(filename, xlsname)
将 . x l s .xls . x l s 文件转换成 . t x t .txt . t x t 文件。
python
import pandas as pd
#---------- 如果你的.xls文件开了多个窗口文件(sheet1,sheet2,sheet3....)使用下面的代码 -----------
#df = pd.read_excel('YOLOV4.xls', sheet_name='Sheet1',header=None)
#---------- 如果你的.xls文件没有开多个窗口(没有sheet1,sheet2,sheet3....)试用下面的代码
data = pd.read_excel('YOLOV4.xls', sheet_name='Sheet1',header=None)
print('正在读取将.xls文件内容')
#---------- 写入txt文件,seq表示逗号分隔 --------------
data.to_csv('YOLOV4.txt', header=None, sep=',', index=False)
print('.xls文件转换成.txt文件成功')
该任务算是任务一的进阶版,通过文件数据的转换,我的 . t x t .txt . t x t 文件的内容不再是一列,而是两列,第一列为序号,第二列为数值,基于此种情况,读取 . t x t .txt . t x t 文件,将其以折线图(曲线图)表示出来。
下图是我现在 . t x t .txt . t x t 数据的图例。
可以发现和任务一数据唯一不同就是多了一列的序列号,下面的是基于任务一改进的,就是改了几行,修改后的内容以注释的形式保存。话不多说直接代码中详细介绍:
#导入必须的包
import matplotlib.pyplot as plt
import numpy as np
#----------- 打开txt文件 ----------
file = open('file2.txt')
#----------- 逐行读取文件内的数据 ------------
data = file.readlines()
#----------- 根据自己的需要查看data的内容 ---------
#print(data)
'''
txt文件的数值为y轴的数据
所以x要根据y的个数有序生成
'''
#------ x轴数据有序生成150个(根据自己的横坐标范围自己修改范围) ----
#x = np.arange(0,150)
#---------- 新建一个空的列表,用于存储上一步逐行读取的data ------------
x = []
y = []
#---------- 用循环的方式添加进列表 -----------
for num in data:
#------split用于将每一行数据用逗号分割成多个对象-----
#------x读取data数据的第一列(也就是序列号)
x.append(float(num.split(',')[0]))
#------取分割后的第0列,转换成float格式后添加到列表中-------
#------y读取data数据的第二列(也就是数值)
y.append(float(num.split(',')[1]))
#--------------- 输出图 ----------------------
#--------- 可以理解为在图上加载x和y的数据 label为关于x和y曲线的标签------------
pic = plt.plot(x,y,label='Yolov4')
#--------- x轴的小标题 -------------
plt.xlabel('Epoch')
#--------- y轴的小标题 -------------
plt.ylabel('Loss')
#--------- 整个图的标题 ----------
plt.title('yolov4-loss')
plt.legend()
plt.show()
下面是得到的折线图(曲线图),和任务一得到的一模一样。
总结:
- 如果你的数据是 . t x t .txt . t x t 文件,数据只有一列,那么任务一就可以解决你的问题
- 如果你有 . x l s .xls . x l s 格式的文件,你可以通过任务三将其转换成 . t x t .txt . t x t 文件,然后通过任务一或者四解决你的问题
- 如果你将 . t x t .txt . t x t 文件转换成 . x l s .xls . x l s 文件,任务二可以解决你的问题
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com