前面我介绍了可视化的一些方法以及机器学习在预测方面的应用,分为分类问题(预测值是离散型)和回归问题(预测值是连续型)(具体见之前的文章)。
从本期开始,我将做一个关于图像识别的系列文章,让读者慢慢理解python进行图像识别的过程、原理和方法,每一篇文章从实现功能、实现代码、实现效果三个方面进行展示。
实现功能:
实现按比例随机抽取图像移动到另一文件夹。
实现代码:
import os, random, shutil
#======从文件夹中按比例随机选取图片移动到另一个文件夹=======
def moveFile_rate(fileDir):
pathDir = os.listdir(fileDir)
print(pathDir)
for i in pathDir:
filepath=fileDir+i
filepathDir=os.listdir(filepath)
print(filepathDir)
filenumber=len(filepathDir)
tarpath=tarDir +i
print(tarpath)
if not os.path.exists(tarpath):
os.makedirs(tarDir +i)
rate=0.5
picknumber=int(filenumber*rate)
sample = random.sample(filepathDir, picknumber)
print(sample)
for name in sample:
shutil.move(filepath+'\\' +name, tarpath+'\\' +name)
return
if __name__ == '__main__':
fileDir ="D:\电池条带\案例\data\\"
tarDir = 'D:\电池条带\案例\dataset\\train\\'
moveFile_rate(fileDir)
实现效果:
原文件夹目录下图像文件:

控制台输出:

目标文件下转移后文件:

本人读研期间发表5篇SCI数据挖掘相关论文,现在在某研究院从事数据挖掘相关工作,对数据挖掘有一定的认知和理解,会不定期分享一些关于python机器学习、深度学习、数据挖掘基础知识与案例。致力于只做原创,以最简单的方式让你理解和学习它们,关注V数据杂坛与我一起交流成长。



















