前面我介绍了可视化的一些方法以及机器学习在预测方面的应用,分为分类问题(预测值是离散型)和回归问题(预测值是连续型)(具体见之前的文章)。
从本期开始,我将做一个关于图像识别的系列文章,让读者慢慢理解python进行图像识别的过程、原理和方法,每一篇文章从实现功能、实现代码、实现效果三个方面进行展示。
实现功能:
实现按比例随机抽取图像移动到另一文件夹。
实现代码:
import os, random, shutil #======从文件夹中按比例随机选取图片移动到另一个文件夹======= def moveFile_rate(fileDir): pathDir = os.listdir(fileDir) print(pathDir) for i in pathDir: filepath=fileDir+i filepathDir=os.listdir(filepath) print(filepathDir) filenumber=len(filepathDir) tarpath=tarDir +i print(tarpath) if not os.path.exists(tarpath): os.makedirs(tarDir +i) rate=0.5 picknumber=int(filenumber*rate) sample = random.sample(filepathDir, picknumber) print(sample) for name in sample: shutil.move(filepath+'\\' +name, tarpath+'\\' +name) return if __name__ == '__main__': fileDir ="D:\电池条带\案例\data\\" tarDir = 'D:\电池条带\案例\dataset\\train\\' moveFile_rate(fileDir)
实现效果:
原文件夹目录下图像文件:
控制台输出:
目标文件下转移后文件:
本人读研期间发表5篇SCI数据挖掘相关论文,现在在某研究院从事数据挖掘相关工作,对数据挖掘有一定的认知和理解,会不定期分享一些关于python机器学习、深度学习、数据挖掘基础知识与案例。致力于只做原创,以最简单的方式让你理解和学习它们,关注V数据杂坛与我一起交流成长。