KNN 和 SVM 图片分类 任务 代码及细节分享

news2024/12/22 18:26:13

使用KNN (K-最近邻) 方法进行图像分类也是一个常见的选择。以下是

使用sklearnKNeighborsClassifier进行图像分类的Python脚本:

import os
import cv2
import numpy as np
import logging
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, confusion_matrix

# 设置日志
logging.basicConfig(filename='training_log.txt', level=logging.INFO, format='%(asctime)s - %(message)s')

# 读取图像数据和标签
def load_images_from_folder(folder):
    images = []
    labels = []
    label = 0
    for subdir in os.listdir(folder):
        subpath = os.path.join(folder, subdir)
        if os.path.isdir(subpath):
            for filename in os.listdir(subpath):
                if filename.endswith(".jpg"):
                    img_path = os.path.join(subpath, filename)
                    img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)
                    img_normalized = cv2.resize(img, (256, 256))  # 归一化图像大小为256x256
                    images.append(img_normalized.flatten())
                    labels.append(label)
            label += 1
    return images, labels

# 主函数
def main():
    # train_folder = "YOUR_TRAIN_DATASET_FOLDER_PATH"  # 替换为你的训练集文件夹路径
    # test_folder = "YOUR_TEST_DATASET_FOLDER_PATH"    # 替换为你的测试集文件夹路径

    

    logging.info("Loading training data from %s", train_folder)
    X_train, y_train = load_images_from_folder(train_folder)
    logging.info("Loaded %d training samples", len(X_train))

    logging.info("Loading test data from %s", test_folder)
    X_test, y_test = load_images_from_folder(test_folder)
    logging.info("Loaded %d test samples", len(X_test))

    logging.info("Training KNeighborsClassifier...")
    knn = KNeighborsClassifier(n_neighbors=3)  # 使用3个邻居
    knn.fit(X_train, y_train)
    logging.info("Training completed.")

    y_pred = knn.predict(X_test)
    accuracy = accuracy_score(y_test, y_pred)
    logging.info("Test Accuracy: %f", accuracy)

    cm = confusion_matrix(y_test, y_pred)
    cm_normalized = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]
    logging.info("Normalized Confusion Matrix:")
    for row in cm_normalized:
        logging.info(" - ".join(map(lambda x: "{:.2f}".format(x), row)))

if __name__ == "__main__":
    main()

KNeighborsClassifier来进行训练和预测。默认情况下,我设置了n_neighbors=3,这意味着使用3个最近的邻居进行投票。你可以根据需要调整这个参数。

选择合适的n_neighbors值是很重要的。一个较小的值(如1或3)可能会使模型对噪声更敏感,而一个较大的值可能会使模型更加平滑。通常,选择一个奇数的值可以避免在投票中出现平局的情况。

为了确定最佳的n_neighbors值,你可以使用交叉验证来评估不同值的性能,然后选择性能最好的那个值。

对于多类分类问题,选择合适的n_neighbors值是很重要的。以下是一些建议:

  1. 避免平局:为了避免在投票中出现平局的情况,通常建议选择一个奇数的n_neighbors值。但是,由于你有21个类,这个规则不再适用,因为即使是偶数的邻居数也不太可能导致平局。

  2. 默认值KNeighborsClassifier的默认n_neighbors值是5。这是一个常用的起始值,但可能不是最优的。

  3. 根据类别数量:一个常见的策略是选择一个接近总类别数量的n_neighbors值。在你的情况下,你有21个类,所以你可以考虑从这个数字开始,然后向上或向下调整。

  4. 交叉验证:最佳的方法是使用交叉验证来确定最佳的n_neighbors值。这意味着你会尝试多个不同的n_neighbors值,然后选择在验证集上性能最好的那个。

使用支持向量机(SVM)进行图像分类是一个强大的方法。sklearn提供了SVC(支持向量分类)类来实现SVM。

以下是使用sklearnSVC进行图像分类的Python脚本:

import os
import cv2
import numpy as np
import logging
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, confusion_matrix

# 设置日志
logging.basicConfig(filename='training_log_svm.txt', level=logging.INFO, format='%(asctime)s - %(message)s')

# 读取图像数据和标签
def load_images_from_folder(folder):
    images = []
    labels = []
    label = 0
    for subdir in os.listdir(folder):
        subpath = os.path.join(folder, subdir)
        if os.path.isdir(subpath):
            for filename in os.listdir(subpath):
                if filename.endswith(".jpg"):
                    img_path = os.path.join(subpath, filename)
                    img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)
                    img_normalized = cv2.resize(img, (256, 256))  # 归一化图像大小为256x256
                    images.append(img_normalized.flatten())
                    labels.append(label)
            label += 1
    return images, labels

# 主函数
def main():
    # train_folder = "YOUR_TRAIN_DATASET_FOLDER_PATH"  # 替换为你的训练集文件夹路径
    # test_folder = "YOUR_TEST_DATASET_FOLDER_PATH"    # 替换为你的测试集文件夹路径


    


    logging.info("Loading training data from %s", train_folder)
    X_train, y_train = load_images_from_folder(train_folder)
    logging.info("Loaded %d training samples", len(X_train))

    logging.info("Loading test data from %s", test_folder)
    X_test, y_test = load_images_from_folder(test_folder)
    logging.info("Loaded %d test samples", len(X_test))

    logging.info("Training SVM...")
    svm = SVC(kernel='linear', C=1)  # 使用线性核和C=1
    svm.fit(X_train, y_train)
    logging.info("Training completed.")

    y_pred = svm.predict(X_test)
    accuracy = accuracy_score(y_test, y_pred)
    logging.info("Test Accuracy: %f", accuracy)

    cm = confusion_matrix(y_test, y_pred)
    cm_normalized = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]
    logging.info("Normalized Confusion Matrix:")
    for row in cm_normalized:
        logging.info(" - ".join(map(lambda x: "{:.2f}".format(x), row)))

if __name__ == "__main__":
    main()

使用了SVC类来进行训练和预测。我选择了线性核(kernel='linear')和正则化参数C=1(C=1)。这些参数可能需要根据你的数据进行调整。

SVM有许多可调参数,如核函数、C值和其他参数。

科学地调整SVM的参数:

  1. 交叉验证:使用交叉验证是评估不同参数组合性能的关键。例如,你可以使用sklearnGridSearchCV来自动进行参数搜索和交叉验证。

  2. 核函数选择

    • 线性核:当特征数量很大或数据线性可分时使用。
    • RBF核:当数据有非线性边界时使用。它有一个参数gamma需要调整。
    • 多项式核:当数据的边界是多项式形式时使用。它有degreecoef0两个参数需要调整。
    • Sigmoid核:在某些特定的数据集上可能有效,但不常用。
  3. C值:C是SVM的正则化参数。较小的C值会导致较大的间隔,但可能允许一些误分类。较大的C值会尝试最大化训练数据的正确分类,但可能导致过拟合。

  4. gamma值:仅对RBF核和多项式核有效。它定义了单个训练样本的影响范围。较小的值意味着更大的影响范围,较大的值意味着更小的影响范围。

  5. 使用GridSearchCV:这是一个自动化的参数搜索方法,它会尝试所有给定的参数组合,并使用交叉验证来评估每种组合的性能。

from sklearn.model_selection import GridSearchCV
from sklearn.svm import SVC

# 定义参数网格
param_grid = {
    'C': [0.1, 1, 10, 100],
    'gamma': [1, 0.1, 0.01, 0.001],
    'kernel': ['linear', 'rbf', 'poly', 'sigmoid']
}

# 使用GridSearchCV进行参数搜索
grid_search = GridSearchCV(SVC(), param_grid, refit=True, verbose=3, cv=5)
grid_search.fit(X_train, y_train)

# 打印最佳参数
print("Best parameters found: ", grid_search.best_params_)
  1. 考虑数据的规模和分布:如果数据集很大,可能需要使用随机样本或考虑使用LinearSVC,它是专门为大数据集优化的。

  2. 特征缩放:确保所有特征都在相同的尺度上。SVM对特征的尺度非常敏感,所以通常使用StandardScaler来缩放数据。

  3. 评估指标:确保你使用了合适的评估指标来评估模型的性能。例如,对于不平衡的数据集,考虑使用F1分数或AUC-ROC曲线,而不仅仅是准确性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1136550.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

jdbc 中 Statement 不能避免注入式漏洞(SQL注入漏洞)

注入式漏洞 也称为 SQL注入漏洞,是一种常见的应用程序安全漏洞。当应用程序将用户输入的数据直接 拼接 到SQL查询语句中,而未对输入进行有效的过滤和转义时,攻击者可通过构造恶意的输入来执行非法的SQL语句,从而实现对应用程序的攻…

esp32c3-microPython开发固件烧录用户手册

esp32c3-microPython开发固件烧录用户手册1.4 文章目录 esp32c3-microPython开发固件烧录用户手册1.4烧录所需硬件软件工具Thonnyflash_download_tools 插座与USB转TTL模块之间接线esp32-C3版本插座(底板4针) 下载对应的 MicroPython固件烧录MicroPython…

grafana InfluxDB returned error: error reading influxDB 400错误解决

问题: 如图提示错误解决 确认自己的docker容器是否配置了以下3个字段 DOCKER_INFLUXDB_INIT_USERNAMExxx DOCKER_INFLUXDB_INIT_PASSWORDyyy DOCKER_INFLUXDB_INIT_ADMIN_TOKENzzz 如果有,在grafana中需要添加header配置Header: Authorization , Value…

将自己本地项目上传到git,IDEA图文操作

文章目录 一、初始化git仓库二、gitee创建仓库三、输入自己仓库的地址四、在添加所修改的文件可能的错误 五、合并需上传文件六、上传参考文档 一、初始化git仓库 在自己的项目中,命令行中输入 git init二、gitee创建仓库 新建仓库 设置仓库参数,设置…

C语言的const函数修饰指针

文章目录 一、const函数的作用 int a 10; int *p ; p &a;从上面的代码分析,p 存放的就是a的地址, *p 存放的就是 a 的值。 一、const函数的作用 一旦使用了const函数修饰一个变量,那么这个变量就无法变化了。 所以下面三种情况&#…

分享一下在微信小程序里怎么添加会员充值功能

在微信小程序中添加会员充值功能,可以提升用户的消费体验,增加商家的销售收入。下面是一篇关于如何在微信小程序中添加会员充值功能的软文。 标题:微信小程序实现会员充值功能,提升用户忠诚度与销售收入 随着移动支付的普及&…

JavaSE 二叉树

目录 1 树型结构1.1 概念1.2 树的表示形式1.3 树的应用 2 二叉树2.1 概念2.2 二叉树的基本形态2.3 两种特殊的二叉树2.4 二叉树的性质2.5 二叉树的存储2.6 二叉树的基本操作2.6.1 二叉树的遍历2.6.2 二叉树的基本操作 2.7 基础练习题2.7.1 二叉树的前序遍历2.7.2 二叉树中序遍历…

怎么防止U盘复制电脑文件

怎么防止U盘复制电脑文件 安企神U盘管理系统下载使用 说到防止U盘复制电脑文件也是一个老生常谈的话题了,因为U盘的主要目的是在不同设备之间传输文件。对于企业来说,有的重要信息是不能对外泄露的,出于安全考虑,企业往往是禁止…

SpringDoc上传附件或文件 - Swagger3

摘要 从Swagger2 升级到 Swagger3 之后发现对于附件出现了问题。 依赖 <dependency><groupId>org.springdoc</groupId><artifactId>springdoc-openapi-ui</artifactId><version>1.7.0</version></dependency>问题描述 在Sw…

Leetcode—80.删除有序数组中的重复项II【中等】

2023每日刷题&#xff08;十&#xff09; Leetcode—80.删除有序数组中的重复项II 双指针实现代码 int removeDuplicates(int* nums, int numsSize){int i 0;int j 1;int k 1;int tmp nums[i];while(j < numsSize) {if(nums[j] tmp && k < 2) {nums[i] n…

百元挂耳式耳机哪款好一点、优质的挂耳式耳机推荐

近些年人们对耳机的依赖变得越来越重要&#xff0c;很多人玩游戏、听音乐、看电视都离不开耳机&#xff0c;耳机为我们带来美妙音乐的同时带来了很强烈的安全感。然而&#xff0c;传统的入耳式耳机存在一些问题&#xff0c;如容易滋生细菌&#xff0c;潜在地引发耳部炎症。因此…

万能鼠标设置 SteerMouse v5.6.8

鼠标可谓是用户们在使用电脑时候的必备外接设备呢&#xff01;适合你自己的鼠标设置也绝对能够优化你的Mac使用体验&#xff01;想要更好的Mac体验就试试用Steermouse Mac版吧。它通过软件来自由设置你的鼠标操作&#xff01;在这款万能鼠标设置工具中&#xff0c;用户可以在偏…

in ,exists,any在数据库中数据失真的问题

简介 早期文章已经介绍了in ,exists在数据库如果遇到空值会发生数据失真的情况&#xff0c;前段时间&#xff0c;又有人问到这一点&#xff0c;本篇文章再次对mysql8.0/oracle19c/postgresql-14进行测试&#xff0c;对于表中存在空值的集中匹配情况进行解析。 插入测试数据 …

蓝牙助听模块场景分析之三

蓝牙助听模块场景分析之三 使用经典蓝牙以及助听方案&#xff0c;低成本&#xff0c;支持蓝牙音频。 配合蓝牙耳机使用&#xff0c;蓝牙耳机可以是TWS、OWS、骨传导耳机、头戴耳机等等。 助听模块&#xff08;QCC3040 QCC3056 QCC3086&#xff09;可以放桌子上&#xff0c;来拾…

用Java代码更改PDF页边距,批量处理PDF文档

页边距是指文档页面主要内容以外的边缘区域。在创建 PDF 文档时&#xff0c;通常会设定每页固定页边距&#xff0c;以确保页面的统一性。然而&#xff0c;在某些情况下&#xff0c;已创建的 PDF 文档可能需要调整页边距以获得更好的视觉效果或满足打印需求。这通常是一项复杂的…

java毕业设计基于springboot的民宿预订信息网站

运行环境 开发语言&#xff1a;Java 框架&#xff1a;springboot JDK版本&#xff1a;JDK1.8 服务器&#xff1a;tomcat7 数据库&#xff1a;mysql 数据库工具&#xff1a;Navicat11 开发软件&#xff1a;eclipse/myeclipse/idea Maven包&#xff1a;Maven 项目介绍 民宿短租…

为什么C++能搜到的框架介绍都好抽象?

为什么C能搜到的框架介绍都好抽象&#xff1f; 那是因为c每次都要自建生态 随便一个库发展到一定阶段&#xff0c;它就开始跨界&#xff0c;做得又大又全 结果就是&#xff0c;虽然都叫c&#xff0c;但其实是由一大堆不同生态组成的统称 c跟c的差异&#xff0c;比java跟c的差…

moea中return, risk的计算

M - np.sum(np.dot(x.T, r))为什么return的定义是这样的&#xff1f;其中x是一个向量&#xff0c;表示对每个股份的投资比例&#xff0c;r是各个股份的回报return的均值 V np.sum(np.dot(x, x.T) * np.dot(s, s.T) * c)为什么risk的定义是这样的&#xff1f;其中x是一个向量&…

开放式激光振镜运动控制器在动力电池模组连接片的焊接应用

市场应用背景 伴随着国内新能源汽车市场的强劲增长&#xff0c;国内激光焊接产业迅速崛起。激光焊接在动力电池生产的中道和后道生产过程中得到广泛应用&#xff0c;包括电池模组连接片焊接、防爆阀焊接、以及极耳的焊接等关键工序。 新能源汽车的动力电池焊接质量直接关系到…

python爬虫之正则表达式解析实战

文章目录 1. 图片爬取流程分析2. 实现代码—爬取家常菜图片 1. 图片爬取流程分析 先获取网址&#xff0c;URL&#xff1a;https://www.xiachufang.com/category/40076/ 定位想要爬取的内容使用正则表达式爬取导入模块指定URLUA伪装&#xff08;模拟浏览器&#xff09;发起请求…