基于支持向量机的垃圾邮件分类，使用SVM+flask+vue

news2025/2/22 11:25:37

sms-classify

基于支持向量机的垃圾邮件分类，使用SVM+flask+vue
数据集和源码地址

数据集 SMS Spam Collection Data Set 来源于 UCI。样例被分为非垃圾邮件（86.6%）和垃圾邮件（13.4%），数据格式如下：

ham Go until jurong point, crazy.. Available only in bugis n great world la e buffet... 
ham	Ok lar... Joking wif u oni...
spam	Free entry in 2 a wkly comp to win FA Cup final tkts 21st May 2005. 
ham	U dun say so early hor... U c already then say...

代码结构

- client: 前端实现
- server: 后端实现
    - models: svm model
        - sms_classify.py: 垃圾邮件分类实现
        - SMSSpamCollection: 数据集
    - app.py 系统实现
- svm.py: 支持向量机算法实现
- svm_test.py：算法test

性能评估

综合比较了垃圾邮件分类任务在支持向量机、朴素贝叶斯、最近邻、决策树算法下的性能，
评估指标包括accuracy、precision、recall、f1-score等。

从accuracy来看，支持向量机的accuracy为98%，是所有测试算法中最高的，可以看出
垃圾邮件分类任务适合使用支持向量机来做。

各算法表现具体如下表：

支持向量机：

             precision    recall  f1-score   support

           0       0.98      1.00      0.99       482
           1       1.00      0.86      0.92        76

    accuracy                           0.98       558
   macro avg       0.99      0.93      0.96       558
weighted avg       0.98      0.98      0.98       558

支持向量机的accuracy有 98.029%。

贝叶斯算法：

         precision    recall  f1-score   support

           0       0.94      1.00      0.97       482
           1       1.00      0.62      0.76        76

    accuracy                           0.95       558
   macro avg       0.97      0.81      0.87       558
weighted avg       0.95      0.95      0.94       558

贝叶斯算法的accuracy只有 94.803%。

最近邻算法：

     precision    recall  f1-score   support

           0       0.97      0.99      0.98       482
           1       0.93      0.83      0.88        76

    accuracy                           0.97       558
   macro avg       0.95      0.91      0.93       558
weighted avg       0.97      0.97      0.97       558

最近邻算法的accuracy为 96.774%。

决策树算法：

       precision    recall  f1-score   support

           0       0.97      0.98      0.98       482
           1       0.88      0.79      0.83        76

    accuracy                           0.96       558
   macro avg       0.92      0.89      0.90       558
weighted avg       0.96      0.96      0.96       558

决策树算法的accuracy为 95.699%。

如何运行

首先安装必要的包

# 创建虚拟环境
python -m venv env
# 激活虚拟环境
source env/bin/activate
# 安装依赖包
pip install -r requirements.txt

运行SVM算法实现

# 确保安装 matplotlib 和 numpy
python3 svm_test.py

运行垃圾邮件分类

~ cd server/models/
~ python3 sms_classify.py

运行垃圾邮件分类系统

server端

# 确保安装必要的包
# 启动flask
python app.py

client端

# 确保安装node & npm
npm install
npm run server

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1840002.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！