【分享】我想上手机器学习

news2025/1/11 8:49:14

目录

前言

一、理解机器学习

1.1 机器学习的目的

1.2 机器学习的模型

1.3 机器学习的数据

二、学习机器学习要学什么

2.1 学习机器学习的核心内容

2.2 怎么选择模型

2.3 怎么获取训练数据

2.4 怎么训练模型

三、机器学习的门槛

3.1 机器学习的第一道门槛

3.2 机器学习的第二道门槛

3.3 机器学习的第三道门槛


前言

对于新人来说,开始学习机器学习可能会感到有些困难。例如一般会给出海一样阔的学习清单,然后还需要掌握基础数学知识、学习Python编程语言、学习机器学习基础理论、实践项目、参与社区和持续学习等方面的努力等等等等等等等等等等等一大堆的“刚性要求”及“说与不说都一样的建议”。

与其说这些是学习建议或者学习指引,还不如说是“机器学习劝退书”。如果不抓住主干,而是繁枝杂叶,那么养猪都要买上十本书,看完隔壁家猪都下崽了。

下面结合实际的经验,和一些真正上手人的经历,今天我来分享一下机器学习上手要怎么搞。

一、理解机器学习

1.1 机器学习的目的

机器学习的目的就是通过X来预测Y,

1.2 机器学习的模型

但X与Y的关系往往不知,所以需要假设X与Y符合某个模型。而模型并非完全是死的,它预留了一些参数,例如线性模型y = wx,就预留了w作为参数,模型是固定的(它必然是线性的),但模型不是死的,可以通过参数w来调整线性关系的斜率。

1.3 机器学习的数据

模型中预留的参数如何确定?这时候就依靠历史数据了,求解一个参数,使得模型在历史数据中预测最准确,以此来确定模型的参数。

二、学习机器学习要学什么

2.1 学习机器学习的核心内容

由上而知,机器学习就是选择一个模型,然后再用数据训练模型,以达到我们的目的---用X预测Y。因此,重心就只有两个:

(1)怎么选择模型

(2)怎么获取训练数据

(3)怎么训练

2.2 怎么选择模型

要知道怎么选择模型,就必须了解模型,了解更多的模型。只有桔子梨子桃子李子都吃过了,才能知道现在想吃什么。所以这是一个很简单的问题, 多学几个模型,玩几个模型,多玩玩,就知道了。但是不是所有模型都要知道呢?当然不是,也是不可能的!就像梨子桃子桔子李子柚子柿子椰子梨子橙子车厘子都未必样样吃齐,一般先学着五六个常用模型,就算入门了。

机器学习基本的模型,包括线性回归、逻辑回归、支持向量机(SVM)、决策树、随机森林、聚类分析、降维等。这些模型可用于分类和回归问题,如房价预测、股票走势或测试成绩等连续变化的案例。其中,线性回归和逻辑回归是处理回归任务最常用的算法之一,而SVM、决策树和随机森林则是处理分类任务常用的算法。

在机器学习入门阶段,建议先学习一些基础模型,如线性回归和逻辑回归,以及一些基本的聚类方法和降维方法。然后,可以根据实际问题和数据集的特点,选择适合的模型进行学习和应用。同时,还需要了解各种模型的应用场景、优缺点、参数设置等,以便更好地应用它们解决实际问题。

2.3 怎么获取训练数据

这里的获取训练数据,并非指获取最原始的数据,而是指怎么获取喂给模型的数据。这就涉及到数据清洗了,这里不铺开讲述,只要学习了模型,再看一两个案例,就自然知道要把数据处理成什么样来喂给模型了。因为不同的模型,所要求的数据也有个别的出入,实践一两下就自然知道要求了。实践出真知!

知道模型要求什么数据,接下来就是数据的处理了,这就是实打实打编程苦力工,对于有编程基础的同学来说,完全是肝的问题,而不是懂不懂的问题,不学自通。而对于没有编程基础的,也可以根据这些数据处理要求,作为编程的练习题,既可以学习数据清洗,又可以学习编程,一举两得,何乐而不为!

2.4 怎么训练模型

训练模型是最简单不过的事情,根据机器学习包(例如python中的sklearn)的API说明,依样画葫芦就行,根本不需要学习。属于动手试试就知的那种,完全不会成为门槛。

API说明在哪里找?官网、百度、CSDN、知乎,满大街都是,随便搜一下拿来就用。

三、机器学习的门槛

3.1 机器学习的第一道门槛

机器学习的第一道门槛,在模型(算法)的学习上,但基本学过就行。这就是个吃梨子桃子桔子李子柚子柿子椰子梨子橙子车厘子的过程,吃过就知道味道了。

这个中可能会涉及到一些数学知识,其实不必介怀,一知半解也是没关系的,不是人人都是美食家,也不是人人都是水果专家,一吃就知道这桃子是哪个品种,有没有施药,雨水有没有充足,吃过就行了,大概知道个味道,也不影响我下次去买水果时选择哪个水果。

3.2 机器学习的第二道门槛

机器学习的第二道门槛在于实践,做一个模型,肯定是希望有效果的,如果总是训练效果不好,这不免会打击信心,这时候就需要耐心与信心加持了。相信数据,相信会有效果,耐心去分析问题,这里必须说明,很多时候都是出现在数据问题上,所以需要很仔细的去了解数据,分析数据,清洗数据。

3.3 机器学习的第三道门槛

相信有许多迈过了第一道,第二道,已经入门的同学,却没有继续在机器学习上走下去。为什么?因为没有实践的机会!对!第三道门槛就是实践的机会! 一份工作也好,一份自己的项目也好,“被需要”是很重要的! 在获得实践机会后,将机器学习融入生活,才算真正开启了机器学习之路!

其实也没写几个字,却敲到手累了,有机会再细说。

最后,列出一些可以参考与学习的网站:

《1》人工智能学习路线图2023版-黑马程序员人工智能技术路线

《2》老饼|机器学习

《3》机器学习相关电子书_天赋好书(cnToFu.com)

《4》1. 监督学习 - sklearn中文教程 | 编程字典


如果觉得本文有帮助,点个赞吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1295175.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ES-环境安装(elasticsearch:7.17.9,kibana,elasticsearch-head)

ES 环境搭建 1 拉取镜像 常用三件套 docker pull kibana:7.17.9 docker pull elasticsearch:7.17.9 docker pull mobz/elasticsearch-head:52 启动镜像 elasticsearch 安装 这里可以先不挂载文件启动一波,然后把容器里的文件拷贝出来 docker run -p 19200:9200 …

[oeasy]python0002_终端_CLI_GUI_编程环境_游戏_真实_元宇宙

回忆 上次 了解了 python 语言的特点 历史悠久功能强大深受好评已成趋势 3大主流操作系统 macwindowslinux 我们 选择 linux 作为基础系统 为什么选择 黑乎乎的命令行界面呢?🤔 GUI vs CLI 个人电脑 用图标和菜单组成 图形界面(GUI) Graphic User I…

Numpy数组的重塑,转置与切片 (第6讲)

Numpy数组的重塑,转置与切片 (第6讲)         🍹博主 侯小啾 感谢您的支持与信赖。☀️ 🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ�…

朴素贝叶斯 朴素贝叶斯原理

朴素贝叶斯 朴素贝叶斯原理 判别模型和生成模型 监督学习方法又分生成方法 (Generative approach) 和判别方法 (Discriminative approach)所学到的模型分别称为生成模型 (Generative Model) 和判别模型 (Discriminative Model)。 朴素贝叶斯原理 朴素贝叶斯法是典型的生成学习…

鸿蒙OS应用开发之最简单的程序

鸿蒙OS应用开发之最简单的程序 前面介绍怎么样安装鸿蒙应用开发的环境,然后试着运行起来,并安装运行的虚拟机,以及对应9.0版本的API和SDK等软件。这样就具备了基本的开发基础,就可以进入创建应用程序开发了。 在我们起飞之前&…

【Java基础系列】Cron表达式入门

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

通过kubeadm方式安装k8s

虚拟机最少是 2 core,master内存最小3G,node内存最小2G. 要求的Docker版本是18.03,如果不是安装的docker ce,版本是过旧的,可以选择删除后重新安装; 也可以重新创建一个虚拟机执行以下命令。 简单方法&am…

解决“使用command+shift+a 总是弹出默认终端”

冲突出现的终端如下 问题原因 MacOS下使用IntelliJ 系列的IDE就是经常遇到这个问题,原因该快捷键与系统的 《在“终端”中搜索man页面索引 》功能的快捷键冲突了,Find Action是一个很高频使用的! 解决方案 把系统《在“终端”中搜索man…

5组10个共50个音频可视化效果PR音乐视频制作模板

我们常常看到的图形跟着音乐跳动,非常有节奏感,那这个是怎么做到的呢?5组10个共50个音频可视化效果PR音乐视频制作模板满足你的制作需求。 PR音乐模板|10个音频可视化视频制作模板05 https://prmuban.com/36704.html 10个音频可视化视频制作…

Python语言求解嵌套列表中的最大元素和

更多资料获取 📚 个人网站:ipengtao.com 在处理嵌套列表时,有时我们需要找到列表中的最大元素以及对应的位置。本文将深入讨论如何使用Python有效地解决这个问题。我们将使用不同的方法,包括递归、列表推导和NumPy库,…

我有才打造私域流量的知识付费小程序平台

在当今数字化时代,知识付费市场正在迅速崛起,而私域流量的概念也日益受到重视。私域流量指的是企业通过自有渠道获取的、能够自由支配的流量,这种流量具有更高的用户粘性和转化率。因此,打造一个基于私域流量的知识付费小程序平台…

VBA_MF系列技术资料1-237

MF系列VBA技术资料 为了让广大学员在VBA编程中有切实可行的思路及有效的提高自己的编程技巧,我参考大量的资料,并结合自己的经验总结了这份MF系列VBA技术综合资料,而且开放源码(MF04除外),其中MF01-04属于定…

防水,也不怕水。Mate X5是如何做到让你湿手湿屏也不影响操作的?

相信不少人都碰到过当手机屏幕存在小水珠时,触控变得不灵敏,或者出现“幽灵触屏”,指东打西的情况。 尤其是在洗澡、做饭,或者在户外遇到下雨天气时,如果打湿的手机收到重要聊天消息或者电话,却因为湿屏导…

Hazel引擎学习(十二)

我自己维护引擎的github地址在这里,里面加了不少注释,有需要的可以看看 参考视频链接在这里 Scene类重构 参考:《InsideUE4》GamePlay架构(二)Level和World 目前我的Scene类基本只是给entt的封装,提供了…

【risc-v】易灵思efinix FPGA riscv嵌入式软件源码分享

系列文章目录 分享一些fpga内使用riscv软核的经验,共大家参考。后续内容比较多,会做成一个系列。 本系列会覆盖以下FPGA厂商 易灵思 efinix 赛灵思 xilinx 阿尔特拉 Altera 本文内容隶属于【易灵思efinix】系列。 【risc-v】易灵思efinix FPGA sap…

若依框架的搭建

若依框架 若依框架的搭建(前后端分离版本)环境要求IDEA拉取Gitee源码Mysql 配置Redis 配置后端启动前端配置问题解决 效果展示 若依框架的搭建(前后端分离版本) 简介 RuoYi-Vue 是一个 Java EE 企业级快速开发平台,基…

ssh安装及问题解决

ssh安装及遇到的问题 ssh分为客户端 openssh-client 和服务器 openssh-server,可以利用以下命令确认是否安装: dpkg -l | grep ssh我用ubantu安装的,所以默认安装了客户端 安装客户端和服务器端的命令分别为: sudo apt-get ins…

LLM时代,数据为王,19个开源数据集下载网站汇总

大模型时代,数据为王,在哪里寻找开源数据集,是一个比较头疼的问题。经过调研整理,下面列出了目前可以寻找开源大模型数据集的网站清单。 1、HuggingFace开源数据集 链接:https://huggingface.co/datasets 镜像&#…

TSINGSEE青犀智能商场远程视频监控方案,助力商场统一智能化监管

随着经济的发展和人们物质生活的提高,商场的普及度也越来越高,而商场一般都有占地面积大、人流量多、人员复杂的特点,商场的统一化管理也是一个大问题。智能商场远程视频监控通过利用物联网和云计算技术,可以用来实现远程统一化视…

【若依框架实现上传文件组件】

若依框架中只有个人中心有上传图片组件&#xff0c;但是这个组件不适用于el-dialog中的el-form表单页面 于是通过elementui重新写了一个上传组件&#xff0c;如图是实现效果 vue代码 <el-dialog :title"title" v-model"find" width"600px"…