让机器学习不再是过门不入,带您一起详解机器学习(机器学习 Machine Learning 研习之一)

news2024/11/18 3:19:28

什么是机器学习(Machine Learning)?

机器学习是]赋予计算机学习能力的研究领域 无需明确编程。 ——阿瑟·塞缪尔,1959

计算机程序可以从关于某些任务的经验 E 中学习 T 和一些绩效衡量 P,如果其在 T 上的绩效按 P 衡量, 随着经验E的提高而提高。 ——汤姆·米切尔,1997

通俗的说,机器学习(Machine Learning)是计算机编程的科学,它们可以从数据中进行学习。

机器学习好比电子邮件中的垃圾邮件过滤器, 由用户标记出垃圾邮件示例和常规邮件的示例,继而让机器去学习标记垃圾邮件。

那些由用户标记的示例用于学习的称为训练( training),而每个训练示例则成为训练实例(或称为训练样本),机器学习过程中并作出预测(predictions)的便成为模型(Model)。

神经网络(Neural networks)和随机森林( random forests)也都是模型的例子。

在这种情况下,任务 T 是标记新电子邮件的垃圾邮件,经验 E 是训练 数据,并且需要定义性能度量P; 例如,您可以使用 正确分类电子邮件的比率。 这种特殊的绩效衡量标准被称为 准确率高,常用于分类任务。

但如果您只是下载所有维基百科文章的副本,您的计算机上还有更多内容数据,但它在任何任务上都不会突然变得更好。 这不是机器学习

为什么使用机器学习?

我们抛弃机器学习,使用传统编程方式来处理垃圾邮件的过滤器。

  • 1、首先,您得检查垃圾邮件是什么样子的。例如某商城活动推广、房产信息、股票推荐等等。
  • 2、是的,您得为以上出现的种种情况编写一套检测算法。
  • 3、您将测试您的程序并重复 1、2 步骤,直到它足够好为止。

最终您的程序很可能会变成一长串复杂的规则——难以维护。

相比之下,基于机器学习技术的垃圾邮件过滤器会自动学习通过检测异常频率,可以很好地预测垃圾邮件, 与垃圾邮件示例相比, 该程序更短,更容易维护,而且很可能更多准确的。

倘若垃圾邮件发送者发现所有含有商城活动推广链接的电子邮件都被阻止了,那该怎么办呢?他们势必会将链接换成短链接。

然而,使用传统编程的垃圾邮件过滤器,则需要更新技术来标记那些以短链接来隐藏的商城活动推广的电子邮件了。假使垃圾邮件发送者继续围绕垃圾邮件过滤器展开工作,您将永远处于被动下地去更新您的规则。

相比之下,基于机器学习技术的垃圾邮件过滤器会自动注意到以短链接形式的商城活动推广邮件,在用户标记的垃圾邮件中变得异常频繁,并且无需您的干预即可标记它们。

机器学习的亮点便是解决对于传统方法来说过于复杂、抑或是还没有算法的问题。

就拿语音识别来说吧!假使您想从简单开始编写一个能够区分 一 和 二 的程序,或许您可能硬编码一个算法来检测高低音强度并用它来区分。

很显然,这种硬编码技术是无法扩展到数以亿计的人所说的数千个汉语的。

不同的人在噪杂的环境中使用数十种语言,迄今为止最好的解决方案便是编写一个可以自我学习的算法,给出很多文字的录音的示例,最终让机器学习像人类一样去学习。

总而言之,机器学习非常适合以下场景:

  • 现有解决方案需要大量微调或长列表的问题 规则(机器学习模型通常可以简化代码并且性能比 传统方法)
  • 使用传统方法无法解决的复杂问题 (最好的机器学习技术也许可以找到解决方案)
  • 波动的环境(机器学习系统可以轻松地进行重新训练 新数据,始终保持最新)
  • 深入了解复杂问题和大量数据

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/756731.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微信批量自动加好友神器,多账号如何统一自动加好友

其实这样的方式不仅太集中容易造成频繁 效率还很低 现在可以解放双手 只需要你有数据 导入数据设置相应添加任务 就可以每天根据你设置的时间点去添加好友 直到数据被用完 就不用每天手动一个个去添加咯 还可以多账号统一自动加好友 一天就可以加多点 相信 无论是个…

RDS-Tools RDS-Knight Crack

RDS 高级安全性 利用全面的网络安全工具箱中有史以来最强大的安全功能集来保护您的 RDS 基础架构。 全方位 360 保护 无与伦比的功能集 无与伦比的物有所值 企业远程桌面安全。现代工作空间的智能解决方案。 办公室正在权力下放。远程办公室和移动员工数量创历史新高。随…

Netty网络编程

参考文档 https://zhuanlan.zhihu.com/p/550956053 https://zhuanlan.zhihu.com/p/514448867 BIO 读取数据有两个阶段 等待数据就绪,数据到达内核缓冲区读取数据(系统调用),从内核缓冲区,拷贝至用户缓冲区 BIO两个阶段都会阻塞 BIO编程时&…

RIS 系列 RISCLIP: Referring Image Segmentation Framework using CLIP 论文阅读笔记

RIS 系列 RISCLIP: Referring Image Segmentation Framework using CLIP 论文阅读笔记 一、Abstract二、引言三、相关工作Referring Image SegmentationVisual Grounding PretrainingContrastive Language-Image Pre-training (CLIP) 四、Referring Image Segmentation Framewo…

Numpy总结

Numpy 文章主要通过案例来理解广播机制、结合相应函数(rollaxis、swapaxes)来理解Axis、总结了相关函数axis1的操作规律。 文章参考博客如下: 大致参考:Python之Numpy详细教程。 线性代数部分:Numpy重要模块——lin…

考研英语一阅读真题逐词翻译(2010-2023)共211页

整理了考研英语一阅读真题逐词翻译(2010-2023)共211页 包含了2010年到2023年所有阅读的逐次逐句翻译,重难点单词的下划线翻译等 也对这份真题逐词翻译进行了年份分类整理,合集包含了多年的考研英语一阅读题目,覆盖了不…

美团JVM面试题

1. 请解释一下对象创建的过程? Java对象创建的过程主要分为以下五个步骤: 类加载检查 Java虚拟机在读取一条new指令时候,首先检查能否在常量池中定位到这个类的符号引用,并且检查这个符号引用代表的类是否被加载、解析和初始化。如果没有&a…

数据库多表查询作业

数据库多表查询作业 创建数据库 插入数据 mysql> insert into student values(901,张老大,男,1985,计算机系,北京市海淀区),-> (902,张老二,男,1986,中文系,北京市昌平市),-> (903,张三,女,1990,中文系,湖南省永州市), -…

IT学不好没什么,大不了躺平

目录 一、个人经历 二、情绪调节技巧和策略 三:治愈自己 最近确实发生很多因为情绪失控发生意外的事情,有伤害别人的,也有伤害自己的,最近才听说过一个词叫呼吸性碱中毒,这就是情绪波动导致的身体不适,有…

layui实现左侧导航树形菜单

今日金句 战术上的勤奋并不能掩盖战略上的懒惰 文章目录 前言一、左侧导航1.1 概述1.2 树形菜单 二、导入数据表及无限级分类2.1 导入数据2.2 无限级分类 三、Book实例3.1 环境准备3.3 导入封装的工具类3.3 实体类及dao方法的编写3.4 编写Servlet3.5 编写Jsp 前言 在上篇博客…

【miniQMT实盘量化2】与客户端建立连接

前言 上篇从概念上介绍了miniQMT和它的优势,本篇开始实操的第一步:连接客户端,让你知其然,也只其所以然,话不多说,开干! 登录客户端 一切的开始,我们要首先保证QMT极简版客户端的…

deeplabv3+源码之慢慢解析 第二章datasets文件夹(2)voc.py--VOCSegmentation类

系列文章目录 第一章deeplabv3源码之慢慢解析 根目录(1)main.py–get_argparser函数 第一章deeplabv3源码之慢慢解析 根目录(2)main.py–get_dataset函数 第一章deeplabv3源码之慢慢解析 根目录(3)main.py–validate函数 第一章deeplabv3源码之慢慢解析 根目录(4)main.py–mai…

MySQl数据库第八课-------SQL命令查询-------主要命脉

作者前言 欢迎小可爱们前来借鉴我的gtiee秦老大大 (qin-laoda) - Gitee.com —————————————————————————————— 目录 查询数据 条件 逻辑运算符 模糊查询 范围查询 in 判断空 UNION 排序 聚合 分组:group by —————————…

安卓进度条:ProgressBar和Seekbar

一、ProgressBar进度条介绍 ProgressBar 是 Android 中的一个进度条控件,用于显示正在进行的任务的进度。它可以以水平或圆形的形式展示进度,并提供了多种样式和属性来满足不同的需求。 相关属性: android:progress:设置进度条的…

LangChain大型语言模型(LLM)应用开发(六):Agents

LangChain是一个基于大语言模型(如ChatGPT)用于构建端到端语言模型应用的 Python 框架。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互&#x…

【Linux指令集】---zip指令(超详细)

个人主页:平行线也会相交 欢迎 点赞👍 收藏✨ 留言✉ 加关注💓本文由 平行线也会相交 原创 收录于专栏【Linux专栏】🎈 本专栏旨在分享学习Linux的一点学习心得,欢迎大家在评论区讨论💌 演示环境&#xff1…

DevOps系列文章 之 pipeline 流水线:企业微信群通知消息

部署流程 开发环境Jenkins的job进行编译-打包-build成镜像-推送到镜像私有仓库-部署开发环境-(开发自测)-自测通过-提测。 版本管理: 构建的过程: 开发环境通过验证,则点击“Yes”,没有则Abort。点击Yes后…

在Linux系统中,如何搭建DNS服务

如何搭建DNS服务 要在Linux系统上搭建DNS服务,你可以按照以下步骤进行操作: 1.安装BIND软件包: sudo yum install bind bind-utils2.配置主DNS服务器: 打开/etc/named.conf文件,编辑DNS服务器的配置。根据你的域名和…

122、仿真-基于51单片机的电量监测电压电流和温度报警系统设计(Proteus仿真+程序+流程图+配套资料等)

方案选择 单片机的选择 方案一:STM32系列单片机控制,该型号单片机为LQFP44封装,内部资源足够用于本次设计。STM32F103系列芯片最高工作频率可达72MHZ,在存储器的01等等待周期仿真时可达到1.25Mip/MHZ(Dhrystone2.1)。内部128k字节…

自然语言处理(扩展学习1):Scheduled Sampling(计划采样)与2. Teacher forcing(教师强制)

自然语言处理(扩展学习1):Scheduled Sampling(计划采样)与2. Teacher forcing(教师强制) 作者:安静到无声 个人主页 作者简介:人工智能和硬件设计博士生、CSDN与阿里云开发者博客专家&#xff0…