机器学习_个人笔记_周志华(更新中......)

news2025/1/15 23:25:03

第1章 绪论

1.1 引言

形成优秀的心理表征,自然能成为领域内的专家。
系统1 & 系统2。

机器学习:致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。主要研究计算机从数据中产生model的算法,即“learning algorithm”。
“经验”通常的存在形式——“数据”。

1.2 基本术语

数据集
每天记录——示例——样本
属性值
属性空间——样本空间——输入空间
一个示例——特征向量(feature vector)
训练样本——训练示例(training instance)——训练例

学得模型亦称hypothesis,学习过程是为了逼近ground-truth。本书有时称模型为“学习器”(learner)。

标记空间(label space)——输出空间
分类(classificatioin):离散值预测类的学习任务。
回归(regression): 连续值预测类任务。
binary classification任务:includes positive class & negative class。
multi-class classification

预测类任务是希望建立输入空间x到输出空间y的映射f

testing
testing sample
clustering
cluster

据training data是否拥有label information,划分为supervised learning & unsupervised learning。classification和regression是前者的代表,而clustering是后者的代表。

“泛化(generalization)”能力

1.3 假设空间

科学推理的两大基本手段:induction(归纳)& deduction(演绎)。
induction: 从特殊到一般。
deduciton: 从generalization到specialization。

inductive learning(归纳学习)——从样例中学习。分为广义和狭义。

version space

1.4 归纳偏好

inductive bias:机器学习算法在学习过程中对某种类型假设的偏好。任何一个有效的机器学习算法必有其归纳偏好,否则无法产生确定的学习结果。

Attention:
在这里插入图片描述
NFL定理:No Free Lunch Theorem!
NFL定理的重要前提:…
NFL Theorem的寓意:具体问题具体分析。学习算法自身的induction bias与problems是否相配,往往起决定性作用。

1.5 发展历程

20世纪50年代到70年代初:AI研究处于“推理期”。
20世纪70年代中期开始,”知识期“。
20世纪80年代,ML成为一个独立的学科领域,各种ML技术百花初绽——学习期。

本书大部分内容均属于广义的induction learning范畴,涵盖supervised learning and unsupervised learning等等。

ILP:Inductive Logic Programming(归纳逻辑程序设计)。

参数调节上失之毫厘,学习结果可能谬之千里。

statistical learning(统计学习)
Support Vector Machine(SVM,支持向量机)

深度学习:狭义地说是“很多层”的神经网络。

ML已发展为一个相当大的学科领域,本节仅管中窥豹。耐心读完本书会有更全面的了解。

1.6 应用现状

在CV及NLP等“计算机应用技术”领域,ML已成为最重要的技术进步源泉之一。ML也为许多交叉学科提供重要的技术支撑。
“数据分析”是ML技术的舞台。

ML提供数据分析能力,云计算提供数据处理能力,众包(crowdsourcing)提供数据标记能力。

数据挖掘(data mining)。
数据挖掘与机器学习的联系。
数据库领域研究为数据挖掘提供数据管理技术。ML和统计学的研究为data mining提供数据分析技术。

ML技术是建立输入与输出之间联系的内核。

奥巴马的“竞选核武器”——R.Ghani领导的机器学习团队。

如何学习?《刻意练习》《认知天性》《考试脑科学》有所介绍

1.7 阅读材料

在这里插入图片描述

第2章 模型评估与选择

2.1 经验误差与过拟合

第3章 线性模型

第4章 决策树

第5章 神经网络

第6章 支持向量机

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1000522.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

myCobot Pro600六轴机械臂与3D深度视觉:物体精确识别抓取堆叠

Introduction 随着时代的进步,各种精密的机械臂,人形机器人不断的问世。我们即将迎来到处都是机器人的高科技时代。为了跟上时代的脚步,我最近入手了一台myCobot pro 600机械臂,我主要是想要用它来学习机械臂相关得控制以及机器视…

【跟小嘉学 Apache Flink】二、Flink 快速上手

系列文章目录 【跟小嘉学 Apache Flink】一、Apache Flink 介绍 【跟小嘉学 Apache Flink】二、Flink 快速上手 文章目录 系列文章目录[TOC](文章目录) 一、创建工程1.1、创建 Maven 工程1.2、log4j 配置 二、批处理单词统计(DataSet API)2.1、创建 Bat…

今日话题:解决Linux中可以识别但无法连接Airpods问题(亲测且实用)

今日话题:解决Linux中可以识别但无法连接Airpods问题 起因经过结果方式一方式二 起因经过 在根据“Linux启动黑屏卡住Logo登录界面无法进入系统的终极解决方式”博客解决掉gdm3以及lightdm图形界面之间冲突的问题后,准备设置打开蓝牙连接Airpods&#x…

Java | 多线程

不爱生姜不吃醋⭐️ 如果本文有什么错误的话欢迎在评论区中指正 与其明天开始,不如现在行动! 文章目录 🌴前言🌴一、什么是多线程?1.进程2.线程3.多线程作用 🌴二、多线程中的两个概念1. 并发2. 并行3.举例…

python-面向运行时性能优化-threading

python-面向运行时性能优化-threading 一:线程基础1> 线程状态2> 线程同步1. 锁的状态3> 线程通信-条件变量4> 线程阻塞-之间转换1. 阻塞分类二:threading类1> threading介绍2> Thread类1. Thread的生命周期2. 实例化Thread类3. 继承Thread类4. Thread构造…

9.11作业

实现一个对数组求和的函数,数组通过实参传递给函数 sum0 arr(11 22 33 44 55) Sum() {for i in ${arr[*]}do$((sumi))donereturn $sum } Sum ${arr[*]} var$? echo $var写一个函数,输出当前用户的uid和gid,并使用变量接收结果 Sum() {aid -…

C高级作业 【使用shell脚本】 实现一个对数组求和的函数,数组通过实参传递给函数+写一个函数输出当前用户的uid和gid,并使用变量接收结果

作业 1、实现一个对数组求和的函数,数组通过实参传递给函数 #!/bin/bash # 定义求和函数 function sum() {local arr("$") # 将传入的参数保存到一个数组中local sum0 # 初始化求和为0# 遍历数组元素进行求和for num in "${arr[]}";dosum$…

零代码编程:用ChatGPT批量合并ts文件

文件夹中有很多个ts后缀的视频文件,要合并成一个视频文件,在ChatGPT中可以这样输入提示词: 你是一个Python编程专家,要完成一个批量合并ts文件的任务,具体步骤如下: 打开文件夹:C:\Users\dell\…

亚马逊测评下单怎么操作?有没有自动下单软件?

想要进行亚马逊的测评下单,可以按照以下步骤进行操作: 首先,在亚马逊官方网站上搜索你感兴趣的产品,选择你喜欢的产品并查看其详细信息、价格以及其他用户的评价,确认你的购买意向后,点击“加入购物车”将…

C高级 shell指令分支和循环

实现一个对数组求和的函数,数组通过实参传递给函数 #!/bin/bash s0 function sum() {local brr($*)for i in ${brr[*]}do((si))doneecho $s } arr(1 2 3 4 5 6 7 8 9 ) sum ${arr[*]}写一个函数,输出当前用户的uid和gid,并使用变量接收结果 #…

Grafana配置邮件告警

1、创建一个监控图 2、grafana邮件配置 vim /etc/grafana/grafana.ini [smtp] enabled true host smtp.163.com:465 user qinziteng05163.com password xxxxx # 授权码 from_address qinziteng05163.com from_name Grafanasystemctl restart grafana-serv…

DAY03_瑞吉外卖——公共字段自动填充新增分类分类信息分页查询删除分类修改分类

目录 1. 公共字段自动填充1.1 问题分析1.2 基本功能实现1.2.1 思路分析1.2.2 代码实现1.2.3 功能测试 1.3 功能完善1.3.1 思路分析1.3.2 ThreadLocal1.3.3 操作步骤1.3.4 代码实现1.3.5 功能测试 2. 新增分类2.1 需求分析2.2 数据模型2.3 前端页面分析2.4 代码实现2.5 功能测试…

【算法】二分查找算法——leetcode二分查找、搜索插入位置

文章目录 二分查找704. 二分查找35. 搜索插入位置 二分查找 二分查找算法是一种在有序数组中查找特定元素的搜索算法。算法的工作原理是,通过比较数组中间元素和目标值,如果目标值等于中间元素,那么查找结束。如果目标值小于或大于中间元素&a…

单元测试界的高富帅,Pytest框架 (三) 用例标记和测试执行篇

pytest用例标记和测试执行篇 上一篇文章入门篇咱们介绍了pytest的前后置方法和fixture机制,这个章节主要给大家介绍pytest中的标记机制和用例执行的方法。pytest可以通过标记将数据传入于测试函数中,也可以通过标记中对执行的用例做筛选,接下…

NTC 温度采样 二分查表及公式法

NTC 温度采样: 本文记录对NTC 温度采样,分别采用二分查表法及公式法进行描述 资源下载链接:Excel 生成数组表 https://download.csdn.net/download/qq_41359157/88326839?spm1001.2014.3001.5503 NTC参数: NTC采样电路&#xf…

2023 年 Vue 最流行的动画库

数字世界以短暂的注意力和激烈的竞争为主导,因此必须立即将受众的注意力吸引到您的网站上。使用 Vue 动画库,您可以毫不费力地实现这一目标。据报道,VueJs 是 JavaScript 类别中第 7 大最受欢迎的,来自世界各地的开发人员使用它来…

arthas基本应用

下载 arthas curl https://arthas.aliyun.com/arthas-boot.jar启动 arthas(启动之前确保有一个 java进程服务) java -jar arthas-boot.jar输入3,再输入回车/enter。Arthas 会 attach 到目标进程上,并输出志: 输入das…

如何抢占3020亿美元市场先机?送你一份指南

印度电商市场规模正在快速增长。预计到2023年,印度电商市场规模将达到2000亿美元。其中,B2C电商市场规模将占据主导地位,预计将增长至1000亿美元。 此外,印度政府也在积极推动数字化发展,为电商企业提供更多机会。政府…

Python语言:算术运算符知识点讲解

前言:学了几天python,可把我折磨坏了。为什么呢,就是python语言都特别爱空格,我有时候就忘了,就报错了啦。就比如这个:a 8,等于号前面和后面都需要空格,有点不习惯,在慢…

Spring中的事务与事务传播机制

事务 在学习MySQL时我们学习过事务,而到了Spring的学习时,同样会学习到事务,两个东西的事务的定义都是一样的:将一组操作封装成一个执行单元,要么全部成功,要么全部失败 在Spring中使用事务有两种方式 一…