2024年7月2日~2024年7月8日周报

news2025/1/10 2:48:20

目录

一、前言

二、完成情况

2.1 吴恩达机器学习系列课程

2.1.1 分类问题

2.1.2 假说表示

2.1.3 判定边界

2.2 学习数学表达式

2.3 论文写作情况

2.3.1 题目选取

2.3.2 摘要

2.3.3 关键词

2.3.4 引言部分

2.3.4 文献综述部分

三、下周计划

3.1 存在的问题

3.2 计划


一、前言

        在上周,学习吴恩达机器学习的系列视频以及思考论文的标题和内容。

        本周,按照上周的计划继续执行,主要完成了论文理论部分的介绍。由于电脑无法完成实验,所以这一部分没有写。

二、完成情况

2.1 吴恩达机器学习系列课程

2.1.1 分类问题

        在分类问题中,需要预测的变量 y 是离散的值。因此,先介绍一种一种叫做逻辑回归(Logistic Regression)的算法。

        在分类问题中,尝试预测的是结果是否属于某一个类(例如正确或错误)。分类问题的例子有:判断一封电子邮件是否是垃圾邮件;判断一次金融交易是否是欺诈;区别一个肿瘤是恶性的还是良性的等。

        将因变量(dependent variable)可能属于的两个类分别称为负向类(negative class)和正向类(positive class),则因变量 y \in 0,1,其中 0 表示负向类,1 表示正向类。

         如果用线性回归算法来解决一个分类问题,对于分类,y 取值为 0 或者 1,但如果使用的是线性回归,那么假设函数的输出值可能远大于 1,或者远小于 0,即使所有训练样本的标签 y 都等于 0 或 1。尽管标签取值 0 或者 1,但是如果算法得到的值远大于 1 或者远小于 0 的话,就会感觉很奇怪。

        所以,接下来的要研究的算法就叫做逻辑回归算法,该算法的性质是:它的输出值永远在 0 到 1 之间。

2.1.2 假说表示

        根据线性回归模型只能预测连续的值,然而对于分类问题,需要输出 0 或 1, 则可以预测:

  • 当 h_{\theta}(x) \geq 0.5 时,预测 y=1
  • 当 h_{\theta}(x) < 0.5 时,预测 y=0

        对于上图所示的数据,这样的一个线性模型能很好地完成分类任务。假使又观测到一个非常大尺寸的恶性肿瘤,将其作为实例加入到训练集中来,这将获得一条新的直线。

        此时,再使用 0.5 作为阀值来预测肿瘤是良性还是恶性就不合适了。

        因此引入一个新的模型:逻辑回归。该模型将输出变量的范围控制在 0 和 1 之间。

        逻辑回归模型的假设是:h_{\theta}(x) = g(\theta^{T}X)

        其中,X 代表特征向量,g 代表逻辑函数(logistic function)。一个常用的逻辑函数为 S 形函数(Sigmoid function),也是现在的激活函数,公式为:g(z) = \frac{1}{1+e^{-z}}

        h_{\theta}(x) 的作用是,对于给定的输入变量,根据选择的参数计算输出变量等于 1 的可能性 (estimated probablity)即 h_{\theta}(x) = P(y=1|x;\theta) 。

        例如,如果对于给定的 x,通过已经确定的参数计算得出 h_{\theta}(x) = 0.7,则表示有 70%的 几率 y 为正向类,相应地 y 为负向类的几率为 1-0.7=0.3

2.1.3 判定边界

        在逻辑回归中,预测:当 h_{\theta}(x) \geq 0.5 时, y=1;当 h_{\theta}(x) < 0.5 时, y=0

        根据上面绘制的 S 形函数图像,当 z=0 时,g(z) = 0.5z> 0 时,g(z)> 0.5z< 0 时,g(z)< 0.5

        因为:z = \theta^{T}x,则:\theta^{T}x \geq 0 时,预测 y=1\theta^{T}x < 0 时,预测 y=0。

        假设有一个模型如下图所示:

         参数 \theta 是向量[-3 1 1]。 则当 -3 + x_1 + x_2 \doteq 0,即 x_1 + x_2 \geq 3 时,模型将预测 y=1。 我们可以绘制直线 x_1 + x_2 =3,这条线便是该模型的分界线,将预测为 1 的区域和预测为 0 的区域分隔开。

        上述模型需要用曲线才能分隔 y=0  的区域和 y=1 的区域。这里需要二次方特征: h_{\theta}(x) = g(\theta_0 + \theta_1x_1 + \theta_2x_2 + \theta_3x_1^2 + \theta_4x_2^2),则得到的判定边界恰好是圆点在原点且半径为 1 的圆形。

2.2 学习数学表达式

        见链接:学习记录之数学表达式(6)-CSDN博客

2.3 论文写作情况

        在撰写论文的过程中,我遇到了以下几个突出的问题:

  1. 如何给论文取一个合适的题目?
  2. 摘要字数大概多少合适,具体按照什么格式书写呢?
  3. “介绍”部分会引用一部分参考文献,但是这部分参考文献可能在“相关工作”这一章节出现,如何区别描述?
  4. 公式中的符号系统需要与其他论文中的区分吗?
  5. 一些语句的表达如何更加规范?

        因此,我带着疑问学习了闵老师的系列论文写作贴子,链接如下:http://t.csdnimg.cn/I4DCc。

2.3.1 题目选取

        题目的选取是第一个让我头疼的事情。

  1. 长度最好控制在 40-60 个字母之间,限定不能太多;
  2. 需要有吸引力;
  3. 需要易于理解与检索:使用本领域常用的术语或词汇;
  4. 尽量不使用 based on:会让读者认为这是简单方法的扩展,无创新点;
  5. 使用 through、with等来表示技术;
  6. 若主要贡献为算法,可以使用题目的缩写作为算法的名称;

2.3.2 摘要

        Abstract通常包括三部分:已有工作的描述、本文工作、实验结果。因此,可以将摘要分为10句进行描述:

  1. 描述问题所属的领域,解释最重要的概念或者强调问题的重要性;
  2. 描述目前该问题的流行解决方案;
  3. 以However开头,描述已有工作存在的问题,但是指责不能太强烈,需要尊重别人的劳动成果。这句话也可以省略;
  4. 以In this paper开头,介绍本文工作,出现算法的缩写,可以超过 20 个单词(这里我有点疑惑:意思是其余部分的单词需要控制在 20 个以内吗?);
  5. 本文方法的第一个技术、步骤、方面、优势、贡献;
  6. 本文方法的第二个技术、步骤、方面、优势、贡献;
  7. 本文方法的第三个技术、步骤、方面、优势、贡献;(如果不能介绍三方面,会显得工作量不够;)
  8. 描述实验设置,如数据来源等;
  9. 描述实验结果;
  10. 描述论文意义;

2.3.3 关键词

        关键词常被看做摘要的一种补充:

  1. 通常需要 3-5 个关键词;
  2. 一个关键词通常由 1-3 个单词构成;
  3. 关键词按照字母表排序;

2.3.4 引言部分

        引言是对本论文所做的一些铺垫,主要有以下几个注意事项:

  1. 引言可以采用与与摘要保持相同节奏的方式:即将摘要的每一句都扩展为引言中的一段,每段的首句被称为“主题句”;
  2. 每一段应该有 5-10 句,单词在 50-150 内。若相邻两段较短,可以进行合并;若一段太长,应该进行拆分或删减;
  3. 在引言的最后一段以 The rest of the paper is organized as follows. 开头,描述论文的组织结构;
  4. 引言的表达需要简单得体;

2.3.4 文献综述部分

  1. 绝大数的参考文献应该在文献综述中引用;
  2. 每篇论文都应该有文献综述,表示对前人工作的尊重;
  3. 引言中的描述不能与第二节的描述重复;
  4. 描述文献时需要分门别类的介绍;
  5. 文献的引用可以在一句完整的句子后引用;
  6. 不要一次性引用太多文献(不超过3 篇);

三、下周计划

3.1 存在的问题

  1. 在写论文过程中,产生了一些疑惑,还有以下问题未得到解决:①一些共性的东西,如何用不同的语言或形式表现?如评价指标等;②\hat 和 \widetilde 有什么区别?
  2. 论文中英语单词大部分都不能超过20个单词吗?
  3. 理论部分符号如何保持风格统一?
  4. 语言表达干巴巴的,格式不规范,题目命名无吸引力等,需要继续学习闵老师的论文写作系列贴子;
  5. 工作站未空闲,想法没有得到验证,所以实验这一部分还没有完成写作;

3.2 计划

  1. 整理过去一段时间阅读的论文的主要创新点,详细描述实验设计和方法,包括使用的数据集和评价指标;
  2. 按照摘要、实验等总结一些合适的句型;
  3. 在工作站空闲时完成实验,将结果写入论文中;
  4. 继续学习吴恩达机器学习的系列视频;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1908220.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Nacos注册中心相关错误记录

文章目录 1&#xff0c;com.alibaba.cloud:spring-cloud-starter-alibaba-nacos-discovery:jar:unknown was not found1.1 定位及解决方案1.2&#xff0c;简要说明dependencyManagement的作用 2&#xff0c;nacos启动失败2.1 解决方案 1&#xff0c;com.alibaba.cloud:spring-c…

七大AI绘画软件大比拼!高效且免费!

在当今数字时代&#xff0c;人工智能技术广泛应用于各个行业&#xff0c;包括艺术创作。人工智能绘画软件可以帮助艺术家更快、更有效地创作。然而&#xff0c;市场上人工智能绘画软件的选择也令人眼花缭乱。那么&#xff0c;哪种人工智能绘画软件更好呢&#xff1f;需要明确的…

《UDS协议从入门到精通》系列——图解0x84:安全数据传输

《UDS协议从入门到精通》系列——图解0x84&#xff1a;安全数据传输 一、简介二、数据包格式2.1 服务请求格式2.2 服务响应格式2.2.1 肯定响应2.2.2 否定响应 Tip&#x1f4cc;&#xff1a;本文描述中但凡涉及到其他UDS服务的&#xff0c;均提供专栏内文章链接跳转方式以便快速…

平安消保在行动 | 守护每一个舒心笑容 不负每一场双向奔赴

“要时刻记得以消费者为中心&#xff0c;把他们当做自己的朋友&#xff0c;站在他们的角度去思考才能更好地解决问题。” 谈及如何成为一名合格的消费者权益维护工作人员&#xff0c;平安养老险深圳分公司负责咨诉工作的庞宏霄认为&#xff0c;除了要具备扎实的专业技能和沟通…

大舍传媒:如何在海外新闻媒体发稿报道摩洛哥?

引言 作为媒体行业的专家&#xff0c;我将分享一些关于在海外新闻媒体发稿报道摩洛哥的干货教程。本教程将带您深入了解三个重要的新闻媒体平台&#xff1a;Mediterranean News、Morocco News和North African News。 地中海Mediterranean News Mediterranean News是一个知名…

景芯SoC训练营DFT debug

景芯训练营VIP学员在实践课上遇到个DFT C1 violation&#xff0c;导致check_design_rule无法通过&#xff0c;具体报错如下&#xff1a; 遇到这个问题第一反映一定是确认时钟&#xff0c;于是小编让学员去排查add_clock是否指定了时钟&#xff0c;指定的时钟位置是否正确。 景芯…

Spring AOP源码篇四之 数据库事务

了解了Spring AOP执行过程&#xff0c;再看Spring事务源码其实非常简单。 首先从简单使用开始, 演示Spring事务使用过程 Xml配置&#xff1a; <?xml version"1.0" encoding"UTF-8"?> <beans xmlns"http://www.springframework.org/schema…

SpringBoot的热部署和日志体系

SpringBoot的热部署 每次修改完代码&#xff0c;想看效果的话&#xff0c;不用每次都重新启动代码&#xff0c;等待项目重启 这样就可以了 JDK官方提出的日志框架&#xff1a;Jul log4j的使用方式&#xff1a; &#xff08;1&#xff09;引入maven依赖 &#xff08;2&#x…

Qt QWizard新建向导实例

使用QWizard做新建向导&#xff0c;最简单的实例 class MyWizard : public QWizard { public: MyWizard(QWidget* parent nullptr); QWizardPage* createFirstPage(); QWizardPage* createSecondPage(); QWizardPage* createThirdPage(); }; MyWizard::MyWizard(QWidget* par…

19_谷歌GoogLeNet(InceptionV1)深度学习图像分类算法

1.1 简介 GoogLeNet&#xff08;有时也称为GoogleNet或Inception Net&#xff09;是一种深度学习架构&#xff0c;由Google的研究团队在2014年提出&#xff0c;主要设计者为Christian Szegedy等人。这个模型是在当年的ImageNet大规模视觉识别挑战赛&#xff08;ILSVRC&#xf…

【北京迅为】《i.MX8MM嵌入式Linux开发指南》-第一篇 嵌入式Linux入门篇-

i.MX8MM处理器采用了先进的14LPCFinFET工艺&#xff0c;提供更快的速度和更高的电源效率;四核Cortex-A53&#xff0c;单核Cortex-M4&#xff0c;多达五个内核 &#xff0c;主频高达1.8GHz&#xff0c;2G DDR4内存、8G EMMC存储。千兆工业级以太网、MIPI-DSI、USB HOST、WIFI/BT…

昇思25天学习打卡营第5天|MindSpore网络模型构建

打卡 目录 打卡 模型类 模型网络&#xff1a;定义与使用 模型层级分解 nn.Flatten 张量转换-演示查看 nn.Dense 全连接层-演示查看 nn.ReLU 非线性激活层-演示查看 nn.SequentialCell 有序网络容器 nn.Softmax 多分类概率预测 模型参数 前置感受&#xff1a;总的来说…

跟《经济学人》学英文:2024年07月06日这期:How Starbucks caffeinates local economies

How Starbucks caffeinates local economies Call it the frappuccino effect frappuccino&#xff1a;星冰乐 星巴克如何刺激当地经济&#xff1a;称之为星冰乐效应 原文&#xff1a; Starbucks offers endless opportunities for innovation. Parts of social media del…

Scrapy框架的基本使用教程

1、创建scrapy项目 首先在自己的跟目录文件下执行命令&#xff1a; PS D:\BCprogram\python_pro\bigdata> scrapy startproject theridion_grallatorscrapy startproject 项目名 具体执行操作如下&#xff1a;1、创建项目目录&#xff1a;Scrapy会在当前工作目录下创建一…

OceanBase 配置项系统变量实现及应用详解(1):配置项的定义及使用方法

《OceanBase 配置项&系统变量实现及应用详解》专题导读 在使用OceanBase的过程中&#xff0c;看到大家经常会遇到“参数”、“配置项”、“系统变量”等概念&#xff0c;却不太清楚它们是不是同一个东西&#xff0c;以及应该如何使用。一些对数据库开发感兴趣的朋友&#…

JavaScript总结2

概述 JavaScript是世界上最流行的脚本语言。JavaScript是一种轻量级的编程语言&#xff0c;可以插入HTML页面的编程代码。 JavaScript插入HTML页面后&#xff0c;可由浏览器执行。 特点 语法简单&#xff0c;易学易用&#xff1b; 解释性语言&#xff1b; 跨平台&#xff…

中国各省金融监管水平-测算数据(2006-2022年)

金融监管水平是指政府及其指定机构通过法律法规对金融机构及其市场行为进行监督、管理与规范的能力和效率&#xff0c;以维护金融体系稳定、保护投资者和消费者权益、促进公平竞争及支持经济增长。衡量金融监管水平的指标多样&#xff0c;常见的一种计算方式是金融监管支出与金…

K8s驱逐场景以及规避方案参考 —— 筑梦之路

Pod 驱逐分为两种情况&#xff1a; 较安全驱逐 & 提高稳定性的良性驱逐 API 发起驱逐&#xff0c;典型案例&#xff1a;kubectl drain Node Not Ready 时&#xff0c;Controller Manager 发起的驱逐 有风险的驱逐 节点压力驱逐 节点磁盘空间不足、内存不足 或 Pid 不足&…

jmeter-beanshell学习6-beanshell生成测试报告

前面写了各种准备工作&#xff0c;内容组合用起来&#xff0c;应该能做自动化了&#xff0c;最后一步&#xff0c;生成一个报告&#xff0c;报告格式还是csv 报告生成的路径和文件&#xff0c;在用户参数写好&#xff0c;防止以后改路径或者名字&#xff0c;要去代码里面改。以…

提高Python爬虫的匿名性:代理ip的配置策略

在当今&#xff0c;网络数据采集作为获取行业信息的重要手段&#xff0c;尤其在竞争激烈的商业环境中&#xff0c;Python作为一种强大的编程语言&#xff0c;广泛应用于开发各种数据爬虫来自动化地抓取网络信息。然而&#xff0c;网站普遍采用防护措施&#xff0c;即使我们合规…