激活函数 Sigmod 及其导数

news2025/1/11 14:31:13

文章目录

  • 1. Sigmod 函数
  • 2. 取值
  • 3. 图像
  • 4. 导数

1. Sigmod 函数

Sigmod 函数是神经网络中最常用的激活函数之一,其形式如下:
sigmod ( x ) = f ( x ) = 1 1 + e − x . \text{sigmod}(x) = f(x) = \frac{1}{1 + e^{-x}}. sigmod(x)=f(x)=1+ex1.

2. 取值

分析:
(1)当 x = 0 x=0 x=0 时,
f ( x ) = f ( 0 ) = 1 1 + e − 0 = 1 2 . f(x) = f(0) = \frac{1}{1+e^{-0}} = \frac{1}{2}. f(x)=f(0)=1+e01=21.
(2)当 x → + ∞ x \to +\infty x+ 时, e − x → 0 e^{-x} \to 0 ex0,由此 f ( x ) → 1 f(x) \to 1 f(x)1
(3)当 x → − ∞ x \to -\infty x 时, e − x → + ∞ e^{-x} \to +\infty ex+,由此 f ( x ) → 0 f(x) \to 0 f(x)0

由此,sigmod 函数的取值范围是 [ 0 , 1 ] [0, 1] [0,1],且单调递增。

3. 图像

我们用 Python 画一画它的图像出来:
在这里插入图片描述
实现的 Python 代码如下:

import numpy as np
from matplotlib import pyplot as plt


x = np.linspace(-100, 100, 10000)
y = 1 / (1 + np.exp(-x))
plt.plot(x, y, linestyle='-', color='blue', linewidth=6)
plt.show()

4. 导数

f ′ ( x ) = ( 1 1 + e − x ) ′ = − 1 ( 1 + e − x ) 2 ( 1 + e − x ) ′ = − 1 ( 1 + e − x ) 2 e − x ( − x ) ′ = − 1 ( 1 + e − x ) 2 e − x ( − 1 ) = e − x ( 1 + e − x ) 2 = ( 1 − 1 ) + e − x ( 1 + e − x ) 2 = ( 1 + e − x ) − 1 ( 1 + e − x ) 2 = 1 1 + e − x − 1 ( 1 + e − x ) 2 = f ( x ) − f 2 ( x ) = f ( x ) ( 1 − f ( x ) ) . \begin{aligned} f'(x) &= \left(\frac{1}{1+e^{-x}} \right)' \\ &= - \frac{1}{\left(1+e^{-x}\right)^2} \left(1+e^{-x} \right)' \\ &= - \frac{1}{\left(1+e^{-x}\right)^2} e^{-x} (-x)' \\ &= - \frac{1}{\left(1+e^{-x}\right)^2} e^{-x} (-1) \\ &= \frac{e^{-x}}{\left(1+e^{-x}\right)^2} = \frac{(1-1) + e^{-x}}{\left(1+e^{-x}\right)^2} = \frac{(1 + e^{-x}) -1}{\left(1+e^{-x}\right)^2} \\ &= \frac{1}{1 + e^{-x}} - \frac{1}{\left(1 + e^{-x}\right)^2} \\ &= f(x) - f^2(x) \\ &= f(x) \left(1-f(x) \right). \end{aligned} f(x)=(1+ex1)=(1+ex)21(1+ex)=(1+ex)21ex(x)=(1+ex)21ex(1)=(1+ex)2ex=(1+ex)2(11)+ex=(1+ex)2(1+ex)1=1+ex1(1+ex)21=f(x)f2(x)=f(x)(1f(x)).

即: f ′ ( x ) = f ( x ) ( 1 − f ( x ) ) f'(x) = f(x) \left(1-f(x) \right) f(x)=f(x)(1f(x))

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2105445.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大模型理论基础

大模型理论基础与学习路径 1.大模型的理论基础,包括深度学习、预训练语言模型和大语言模型。 2.学习大模型开发的路径,包括理论学习、实践操作和项目应用。 3.如何通过理论学习提升上限,为深入学习大模型奠定基础。 GPT模型家族技术发展 1.GP…

数据结构——堆排序

目录 引言 堆排序 1.算法思想 2.算法步骤 3.代码实现 3.1 构建堆 (1)小堆 (2)大堆 3.2 交换与调整 3.3 重复上述过程 4.复杂度分析 5.完整代码 5.1算法实现代码 5.2 示例 6.堆排序的优势 结束语 引言 本篇博客,我们将利用堆结构实现的高效排序算法…

版本控制的核心:Git中的哈希与默克尔树解析

Git是最常用的代码版本控制工具。它帮助我们跟踪代码的更改、管理代码版本,同时保证代码库的完整性和安全性。我们知道 Git 中有一些基本的操作,比如commit、merge、rebase等,但这些操作的底层机制是如何实现的呢?哈希函数和默克尔…

深度学习|模型推理:端到端任务处理

文章目录 引言端到端的能力任务与模型简介手写数字识别数据准备训练集与测试集模型介绍 推理过程前向传播权重参数推理与评估 结语 引言 通过前文「深度学习|感知机:神经网络之始」中 XOR Gate 的示例,我们知道叠加层可以增强感知机的表达能…

单向链表排序及双向链表

单向链表的优缺点 优点:存储空间没有上限,插入删除效率高 缺点:修改和查找效率低,只能单向的向后遍历后续节点,不能向前遍历前驱节点 单向链表快慢指针法查找: 链表的排序 双向链表 由于单向链表只能通…

Linux 性能调优:策略与实践

引言 随着云计算和虚拟化技术的发展,Linux 已经成为企业和个人用户的首选操作系统。Linux 性能调优不仅有助于提高系统资源利用率,还能确保应用程序的高效运行。本文将探讨 Linux 性能调优的基本原则、常用工具和方法,以及实际案例分析。 一…

go中的并发处理

. Goroutines 概念: Goroutines 是 Go 的核心并发机制。它们是由 Go 运行时管理的轻量级线程,具有比操作系统线程更少的开销。每个 goroutine 只需少量的内存(大约 2KB),并且由 Go 运行时负责调度和管理,哪怕是java发…

哈希表与统计——594、350、554、609、454(2简3中)

594. 最长和谐子序列(简单) 和谐数组是指一个数组里元素的最大值和最小值之间的差别 正好是 1 。 现在,给你一个整数数组 nums ,请你在所有可能的子序列中找到最长的和谐子序列的长度。 数组的子序列是一个由数组派生出来的序列&a…

华大HC32F460移植FreeRTOS

参考: 关于MCU M4内核移植FreeRTOS的笔记 主要参考这位大佬的,照做就行了,用的也是IAR HC32F460 freeRTOS移植 这位是用Keil的 MCU:华大HC32F460 库版本:hc32f460_ddl_Rev2.2.0 IDE: IAR FreeRTOS版本&…

【多线程】概述

进程与线程 概述 一个正在运行过程中的程序,就是一个进程,也称一个任务。进程是一个重要的软件资源,是由操作系统内核管理和组织的。 并行:微观上同一个时刻,两个核心上的进程,就是同时进行的。 并发&…

遗传算法Github初学

遗传算法的理论是根据达尔文进化论而设计出来的算法:人类是朝着好的方向(最优解)进化,进化过程中,会自动选择优良基因,淘汰劣等基因 遗传算法(genetic algorithm——GA)是计算数学中…

【JavaScript】LeetCode:11-15

文章目录 11 最长连续序列12 移动零13 盛最多水的容器14 三数之和15 接雨水 11 最长连续序列 数组排序、去重遍历数组中的元素,当元素连续时,长度加1,当不连续时,长度设置为1。 /*** param {number[]} nums* return {number}*/ v…

AI科学家:自动化科研的未来之路

随着人工智能(AI)技术的不断进步,AI已经在众多领域中展现了强大的潜力,尤其是在科研方面的应用正在引起广泛关注。最近,Sakana AI与牛津大学和不列颠哥伦比亚大学联合推出了一款被称为“AI科学家”的自动化科研工具&am…

第4章-01-学会从Chrome浏览器中Network

🏆作者简介,黑夜开发者,CSDN领军人物,全栈领域优质创作者✌,CSDN博客专家,阿里云社区专家博主,2023年CSDN全站百大博主。 🏆数年电商行业从业经验,历任核心研发工程师,项目技术负责人。 🏆本文已收录于专栏:Web爬虫入门与实战精讲,后续完整更新内容如下。 文章…

【Canvas与纹饰】环形小蜜蜂纹饰

【成图】 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>环形小蜜蜂纹饰</title><style type"text/css"&g…

Mysql基础练习题 1378.使用唯一标识符替换员工ID (力扣)

1378. 展示每位用户的 唯一标识码&#xff08;unique ID &#xff09;&#xff1b;如果某位员工没有唯一标识码&#xff0c;使用 null 填充即可。 你可以以任意顺序返回结果表。 题目链接&#xff1a; https://leetcode.cn/problems/replace-employee-id-with-the-unique-i…

k8s调度、污点、容忍、不可调度、排水、数据卷挂载

一、Kubernetes的list-watch机制 1、List-watch K8S集群中&#xff0c;通过List-watch机制进行每个组件的协作&#xff0c;保持数据同步。这种设计可以实现每个组件之间的解耦 kubectl配置文件&#xff0c;统一向集群内部apiserver发送命令——通过apiserver把命令发送到各个…

C# 不安全代码

当一个代码块使用 unsafe 修饰符标记时&#xff0c;C# 允许在函数中使用指针变量。不安全代码或非托管代码是指使用了指针变量的代码块。 指针变量 指针 是值为另一个变量的地址的变量&#xff0c;即&#xff0c;内存位置的直接地址。就像其他变量或常量&#xff0c;您必须在…

【系统架构设计师-2022年】综合知识-答案及详解

文章目录 【第1题】【第2题】【第3题】【第4题】【第5题】【第6~7题】【第8题】【第9题】【第10题】【第11~12题】【第13题】【第14题】【第15题】【第16题】【第17~18题】【第19题】【第20题】【第21题】【第22题】【第23题】【第24题】【第25题】【第26题】【第27题】【第28题…

力扣刷题(复习版2)

题目&#xff1a; 计数质数 原题链接&#xff1a; 计数质数 题解 public int countPrimes(int n) {if (n < 2) return 0;// boolean 数组&#xff0c;初始时假设所有数都是质数boolean[] isPrime new boolean[n];Arrays.fill(isPrime, true); // 全部初始化为true// 从 …