Dirichlet Process 1

news2024/11/26 0:28:08

如下图的一个简单样本,如果我们不知道图中的样本是出自几个高斯分布,那我们如果求这个图中的样本应该归属于几个高斯分布那?直观看上去,有同学可能说是4个,有同学可能说是2个,然而如果是高维数据那?可能我们画都没有办法把它画出来,这个时候连直观上去猜都没有办法猜。

 

 这个问题实际上是一个数据的统计聚类问题。

这里假设如果每个数据都给一个参数,

         x_{1} \quad \theta _{1} \newline x_{2} \quad \theta _{2}\newline \quad .\quad\quad . \newline \quad .\quad\quad . \newline \quad .\quad\quad . \newline x_{n} \quad \theta _{n}

并且假设\theta _{i} \sim H(\theta )

这里面如果H(\theta )是一个连续的分布,那么P\{\theta _{i} = \theta _{j}\} = 0

所以\theta _{i}不能从一个连续的分布中来取。

那么我们想通过一种方法,获得H的一个离散的版本,即G\sim DP(\alpha ,H),这里面的DP代表Dirichlet Process,即狄利克雷过程,这里面的\alpha是一个scalar,且\alpha > 0\alpha表征H的离散版本G有多离散,\alpha越小,G越离散;\alpha越大,G越不离散。极端情况,\alpha = 0,那么G就是一个值,如果\alpha \rightarrow \infty,G就是H。

G被称为H的随机测度。

总结,任意一个样本x_{i}都对应一个产生它的分布,且这个分布的参数为\theta _{i}\theta _{i}又出自分布H,H可能是连续的也可能是离散的,可以同归DP产生G的一个随机测度

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/716051.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2023年艺术品和古董行业研究报告

第一章 行业概况 艺术品通常指的是创造出来为了表达审美、情感或思想的物品,如绘画、雕塑、照片、装置艺术等。艺术品的价值常常来自于它的创新性、技术精湛以及艺术表达的深度和力度。此外,艺术家的名气和作品的历史背景也会影响其价值。 古董则通常指…

Dev C++ 建立项目 导入代码

首先 建立项目 文件->新建->建项目 会自己添加一个main.cpp 的文件,不需要的话,可以右键移除文件。 往项目里添加文件; 添加后: 编译运行,成功;

【shell】正则表达式:常见通配符、元字符与转义符

文章目录 一. 定义二. 常见通配符1. 匹配一个1.1 " . " 点符号1.2. " ? "符号:代表任意一个1.3. " $ "符号:匹配尾部1.4. " [] "符号1.5. " ^ "符号和" ! "符号 2. 匹配多个2.1. " *…

数据结构-树、二叉树

一、概念 1、树的概念 树是一种非线性的数据结构,它是由n(n>0)个有限结点组成一个具有层次关系的集合。把它叫做树,是因为它看起来像是一棵倒挂的树,也就是说它的根在上,而叶子在下。 如果一个数的结点n为0,那么这…

图论算法:DFS求有向图或无向图两点间所有路径及最短路径

1、目的 根据有向图获取指定起终点的所有路径,包括最长和最短路径。 2、示例效果 2.1 原始数据 路线起终点整理如下: // 共计12个顶点,19条边。 (起点,终点,1)最后的1代表起点终点是连通的。 起点,终点,1:2 4 1 起点,终点,1:9 10 1 起点,终点,1:8 11 1 起点…

易基因: RRBS揭示基于DNA甲基化驱动基因的肾透明细胞癌预后模型的鉴定和验证|项目文章

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 肾细胞癌(RCC)是最常见的肾癌亚型,每年超400万例新发病例,是泌尿系统恶性肿瘤导致的第二大死因。2%-70%的RCC为透明细胞RCC(Cl…

node.js使用nodemailer发送阿里云企业邮箱的邮件

百度一搜就能搜到各种博客例子,但是有个问题:有些参数写的不明不白的,我在发送的时候总是报错 后面看到了一篇博客: 基于nodemailer使用阿里云企业邮箱发送邮件(526错误的解决) 注意几点: …

【现场问题】flink-cdc,sql一直校验不通过,为什么,明明sql没有错误

flink-cdc 问题展示问题解决校验结果 问题展示 这里的flink-cdc的sql对了好几遍,都没问题,包括单个执行create,也是显示校验通过 如图: 但是多个一起就报错了: java.lang.IllegalArgumentException: only single state…

奇点云DataSimba R4.9 LTS发布:稳定性加固,架构升级,142项功能上新

不久前,奇点云的数据云全系产品如期发布新一季商业化版本更新: 数据云平台DataSimba:R4.9 LTS版发布,稳定性全面加固,功能上新;自R4系列起架构升级,封装底层复杂性,支撑上层快速构建…

git代码合并merge与rebase

一、概述 1.区别 Merge具有更高的可追溯性 保留真实的历史,而Rebase则更整洁且易于审核。 rebase:不会有单独的commit合并记录,直接将分支中的所有commit排到master的记录之后。 merge:将在子分支的所有提交记录成一次commit,作为单独的一…

机器学习实战:Python基于LR线性回归进行预测(十)

文章目录 1 前言1.1 LR的介绍1.2 LR的应用 2. weather数据集实战演示2.1 导入函数2.2 导入数据2.3 数据整体可视化2.4 训练模型2.5 预测模型2.6 评估模型 3.讨论 1 前言 注意这里的LR指的是Linear Regression,线性回归。而非逻辑回归Logistic Regression&#xff0c…

【QT】——TCP套接字通信

目录 1.基本概念 2.QTcpServer 2.1 常用接口 2.2信号 3 QTcpSocket 3.1构造函数 3.2 连接函数 3.3 接收数据 3.4 发送数据 3.5 信号 4.通信的过程 4.1服务器端 4.2 客户端 通信流程: 1.基本概念 QT是 C 的一个框架,并且里边提供了用于套接…

让你不再好奇ai绘画免费网站有哪些

你有没有想过成为一名画家,但是缺乏绘画技巧?现在有了 ai作画生成器,让你可以轻松地创作出绝美的艺术品!现在有很多ai作画的免费网站,但是这些网站大多数操作繁琐,不易上手。这时我们可以寻求一款趁手的ai绘…

【算法与数据结构】剑指 Offer 58 - II. LeetCode左旋转字符串

文章目录 一、题目二、解法三、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、解法 思路分析:以例一为例,例一的字符串可以分为"ab" "cdefg"两个子串,首…

element Plus Select选择器实现查询搜索 下拉选择

这Select选择器用于哪里 怎么用? Select 选择器可以用于许多不同的场景,包括但不限于以下几个方面: 表单:Select 选择器常用于表单中的下拉选择字段,例如选择国家、城市、性别、职位等。用户可以从预定义的选项中选择…

软考:中级软件设计师:计算机体系结构,CISC和RISC,Flynn分类,指令流水线,吞吐率,效率

软考:中级软件设计师:计算机体系结构 提示:系列被面试官问的问题,我自己当时不会,所以下来自己复盘一下,认真学习和总结,以应对未来更多的可能性 关于互联网大厂的笔试面试,都是需要细心准备的…

Win10任务栏的天气怎么关闭?Win10任务栏的天气关闭方法

Win10任务栏的天气怎么关闭?Win10任务栏的天气功能可以提供即时的天气信息,方便用户随时获取当前和未来的天气预报。然而,对于一些用户来说,这个天气小部件可能并不是必需的,并且想要关闭它以腾出任务栏的空间。无论是…

工程师抓秃头总结卡尔曼滤波简单原理及收敛原因

1、关于矩阵的一些想法 有小伙伴看到矩阵就脑瓜壳疼,那是没有了解数学家为啥闲的没事要用矩阵呢,从来没有人说不用矩阵就算不了,矩阵最初我认为是数学家偷懒,因为写一堆方程字太多太长,所以用了简写的形式,…

【SAP-MDG】售前常见问题

在与甲方的交流过程中,常常会有以下几个问题 一、“为什么要上主数据管理系统?” 见:主数据管理的意义 二、“有了主数据管理机制,还要不要上主数据管理平台?” 主数据的管理机制是通用性的,我们在任何系…

【算法与数据结构】28、LeetCode实现strStr函数

文章目录 一、题目二、暴力穷解法三、KMP算法四、Sunday算法五、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、暴力穷解法 思路分析:首先判断字符串是否合法,然后利用for循环&#xff…