Java版本TransH代码的学习

news2025/1/18 3:22:15

主要讲和TransE代码的区别,TransE文章的链接

Java版本TransE代码的学习

关于范数的概念

什么是0范数、1范数、2范数?区别又是什么

 初始化向量

初始化关系平面的向量Wr,初始化向量relation_vec,初始化节点向量entity_vec

        Wr_vec = new double[relation_num][vector_dimension];
        for (int i = 0; i < relation_num; i++) {
            for (int j = 0; j < vector_dimension; j++) {
                Wr_vec[i][j] = uniform(-1, 1);
            }
            norm2one(Wr_vec[i]);
        }

        relation_vec = new double[relation_num][vector_dimension];
        for (int i = 0; i < relation_num; i++) {
            for (int j = 0; j < vector_dimension; j++) {
                relation_vec[i][j] = uniform(-1, 1);
            }
        }

        entity_vec = new double[entity_num][vector_dimension];
        for (int i = 0; i < entity_num; i++) {
            for (int j = 0; j < vector_dimension; j++) {
                entity_vec[i][j] = uniform(-1, 1);
            }
        }

负采样方法

对于 1-N 的关系,赋予更高的概率替换头实体,而对于 N-1 的关系,赋予更高的概率替换尾实体。具体地,对每个关系计算其 tph (每个头实体平均对应几个尾实体)和 hpt (每个尾实体平均对应几个头实体)。对于 tph/tph+hpt 越大的,说明是一对多的关系,在负采样时替换头实体,更容易获得 true negative。

tph:每个头实体平均对应几个尾实体

hpt:每个尾实体平均对应几个头实体

left_num.put(i, sum / count); // tph
right_num.put(i, sum / count);
double pr = 1000 * right_num.get(relation_id) / (right_num.get(relation_id) + left_num.get(relation_id));
if (method == 0) {
    pr = 500;
}
if (rand() % 1000 < pr) {//替换头实体}
   else{//替换尾实体}

计算向量的分数

转换

通过转换,得到

第一个for循环,计算

第二个for循环,计算L2范数的平方,开方以后平方,因为这个向量只有一个值,也就相当于是取绝对值

    static double calc_sum(int head, int tail, int relation) {
        double Wrh = 0;
        double Wrt = 0;
        for (int i = 0; i < vector_dimension; i++) {
            Wrh += Wr_vec[relation][i] * entity_vec[head][i];
            Wrt += Wr_vec[relation][i] * entity_vec[tail][i];
        }

        double sum = 0, tmp;
        for (int i = 0; i < vector_dimension; i++) {
            tmp = (entity_vec[tail][i] - Wrt * Wr_vec[relation][i])
                    - relation_vec[relation][i]
                    - (entity_vec[head][i] - Wrh * Wr_vec[relation][i]);
            sum += abs(tmp);
        }
        return sum;
    }

梯度下降

        if (sum1 + margin > sum2) {
            res = margin + sum1 - sum2;
            gradient(head_a, tail_a, relation_a, -1);
            gradient(head_b, tail_b, relation_b, 1);
        }
    private static void gradient(int head, int tail, int relation, double beta) {
        double Wrh = 0;
        double Wrt = 0;
        for (int i = 0; i < vector_dimension; i++) {
            Wrh += Wr_vec[relation][i] * entity_vec[head][i];
            Wrt += Wr_vec[relation][i] * entity_vec[tail][i];
        }

        double sum = 0;
        for (int i = 0; i < vector_dimension; i++) {
            double delta = (entity_vec[tail][i] - Wrt * Wr_vec[relation][i])
                    - relation_vec[relation][i]
                    - (entity_vec[head][i] - Wrh * Wr_vec[relation][i]);
            double x = (delta > 0) ? 1 : -1;
            sum += x * Wr_vec[relation][i];
            relation_vec[relation][i] -= beta * learning_rate * x;
            entity_vec[head][i] -= beta * learning_rate * x;
            entity_vec[tail][i] += beta * learning_rate * x;
            Wr_vec[relation][i] += beta * x * learning_rate  * (Wrh - Wrt);
        }
        for (int i = 0; i < vector_dimension; i++) {
            Wr_vec[relation][i] += beta * learning_rate * sum * (entity_vec[head][i] - entity_vec[tail][i]);
        }
        norm(relation_vec[relation]);
        norm(entity_vec[head]);
        norm(entity_vec[tail]);

        norm2one(Wr_vec[relation]);
        norm(relation_vec[relation], Wr_vec[relation]);
    }

使用L2范数归一化,先求平方和,再开方

norm(relation_vec[relation]);
       static double vec_len(double[] a) {
        // calculate the length of the vector
        double res = 0;
        for (int i = 0; i < vector_dimension; i++) {
            res += sqr(a[i]);
        }
        return sqrt(res);
    }

        static void norm(double[] a) {
        // limit the element a under 1
        double x = vec_len(a);
        if (x > 1) {
            for (int i = 0; i < vector_dimension; i++) {
                a[i] /= x;
            }
        }
    }

dr与Wr的关系限制,dr就是relation,Wr是relation的映射平面

        norm(relation_vec[relation], Wr_vec[relation]);
    static void norm(double[] a, double[] Wr) {
        double sum = 0;
        while (true) {
            for (int i = 0; i < vector_dimension; i++) {
                sum += sqr(Wr[i]);
            }
            sum = sqrt(sum);
            for (int i = 0; i < vector_dimension; i++) {
                Wr[i] /= sum;
            }

            double x = 0;
            for (int i = 0; i < vector_dimension; i++) {
                x += Wr[i] * a[i];
            }
            if (x > 0.1) {
                for (int i = 0; i < vector_dimension; i++) {
                    double tmp = a[i];
                    a[i] -= learning_rate * Wr[i];
                    Wr[i] -= learning_rate * tmp;
                }
            } else {
                break;
            }
        }
        norm2one(Wr);
    }

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/158636.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

富豪酒店集团全新体验「METAGREEN」上线!边玩边赚,了解可持续发展!

富豪酒店集团推出 MetaGreen 以提高大众对可持续发展的认识&#xff0c;并创造一个多元化的绿色生态系统。 体验将包涵盖数个独特的互动地标&#xff0c;包括环保富豪酒店、大华银行艺术空间、恒生银行元宇宙分行&#xff0c;以及 citysuper、LOG-ON 和 The Mills 等零售商。 …

擎创技术流 | ClickHouse实用工具—ckman教程(9)

哈喽~大家好&#xff0c;时间倏然&#xff0c;上一次ckman分享还是在2022&#xff0c;这一期分享就已经是2023了。由于前段时间小编“成功加入羊群”&#xff0c;导致拖更一周&#xff0c;实在抱歉。希望新的一年大家都可以身体健健康康&#xff0c;事业红红火火&#xff0c;生…

Clarifying Question领域最常见的三个数据集

文章目录Qulacqulac.json:qulac_hist012_dict.tar.gz:MIMICSClariQConvAI3 Data ChallengeStage1: initial datasetStage2: human-in-the-loopClariQ DatasetFile Formattrain.tsv and dev.tsvtest.tsvquestion_bank.tsvdev_synthetic.pkl.tar.gz & train_synthetic.pkl.ta…

【进阶】Spring核心思想及其项目创建

努力经营当下&#xff0c;直至未来明朗&#xff01; 文章目录一、Spring核心思想1. 容器2. IoC3. SpringIoC4. DI概念说明二、Spring的创建和使用1. 创建Spring项目3. Maven项目导入jar包和设置国内源的方法&#xff1a;2. Spring对象的存储/存储Bean对象3. 从Spring中读取到Be…

Electron自定义协议Protocol对web网站做数据交互,使用SSE实时数据推送到网站

(防盗镇楼)本文地址:https://blog.csdn.net/cbaili/article/details/128651549 前言 最近在撸VUE,想要实现一份代码既能构建Web又能构建Electron应用 并且能够判断环境是浏览器还是Electron,随后在Electron中做一些特定的事情 以往的Electron通信依靠IPC通信完成,但是发布到…

模板(template)包含与继承

Django 模板查找机制&#xff1a; Django 查找模板的过程是在每个 app 的 templates 文件夹中找&#xff08;而不只是当前 app 中的代码只在当前的 app 的 templates 文件夹中找&#xff09;。各个 app 的 templates 形成一个文件夹列表&#xff0c;Django 遍历这个列表&#x…

超详细的Socket通信原理和实例讲解

我们深谙信息交流的价值&#xff0c;那网络中进程之间如何通信&#xff0c;如我们每天打开浏览器浏览网页时&#xff0c;浏览器的进程怎么与web服务器通信的&#xff1f;当你用QQ聊天时&#xff0c;QQ进程怎么与服务器或你好友所在的QQ进程通信&#xff1f;这些都得靠socket&am…

【算法篇-排序】八大排序

十大排序0.常见排序1. 插入排序&#xff08;直接插入排序和希尔排序&#xff09;1.1直接插入排序1.2希尔排序&#xff08;缩小增量排序&#xff09;2.选择排序2.1选择排序2. 2堆排序3.交换排序3.1 冒泡排序3.2快速排序3.2.1hoare版本快排3.2.2挖坑法3.2.3前后指针法3.3.4 快排的…

【Linux】在Linux上写一个进度条小程序

&#x1f451;作者主页&#xff1a;安 度 因 &#x1f3e0;学习社区&#xff1a;安度因的学习社区 &#x1f4d6;专栏链接&#xff1a;Linux 文章目录一、前言二、理解 \r 与 \n三、行缓冲1、提出问题2、认识行缓冲3、解答与拓展4、倒计时四、进度条五、结语如果无聊的话&#…

2023/1/12总结

今天学习了图的割点与桥的算法 图的割点以及桥 图的割点&#xff1a;割点是指在无向连通图中&#xff0c;某点和该点连接的边去掉以后图便不再连通 在上面的图片中&#xff08;上面是一个有向图&#xff0c;我们当作无向图即可&#xff09;我们知道当我们去掉A点之后&#xf…

进阶必看 | 6个让Revit建模起飞的习惯,高效就靠它

大家好&#xff0c;这里是建模助手。 相信各位都知道&#xff0c;建模助手一向以来都追求更高&#xff0c;更快&#xff0c;更强。但是有些问题&#xff0c;不是插件本身能解决的事情&#xff0c;而是项目本身的问题。 一般来说&#xff0c;当Revit项目模型大于150MB时&#…

Linux安装sonarqube(含各种错误处理)

目录 1.下载安装 2.错误处理 2.1.JDK版本不适配 2.2.can not run elasticsearch as root 1.下载安装 下载地址&#xff1a; Download | SonarQube | Sonar &#xff08;下载页面向下拉&#xff09;选择稳定版本下载。 解压后启动脚本在&#xff1a; bin/{对应操作系统}…

【dp】买卖股票的最佳时机系列题目

文章目录121. 买卖股票的最佳时机122. 买卖股票的最佳时机 II309. 最佳买卖股票时机含冷冻期123. 买卖股票的最佳时机 III188. 买卖股票的最佳时机 IV121. 买卖股票的最佳时机 本题的重点是&#xff1a;只能在前面某一天买入&#xff0c;后面某一天卖出。要不就是不买入&#x…

外贸业务员怎样能提高自己的工作能力?

关于外贸业务员提高自己的工作能力&#xff0c;米贸搜整理如下&#xff0c;希望可以帮助到你&#xff1a;1.树立一个好的目标&#xff0c;并坚定不移地朝着这个目标努力。这个问题&#xff0c;无论你是新手还是有经验的外贸业务员&#xff0c;相信每个外贸业务员都或多或少的思…

K_A11_004 基于STM32等单片机采集热敏传感参数串口与OLED0.96双显示

K_A11_004 基于STM32等单片机采集热敏传感参数串口与OLED0.96双显示一、资源说明二、基本参数参数引脚说明三、驱动说明IIC地址/采集通道选择/时序对应程序:四、部分代码说明1、接线说明1.1、STC89C52RC热敏传感模块1.2、STM32F103C8T6热敏传感模块五、基础知识学习与相关资料下…

NCS8823替代方案|CS5260Typec转VGA可替代NCS8823|低BOM成本替代NCS8823设计

NCS8823替代方案|CS5260Typec转VGA可替代NCS8823|低BOM成本替代NCS8823设计 NCS8823是一款低功耗、DisplayPort信号至VGA转换器,通过USB Type-C连接器。它是 适用于USB Type-C至VGA转换器&#xff0c;适配器、对接设备。此设备结合了基于USB Type-C的 DisplayPort接收器和VGA…

华为私有云平台FusionCompute搭建

一、FusionCompute架构 架构CNA作为虚拟化操作系统&#xff0c;VRM作为虚拟化管理平台正常主机都安装CNA&#xff0c;单独建立VRM集群作为管理集群&#xff0c;我测试环境就一台主机&#xff0c;所以CNA和VRM装在同一台主机上&#xff0c;并且用这台主机分配虚拟机进行测试。 …

前端基础(十二)_函数高级、全局变量和局部变量、 预解析(变量提升)、函数返回值

作用域 作用域指&#xff1a;变量或函数的有效使用范围&#xff0c;有全局作用域与局部作用域两种。 全局变量和局部变量 全局变量&#xff1a;直接在 script 标签下声明的变量&#xff0c;任何地方都能访问&#xff0c;任何地方都能对其值进行改变。 局部变量&#xff1a;函…

CAN总线的个人理解

部分内容可以参考&#xff1a;https://blog.csdn.net/xwwwj/article/details/105372234? CAN概念简介 CAN是Controller Area Network 的缩写 CAN协议经过ISO标准化后有两个标准&#xff1a;ISO11898标准和ISO11519-2标准。其中ISO11898是针对通信速率为125Kbps~1Mbps的高速通…

适合制造业的ERP推荐?使用ERP系统的好处有哪些?

对于制造型企业来说&#xff0c;除了涉及到产品的生产制造和原料采购&#xff0c;还需要管理库存、销售、财务等方方面面。制造业的ERP系统的使用&#xff0c;尤为重要。一个好的制造业的ERP系统在企业管理中起到至关重要的作用&#xff0c;针对制造业的ERP系统提供贴合行业特性…