hive引入外部函数-java实现

news2025/1/10 20:40:42

引入依赖

<dependency>
	 <groupId>org.apache.hive</groupId>
	 <artifactId>hive-exec</artifactId>
	 <version>3.1.2</version>
</dependency>

编写函数

注意必须要继承GenericUDF 类

import org.apache.hadoop.hive.ql.exec.UDFArgumentException;
import org.apache.hadoop.hive.ql.metadata.HiveException;
import org.apache.hadoop.hive.ql.udf.generic.GenericUDF;
import org.apache.hadoop.hive.serde2.objectinspector.ObjectInspector;
import org.apache.hadoop.hive.serde2.objectinspector.primitive.PrimitiveObjectInspectorFactory;

public class SimilarEval extends GenericUDF {
    /**
     * 初始化方法，一般用来校验数据参数个数，返回值是int类型的PrimitiveObjectInspectorFactory
     * @param objectInspectors
     * @return
     * @throws UDFArgumentException
     */

    @Override
    public ObjectInspector initialize(ObjectInspector[] objectInspectors) throws UDFArgumentException {
        if (objectInspectors.length != 2){
            //判断参数个数是否为2，抛出异常
            throw new UDFArgumentException("参数个数必须为2，请重新输入");
        }
        return PrimitiveObjectInspectorFactory.javaIntObjectInspector;
    }

    /**
     * 业务逻辑处理方法
     * @param
     * @return
     * @throws HiveException
     */

    @Override
    public Object evaluate(DeferredObject[] deferredObjects) throws HiveException {
        //获取输入的参数
        String targetStr = deferredObjects[0].get().toString();
        String sourceStr = deferredObjects[1].get().toString();
        //判断输入数据是否为null，如果为null，返回0
        if (targetStr == null || sourceStr == null){
            return 0;
        }else{
            //输入数据不为null，进行业务处理
            int tar_len = targetStr.length();
            int b = 0;
            for (int i = 0; i < tar_len; i++) {
                String tmpChar = targetStr.substring(i,i+1);
                int a = sourceStr.indexOf(tmpChar);
                if (a >= 0){
                    a+=1;
                    b = b +1;
                } else{
                    a = 0;
                }
            }
            int result = (int) Math.round((b*100)/(double)tar_len);
            return result;
        }
    }

    /**
     *
     * @param strings
     * @return
     */
    @Override
    public String getDisplayString(String[] strings) {
        return "";
    }
}

项目结构

在这里插入图片描述

打成jar包，并上传到linux服务器，将jar包添加到hive指定路径

# 将jar包添加到hive指定路径
add jar hdfs:/stq/ltdq/jars/SimilarEval-1.0-SNAPSHOT.jar;
# 创建函数
create function similar_eval as 'SimilarEval';

使用效果

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/694533.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

hive引入外部函数-java实现

引入依赖

编写函数

项目结构

打成jar包，并上传到linux服务器，将jar包添加到hive指定路径

使用效果

相关文章

5.按键输入

vue中实现将html导出为word文档

第11讲：使用ajax技术实现文件上传功能（jQuery）

【单片机】MSP430 单片机多路温度巡回检测仪的设计

深度学习笔记之一看数据

Java-多线程

六、动画 - 旋转的应用例子，时钟

关于三元运算符强转的问题

CSS基础学习--23 CSS属性选择器

Linux_CentOS_7.9修改更新默认时区

Proteus仿真之DAC(DAC0832)

直播间自定义公屏视图的升级之路（View版）

蓝库云|企业如何建立自己的供应商管理系统？零代码工具带来惊喜

LangChain 使用文本描述的方式操作MySQL中的数据

HTML5 Canvas动画实例

如何让VSCode不生成 tempcoderunnerfile.py

【Linux】Ubuntu20.04使用xrdp远程桌面时，gnome桌面环境没有最小化、任务栏等问题

Mediapipe 人像分割；实时更换背景；人脸添加特效

idea生成serialVersionUID序列号

springboot 停车场管理系统-计算机毕设附源码82061