开源模型应用落地-工具使用篇-向量数据库进阶(四)

news2025/1/10 1:45:55

一、前言

    通过学习"开源模型应用落地"系列文章,我们成功地建立了一个完整可实施的AI交付流程。现在,我们要引入向量数据库,作为我们AI服务的二级缓存。本文将继续基于上一篇“开源模型应用落地-工具使用篇-向量数据库(三)”详细介绍如何通过Java来使用Milvus Lite来为我们的AI服务部署一个前置缓存。


二、术语

2.1、向量数据库

    向量数据库是一种专门用于存储和处理高维向量数据的数据库系统。与传统的关系型数据库或文档数据库不同,向量数据库的设计目标是高效地支持向量数据的索引和相似性搜索。

    在传统数据库中,数据通常是以结构化的表格形式存储,每个记录都有预定义的字段。但是,对于包含大量高维向量的数据,如图像、音频、文本等,传统的数据库模型往往无法有效地处理。向量数据库通过引入特定的数据结构和索引算法,允许高效地存储和查询向量数据。

    向量数据库的核心概念是向量索引。它使用一种称为向量空间模型的方法,将向量映射到多维空间中的点,并利用这种映射关系构建索引结构。这样,当需要搜索相似向量时,可以通过计算向量之间的距离或相似度来快速定位相似的向量。

2.5、Milvus

    是一个开源的向量数据库引擎,专门用于存储和处理大规模高维向量数据。它提供了高效的向量索引和相似性搜索功能,使用户能够快速地进行向量数据的存储、查询和分析。

    Milvus的设计目标是为了满足现代应用中对大规模向量数据的需求,例如人脸识别、图像搜索、推荐系统等。它采用了向量空间模型和多种索引算法,包括倒排索引、近似最近邻(Approximate Nearest Neighbor,ANN)等,以支持高效的相似性搜索。

    Milvus提供了易于使用的编程接口和丰富的功能,使用户可以方便地插入、查询和分析向量数据。它支持多种数据类型的向量,包括浮点型、整型等,也支持多种距离度量方法,如欧氏距离、余弦相似度等。

    Milvus还提供了分布式部署和横向扩展的能力,可以在多台机器上构建高可用性和高性能的向量数据库集群。它支持数据的分片和负载均衡,可以处理大规模数据集和高并发查询。

2.2、Milvus Lite

    是Milvus向量数据库的一个轻量级版本。旨在提供在资源受限的环境中快速、高效地进行向量存储和相似性搜索的能力。

    与完整版的Milvus相比,它具有以下特点:

  • 轻量级:Milvus Lite具有较小的存储占用和内存消耗,适合在资源受限的设备上部署和运行。
  • 快速部署:Milvus Lite提供了简化的部署和配置过程,使其更易于在嵌入式设备和边缘服务器上进行部署和集成。
  • 高效的向量索引和搜索:尽管是轻量级版本,Milvus Lite仍然提供了高效的向量索引和相似性搜索功能,以支持快速的向量数据查询。
  • 离线模式:Milvus Lite支持在离线模式下进行向量索引和搜索,无需实时连接到远程服务器。

2.3、Attu

    是Milvus 的高效开源管理工具。 它具有直观的图形用户界面(GUI),使您可以轻松地与数据库进行交互。

2.4、Milvus 支持的索引类型

  • FLAT: 是一种无索引的类型,它会对所有的向量进行暴力搜索,保证 100% 的召回率,但是查询速度较慢,适用于数据量较小或者对精度要求很高的场景
  • IVF_FLAT: 是一种基于倒排文件(Inverted File)的索引类型,它会先对向量进行聚类,然后在每个聚类中建立 FLAT 索引,查询时只需要在最近的聚类中搜索,可以加速查询,但是需要指定聚类数量和查询数量,适用于数据量较大或者对速度要求较高的场景
  • IVF_SQ8: 是一种基于倒排文件和量化(Quantization)的索引类型,它会先对向量进行聚类,然后在每个聚类中使用乘积量化(Product Quantization)将向量压缩为 8 位整数,查询时只需要在最近的聚类中搜索,并使用查找表(Lookup Table)进行距离计算,可以节省存储空间和加速查询,但是会损失一定的精度,适用于数据量很大或者对存储空间要求较高的场景
  •  IVF_PQ: 是一种基于倒排文件和量化的索引类型,它会先对向量进行聚类,然后在每个聚类中使用乘积量化将向量压缩为 8 位整数,并使用倒排表(Inverted List)存储压缩后的向量,查询时只需要在最近的聚类中搜索,并使用查找表进行距离计算,可以节省存储空间和加速查询,但是会损失一定的精度,适用于数据量很大或者对存储空间要求较高的场景
  • GPU_IVF_FLAT: 是一种基于 GPU 的倒排文件索引类型,它与 IVF_FLAT 索引相似,但是可以利用 GPU 的并行计算能力来加速查询,适用于数据量较大或者对速度要求很高的场景
  • GPU_IVF_PQ: 是一种基于 GPU 的倒排文件和量化索引类型,它与 IVF_PQ 索引相似,但是可以利用 GPU 的并行计算能力来加速查询,适用于数据量很大或者对速度要求很高的场景
  •  HNSW :是一种基于层次化导航图(Hierarchical Navigable Small World)的索引类型,它会构建一个多层次的图结构来表示向量之间的近邻关系,并使用启发式搜索算法来快速找到最近邻向量,可以实现高速高召回的查询,但是需要指定树的数量和搜索深度等参数,适用于数据维度较高或者对精度要求较高的场景
  • DISKANN :是一种基于磁盘分区和近似最近邻搜索(Disk-based Partitioned Approximate Nearest Neighbor Search)的索引类型,它会将向量划分为多个磁盘分区,并在每个分区中构建 HNSW 索引,并使用多线程并行搜索算法来快速找到最近邻向量,可以实现高效地检索海量数据,但是需要指定分区数量和线程数量等参数,适用于数据量极大或者对存储空间要求较高的场景。

 三、使用方式

3.1、架构示意图

这里的Milvus Lite部署在内网,位于业务服务和AI服务的中间,作为AI服务的二级缓存(一级缓存为Redis),为AI服务减缓负载压力。

3.2、安装Milvus Lite

     1. 创建虚拟环境

         conda create --name milvus python=3.10

     2. 激活虚拟环境

        conda activate milvus

     3.  安装milvus包

        pip install milvus

3.3、编写Milvus Lite服务端代码

   此处将Milvus Lite作为 Python 模块启动

from milvus import default_server

def start_server():
    default_server.start()

def stop_server():
    default_server.stop()

if __name__ == '__main__':
    with default_server:
        start_server()

        input("按下任意键继续...")

3.4、启动Milvus Lite服务

    python -u 上述代码的文件名

    

    启动完成后,会监听19530端口

3.5、安装Milvus客户端管理工具

    下载地址:Releases · zilliztech/attu · GitHub

3.6、登录Milvus Lite服务端

    注意根据实际情况调整IP和端口,默认端口为19530

登录进去,就能看到如下信息:


四、业务整合

业务数据需要提前初始化到向量数据库中

4.1、导入maven依赖

<dependency>
    <groupId>io.milvus</groupId>
    <artifactId>milvus-sdk-java</artifactId>
    <version>2.2.2</version>
</dependency>

PS: 我的JDK是1.8版本,若milvus版本太高,会出现兼容性问题,需要注意

maven仓库地址:Maven Repository: io.milvus » milvus-sdk-java

4.2、连接milvus服务端

 public static MilvusServiceClient connect_db(String uri) {
        MilvusServiceClient milvusClient = new MilvusServiceClient(
                ConnectParam.newBuilder()
                        .withUri(uri)
//                    .withToken("root:Milvus")
                        .build()
        );
        return milvusClient;
}

4.3、创建集合

public static Map<String, String> create_collection(MilvusServiceClient milvusClient, String collection_name, String description, int shardsNum, List<FieldType> fieldTypes) {
        if (StringUtils.isEmpty(collection_name) || StringUtils.isBlank(collection_name)) {
            log.warn("集合名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (CollUtil.isEmpty(fieldTypes)) {
            log.warn("集合字段为空.");
            return MapUtil.builder("status", "1").build();
        }

        CreateCollectionParam.Builder builder = CreateCollectionParam.newBuilder().withCollectionName(collection_name)
                .withShardsNum(shardsNum);

        for (FieldType fieldType : fieldTypes) {
            builder.addFieldType(fieldType);
        }

        if (StringUtils.isNotEmpty(description) && StringUtils.isNotBlank(description)) {
            builder.withDescription(description);
        }

        CreateCollectionParam createCollectionReq = builder.build();

        R<RpcStatus> rstatus = milvusClient.createCollection(createCollectionReq);

        return buildResult(rstatus);
    }

创建成功后:

4.4、插入数据

public static Map<String, String>  insert_data(MilvusServiceClient milvusClient, String collection_name,List<InsertParam.Field> fields){
        if (StringUtils.isEmpty(collection_name) || StringUtils.isBlank(collection_name)) {
            log.warn("集合名称为空.");
            return MapUtil.builder("status", "1").build();
        }
        if (CollUtil.isEmpty(fields)) {
            log.warn("插入数据为空.");
            return MapUtil.builder("status", "1").build();
        }

        InsertParam insertParam = InsertParam.newBuilder()
                .withCollectionName(collection_name)
                .withFields(fields)
                .build();

        R<MutationResult> mutationResultR = milvusClient.insert(insertParam);

        String status = String.valueOf(mutationResultR.getStatus());
        MapBuilder<String, String> mapBuilder = MapUtil.builder("status", status);
        MutationResult mutationResult = mutationResultR.getData();
        if(null != mutationResult){
            long insert_cnt = mutationResult.getInsertCnt();
            if(insert_cnt > 0){
                mapBuilder.put("msg","插入成功");
            }
        }

        milvusClient.flush(FlushParam.newBuilder()
                .addCollectionName(collection_name)
//                .withSyncFlush(true)
                .build());

        log.info("MutationResult: {}",mutationResultR);
        return mapBuilder.build();
    }

插入成功后(需要调用flush才能立刻看到数据):

4.5、创建索引

public static Map<String, String> create_index(MilvusServiceClient milvusClient, String collection_name, String index_column, String index_name, String params) {
        if (StringUtils.isEmpty(collection_name) || StringUtils.isBlank(collection_name)) {
            log.warn("集合名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (StringUtils.isEmpty(index_column) || StringUtils.isBlank(index_column)) {
            log.warn("索引字段为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (StringUtils.isEmpty(index_name) || StringUtils.isBlank(index_name)) {
            log.warn("索引名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        CreateIndexParam.Builder builder = CreateIndexParam.newBuilder()
                .withIndexName(index_name)
                .withCollectionName(collection_name)
                .withFieldName(index_column)
                .withIndexType(IndexType.IVF_FLAT)
                .withMetricType(MetricType.IP)
                .withSyncMode(Boolean.FALSE);

        if (StringUtils.isNotEmpty(index_name) && StringUtils.isNotBlank(index_name)) {
            builder = builder.withExtraParam(params);
        }

        R<RpcStatus> rstatus = milvusClient.createIndex(
                builder.build()
        );

        return buildResult(rstatus);
    }

metric_type说明:

IP(内积)是一种表示向量之间相似程度的度量方式,它的计算方式是将两个向量中对应位置的元素相乘后求和。IP 的值越大,表示两个向量越相似;IP 的值越小,表示两个向量越不相似。IP 适用于只需要考虑向量之间的相似度,而不需要考虑各个维度之间的权重关系的场景,例如自然语言处理、计算机视觉等领域。

L2(欧氏距离)是一种表示向量之间直线距离的度量方式,它的计算方式是将两个向量中对应位置的元素相减后平方,再将平方和求和并开平方;L2 的值越小,表示两个向量越相似;L2 的值越大,表示两个向量越不相似。L2 适用于需要考虑各个维度之间的权重关系,或者需要将向量转化为单位向量进行相似度计算的场景,例如数值计算、信号处理、图像处理、机器学习等领域。
 

创建成功后:

4.6、加载数据至缓存

public static Map<String, String> load_in_memory(MilvusServiceClient milvusClient, String collection_name) {
        if (StringUtils.isEmpty(collection_name) || StringUtils.isBlank(collection_name)) {
            log.warn("集合名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        R<RpcStatus> rstatus = milvusClient.loadCollection(
                LoadCollectionParam.newBuilder()
                        .withCollectionName(collection_name)
                        .build()
        );

        return buildResult(rstatus);
    }

4.7、根据向量检索数据

public static Map<String, String> search_data_vector(MilvusServiceClient milvusClient, String collection_name, String fieldName, List<List<Float>> search_vectors, String params, int topK, List<String> search_output_fields) {
        if (StringUtils.isEmpty(collection_name) || StringUtils.isBlank(collection_name)) {
            log.warn("集合名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (StringUtils.isEmpty(fieldName) || StringUtils.isBlank(fieldName)) {
            log.warn("检索字段为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (CollUtil.isEmpty(search_vectors) || CollUtil.isEmpty(search_vectors.get(0))) {
            log.warn("检索向量为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (CollUtil.isEmpty(search_output_fields)) {
            log.warn("输出字段为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (topK <= 1) {
            log.warn("topK少于1.");
            topK = 1;
        }


        SearchParam.Builder builder = SearchParam.newBuilder().withCollectionName(collection_name)
                .withConsistencyLevel(ConsistencyLevelEnum.STRONG)
                .withMetricType(MetricType.IP)
                .withOutFields(search_output_fields)
                .withTopK(topK)
                .withVectors(search_vectors)
                .withVectorFieldName(fieldName);

        if (StringUtils.isNotEmpty(params) && StringUtils.isNotBlank(params)) {
            builder.withParams(params);
        }

        SearchParam searchParam = builder.build();
        R<SearchResults> respSearch = milvusClient.search(searchParam);

        String status = String.valueOf(respSearch.getStatus());
        MapBuilder<String, String> mapBuilder = MapUtil.builder("status", status);

        if (StringUtils.equals(status, "0")) {
            SearchResults searchResults = respSearch.getData();
            if (null != searchResults) {
                SearchResultData searchResultData = searchResults.getResults();
                if (null != searchResultData) {
                    long num_queries = searchResultData.getNumQueries();
//                    log.info("num_queries: {}", num_queries);
                    if (num_queries > 0) {
                        FieldData fieldData = searchResultData.getFieldsData(0);

                        if (null != fieldData) {
                            ScalarField scalarField = fieldData.getScalars();

                            if (null != scalarField.getStringData()) {
                                String content = scalarField.getStringData().getData(0);

                                mapBuilder.put("content", content);
//                                log.info("content: {}", content);
                            }

                        }
                    }
                }
            }
        }

        return mapBuilder.build();

    }

4.8、删除索引

public static Map<String, String> drop_index(MilvusServiceClient milvusClient, String collection_name, String index_name) {
        if (StringUtils.isEmpty(collection_name) || StringUtils.isBlank(collection_name)) {
            log.warn("集合名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (StringUtils.isEmpty(index_name) || StringUtils.isBlank(index_name)) {
            log.warn("索引名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        R<RpcStatus> rstatus = milvusClient.dropIndex(
                DropIndexParam.newBuilder()
                        .withCollectionName(collection_name)
                        .withIndexName(index_name)
                        .build()
        );

        return buildResult(rstatus);
    }

4.9、删除集合

 public static Map<String, String> drop_collection(MilvusServiceClient milvusClient, String collection_name) {
        R<RpcStatus> rstatus = milvusClient.dropCollection(
                DropCollectionParam.newBuilder()
                        .withCollectionName(collection_name)
                        .build()
        );

        return buildResult(rstatus);
    }

4.10、释放缓存

public static Map<String, String> unload_in_memory(MilvusServiceClient milvusClient, String collection_name) {
        if (StringUtils.isEmpty(collection_name) || StringUtils.isBlank(collection_name)) {
            log.warn("集合名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        R<RpcStatus> rstatus = milvusClient.releaseCollection(
                ReleaseCollectionParam.newBuilder()
                        .withCollectionName(collection_name)
                        .build());

        return buildResult(rstatus);

    }


五、附带说明

5.1、高维向量表示的优劣

优势:

  • 表示能力增强:高维向量可以提供更丰富的信息表示能力,能够捕捉更多的特征和关系,从而提高模型的表达能力。
  • 解决冗余信息:在高维空间中,冗余特征可能会被稀疏化,使得模型更容易识别和利用有效的特征。
  • 处理复杂问题:某些复杂问题可能需要更高维度的向量来表示,以便更好地捕捉问题的复杂性和多样性。

劣势

  • 维度灾难:高维度数据可能导致维度灾难问题,即数据稀疏性增加,对于有限的训练数据而言,模型的泛化能力可能会受到影响。
  • 计算复杂性增加:高维度数据需要更多的计算资源和时间来处理和分析,可能会增加计算的复杂性和开销。
  • 数据稀疏性:在高维空间中,数据点之间的距离变得更远,可能会导致数据稀疏性增加,从而影响模型的准确性和可靠性。

5.2、插入数据成功但无法检索

     需要调用flush

     milvusClient.flush(FlushParam.newBuilder() .addCollectionName(collection_name) .build());

5.3、如何批量插入数据

     集合中放入多条数据即可

5.4、受限于篇幅过长,如何提升向量检索精度、如何获取文本向量及如何对向量进行预处理(向量长度补全、归一化、标准化)将另文讲解

5.5、完整代码

package com.zwzt.communication.netty.test;

import cn.hutool.core.collection.CollUtil;
import cn.hutool.core.map.MapBuilder;
import cn.hutool.core.map.MapUtil;
import cn.hutool.core.util.ObjectUtil;
import io.milvus.client.MilvusServiceClient;
import io.milvus.common.clientenum.ConsistencyLevelEnum;
import io.milvus.grpc.*;
import io.milvus.param.*;
import io.milvus.param.collection.*;
import io.milvus.param.dml.InsertParam;
import io.milvus.param.dml.SearchParam;
import io.milvus.param.index.CreateIndexParam;
import io.milvus.param.index.DropIndexParam;
import lombok.extern.slf4j.Slf4j;
import org.apache.commons.lang3.StringUtils;

import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;
import java.util.Map;

@Slf4j
public class MilvusUtils {

    public static MilvusServiceClient connect_db(String uri) {
        MilvusServiceClient milvusClient = new MilvusServiceClient(
                ConnectParam.newBuilder()
                        .withUri(uri)
//                    .withToken("root:Milvus")
                        .build()
        );
        return milvusClient;
    }

    public static Map<String, String> create_collection(MilvusServiceClient milvusClient, String collection_name, String description, int shardsNum, List<FieldType> fieldTypes) {
        if (StringUtils.isEmpty(collection_name) || StringUtils.isBlank(collection_name)) {
            log.warn("集合名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (CollUtil.isEmpty(fieldTypes)) {
            log.warn("集合字段为空.");
            return MapUtil.builder("status", "1").build();
        }

        CreateCollectionParam.Builder builder = CreateCollectionParam.newBuilder().withCollectionName(collection_name)
                .withShardsNum(shardsNum);

        for (FieldType fieldType : fieldTypes) {
            builder.addFieldType(fieldType);
        }

        if (StringUtils.isNotEmpty(description) && StringUtils.isNotBlank(description)) {
            builder.withDescription(description);
        }

        CreateCollectionParam createCollectionReq = builder.build();

        R<RpcStatus> rstatus = milvusClient.createCollection(createCollectionReq);

        return buildResult(rstatus);
    }

    public static Map<String, String> drop_collection(MilvusServiceClient milvusClient, String collection_name) {
        R<RpcStatus> rstatus = milvusClient.dropCollection(
                DropCollectionParam.newBuilder()
                        .withCollectionName(collection_name)
                        .build()
        );

        return buildResult(rstatus);
    }

    public static Map<String, String> create_index(MilvusServiceClient milvusClient, String collection_name, String index_column, String index_name, String params) {
        if (StringUtils.isEmpty(collection_name) || StringUtils.isBlank(collection_name)) {
            log.warn("集合名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (StringUtils.isEmpty(index_column) || StringUtils.isBlank(index_column)) {
            log.warn("索引字段为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (StringUtils.isEmpty(index_name) || StringUtils.isBlank(index_name)) {
            log.warn("索引名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        CreateIndexParam.Builder builder = CreateIndexParam.newBuilder()
                .withIndexName(index_name)
                .withCollectionName(collection_name)
                .withFieldName(index_column)
                .withIndexType(IndexType.IVF_FLAT)
                .withMetricType(MetricType.IP)
                .withSyncMode(Boolean.FALSE);

        if (StringUtils.isNotEmpty(index_name) && StringUtils.isNotBlank(index_name)) {
            builder = builder.withExtraParam(params);
        }

        R<RpcStatus> rstatus = milvusClient.createIndex(
                builder.build()
        );

        return buildResult(rstatus);
    }

    public static Map<String, String> drop_index(MilvusServiceClient milvusClient, String collection_name, String index_name) {
        if (StringUtils.isEmpty(collection_name) || StringUtils.isBlank(collection_name)) {
            log.warn("集合名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (StringUtils.isEmpty(index_name) || StringUtils.isBlank(index_name)) {
            log.warn("索引名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        R<RpcStatus> rstatus = milvusClient.dropIndex(
                DropIndexParam.newBuilder()
                        .withCollectionName(collection_name)
                        .withIndexName(index_name)
                        .build()
        );

        return buildResult(rstatus);
    }

    public static Map<String, String> load_in_memory(MilvusServiceClient milvusClient, String collection_name) {
        if (StringUtils.isEmpty(collection_name) || StringUtils.isBlank(collection_name)) {
            log.warn("集合名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        R<RpcStatus> rstatus = milvusClient.loadCollection(
                LoadCollectionParam.newBuilder()
                        .withCollectionName(collection_name)
                        .build()
        );

        return buildResult(rstatus);
    }

    public static Map<String, String> unload_in_memory(MilvusServiceClient milvusClient, String collection_name) {
        if (StringUtils.isEmpty(collection_name) || StringUtils.isBlank(collection_name)) {
            log.warn("集合名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        R<RpcStatus> rstatus = milvusClient.releaseCollection(
                ReleaseCollectionParam.newBuilder()
                        .withCollectionName(collection_name)
                        .build());

        return buildResult(rstatus);

    }

    public static void disconnection_db(MilvusServiceClient milvusServiceClient) {
        if (null != milvusServiceClient) {
            milvusServiceClient.close();
            milvusServiceClient = null;
        }
    }

    public static Map<String, String> search_data_vector(MilvusServiceClient milvusClient, String collection_name, String fieldName, List<List<Float>> search_vectors, String params, int topK, List<String> search_output_fields) {
        if (StringUtils.isEmpty(collection_name) || StringUtils.isBlank(collection_name)) {
            log.warn("集合名称为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (StringUtils.isEmpty(fieldName) || StringUtils.isBlank(fieldName)) {
            log.warn("检索字段为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (CollUtil.isEmpty(search_vectors) || CollUtil.isEmpty(search_vectors.get(0))) {
            log.warn("检索向量为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (CollUtil.isEmpty(search_output_fields)) {
            log.warn("输出字段为空.");
            return MapUtil.builder("status", "1").build();
        }

        if (topK <= 1) {
            log.warn("topK少于1.");
            topK = 1;
        }


        SearchParam.Builder builder = SearchParam.newBuilder().withCollectionName(collection_name)
                .withConsistencyLevel(ConsistencyLevelEnum.STRONG)
                .withMetricType(MetricType.IP)
                .withOutFields(search_output_fields)
                .withTopK(topK)
                .withVectors(search_vectors)
                .withVectorFieldName(fieldName);

        if (StringUtils.isNotEmpty(params) && StringUtils.isNotBlank(params)) {
            builder.withParams(params);
        }

        SearchParam searchParam = builder.build();
        R<SearchResults> respSearch = milvusClient.search(searchParam);

        String status = String.valueOf(respSearch.getStatus());
        MapBuilder<String, String> mapBuilder = MapUtil.builder("status", status);

        if (StringUtils.equals(status, "0")) {
            SearchResults searchResults = respSearch.getData();
            if (null != searchResults) {
                SearchResultData searchResultData = searchResults.getResults();
                if (null != searchResultData) {
                    long num_queries = searchResultData.getNumQueries();
//                    log.info("num_queries: {}", num_queries);
                    if (num_queries > 0) {
                        FieldData fieldData = searchResultData.getFieldsData(0);

                        if (null != fieldData) {
                            ScalarField scalarField = fieldData.getScalars();

                            if (null != scalarField.getStringData()) {
                                String content = scalarField.getStringData().getData(0);

                                mapBuilder.put("content", content);
//                                log.info("content: {}", content);
                            }

                        }
                    }
                }
            }
        }

        return mapBuilder.build();

    }

    public static Map<String, String>  insert_data(MilvusServiceClient milvusClient, String collection_name,List<InsertParam.Field> fields){
        if (StringUtils.isEmpty(collection_name) || StringUtils.isBlank(collection_name)) {
            log.warn("集合名称为空.");
            return MapUtil.builder("status", "1").build();
        }
        if (CollUtil.isEmpty(fields)) {
            log.warn("插入数据为空.");
            return MapUtil.builder("status", "1").build();
        }

        InsertParam insertParam = InsertParam.newBuilder()
                .withCollectionName(collection_name)
                .withFields(fields)
                .build();

        R<MutationResult> mutationResultR = milvusClient.insert(insertParam);

        String status = String.valueOf(mutationResultR.getStatus());
        MapBuilder<String, String> mapBuilder = MapUtil.builder("status", status);
        MutationResult mutationResult = mutationResultR.getData();
        if(null != mutationResult){
            long insert_cnt = mutationResult.getInsertCnt();
            if(insert_cnt > 0){
                mapBuilder.put("msg","插入成功");
            }
        }

        milvusClient.flush(FlushParam.newBuilder()
                .addCollectionName(collection_name)
//                .withSyncFlush(true)
                .build());

        log.info("MutationResult: {}",mutationResultR);
        return mapBuilder.build();
    }

    private final static Map<String, String> buildResult(R<RpcStatus> rstatus) {
//        log.info("status: {}", rstatus);

        String status = String.valueOf(rstatus.getStatus());
        MapBuilder<String, String> mapBuilder = MapUtil.builder("status", status);
        RpcStatus data = rstatus.getData();
        if (ObjectUtil.isNotEmpty(data)) {
            String msg = data.getMsg();
            if (StringUtils.isNotEmpty(msg) && StringUtils.isNotBlank(msg)) {
                mapBuilder.put("msg", msg);
            }

        }
        return mapBuilder.build();
    }

    public static void main(String[] args) {
        String uri = "http://192.168.10.56:19530";
        MilvusServiceClient milvusServiceClient = connect_db(uri);
        String collection_name = "tb_test11";

//        创建集合
        FieldType fieldType1 = FieldType.newBuilder()
                .withName("id")
                .withDataType(DataType.Int64)
                .withPrimaryKey(true)
                .withAutoID(true)
                .build();
        FieldType fieldType2 = FieldType.newBuilder()
                .withName("keyword")
                .withDataType(DataType.FloatVector)
                .withDimension(256)
                .build();
        FieldType fieldType3 = FieldType.newBuilder()
                .withName("content")
                .withDataType(DataType.VarChar)
                .withMaxLength(4096)
                .build();
       List<FieldType> fieldTypes= CollUtil.list(Boolean.FALSE,fieldType1,fieldType2,fieldType3);
        String description = "the table of tb_test11";
        int shardsNum = 1;
        Map<String,String> result = create_collection(milvusServiceClient, collection_name, description, shardsNum, fieldTypes);
        log.info("result: {}",result);

//      插入数据
//        List<Float> vector = Arrays.asList(0.79558784f, 0.8433239f, -0.8132379f, -0.60343f, 0.8141689f, 0.49214464f, -1.3558795f, -1.5641332f, -1.5642508f, -1.5642508f, 0.90215206f, 0.79874355f, -0.5327561f, 0.8612926f, 0.84299415f, 0.79867285f, 0.8488582f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f);
//        String content = "标题:青春之光青春是一首歌,悠扬而激昂;青春是一幅画,斑斓而生动;青春是一部电影,感人至深。而在我心中,青春更是那个在奥运赛场上奔跑的刘翔。记得那是2004年的雅典奥运会,刘翔以12.91秒的成绩打破了世界纪录,成为中国田径历史上第一位获得奥运金牌的运动员。那一刻,我被他的坚韧和毅力深深打动,也深深地感受到了青春的力量。刘翔的青春,充满了挑战和奋斗。他曾经因为伤病困扰,一度想要放弃,但他没有。他知道,只有坚持下去,才能实现自己的梦想。于是,他在痛苦中挣扎,用汗水和泪水浇灌着自己的青春。终于,他成功了,他站在了奥运的最高领奖台上,成为了全中国的骄傲。刘翔的青春,充满了激情和活力。他是中国田径的一颗璀璨明星,他的每一次起跑都充满力量,他的每一次跨栏都充满速度。他的青春,就像一道闪电,照亮了整个赛场,也照亮了我们的心灵。刘翔的青春,充满了希望和梦想。他的梦想是成为最好的自己,他的希望是为中国赢得更多的荣誉。他的青春,就像一盏明灯,指引着他前进的方向,也激励着我们去追求自己的梦想。青春,就是要有梦想,有希望,有勇气去追逐。刘翔的青春,就是这样,充满了梦想、希望和勇气。他的青春,是我们所有人的青春,是我们所有人追求梦想的动力。青春,是一场无悔的旅程,无论前方有多少困难和挫折,只要我们有梦想,有希望,有勇气,就一定能够到达我们的目的地。让我们一起,像刘翔一样,用自己的青春,去创造属于我们自己的辉煌!";
//
//        List<String> contents =  CollUtil.list(Boolean.FALSE,content);
//        List<List<Float>> vectors = new ArrayList<>();
//        vectors.add(vector);
//
//        List<InsertParam.Field> fields = new ArrayList<>();
//        fields.add(new InsertParam.Field("keyword", vectors));
//        fields.add(new InsertParam.Field("content", contents));
//
//        Map<String,String> result = insert_data(milvusServiceClient,collection_name,fields);
//        log.info("result: {}",result);

//        创建索引
//        String index_column = "keyword";
//        String index_name = "idx_keyword";
//        String params = "{\"nlist\":65536}";
//        Map<String, String> result = create_index(milvusServiceClient, collection_name, index_column, index_name, params);
//        log.info("result: {}", result);

//      删除索引
//        Map<String, String> result = drop_index(milvusServiceClient, collection_name,index_name);
//        log.info("result: {}", result);

//        装载至内存
//        Map<String,String> result = load_in_memory(milvusServiceClient, collection_name);
//        log.info("result: {}",result);

//         向量查询
//        List<String> search_output_fields = Arrays.asList("content");
//        List<List<Float>> search_vectors = Arrays.asList(Arrays.asList(0.79558784f, 0.8433239f, -0.8132379f, -0.60343f, 0.8141689f, 0.49214464f, -1.3558795f, -1.5641332f, -1.5642508f, -1.5642508f, 0.90215206f, 0.79874355f, -0.5327561f, 0.8612926f, 0.84299415f, 0.79867285f, 0.8488582f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f));
//        String fieldName = "keyword";
//        int topK = 1;
//
//        Map<String, String> result = search_data_vector(milvusServiceClient, collection_name, fieldName, search_vectors, null, topK, search_output_fields);
//        log.info("result: {}", result);

//        删除集合
//        Map<String, String> result = drop_collection(milvusServiceClient, collection_name);
//        log.info("result: {}", result);

        disconnection_db(milvusServiceClient);
    }

}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1457234.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

FreeRTOS移植到GD32

目录 一、GD32基础工程创建&#xff1a; 1、创建如下文件夹 2、在keil5创建工程 3、在工程添加相关.c文件和头文件路径 4、实例&#xff1a;实现LED闪烁功能 二、在基础工程添加FreeRTOS&#xff1a; 1、FreeRTOS中的文件: 2、添加的源文件: 3、添加的头文件路径: 4、…

机器人常用传感器分类及一般性要求

机器人传感器的分类 传感技术是先进机器人的三大要素&#xff08;感知、决策和动作&#xff09;之一。根据用途不同&#xff0c;机器人传感器可以分为两大类&#xff1a;用于检测机器人自身状态的内部传感器和用于检测机器人相关环境参数的外部传感器。 内部传感器 内部传感…

【JavaEE】_HTML常用标签

目录 1.HTML结构 2. HTML常用标签 2.1 注释标签 2.2 标题标签&#xff1a;h1~h6 2.3 段落标签&#xff1a;p 2.4 换行标签&#xff1a;br 2.5 格式化标签 2.6 图片标签&#xff1a;img 2.7 超链接标签&#xff1a;a 2.8 表格标签 2.9 列表标签 2.10 表单标签 2.10…

航班进出港|航班进出港管理系统|基于springboot航班进出港管理系统设计与实现(源码+数据库+文档)

航班进出港管理系统目录 目录 基于springboot航班进出港管理系统设计与实现 一、前言 二、系统功能设计 三、系统实现 5、航班信息管理 &#xff08;1&#xff09; 航班信息管理 &#xff08;2&#xff09;起飞降落申请管理 &#xff08;3&#xff09;公告管理 &…

辽宁博学优晨教育科技有限公司视频剪辑培训专业之选

随着数字时代的到来&#xff0c;视频剪辑技术已成为各行各业不可或缺的一项技能。为了满足市场需求&#xff0c;辽宁博学优晨教育科技有限公司&#xff08;以下简称“博学优晨”&#xff09;推出了专业的视频剪辑培训课程&#xff0c;旨在为广大学员提供系统、高效的学习机会。…

AMD FPGA设计优化宝典笔记(4)复位桥

高亚军老师的这本书《AMD FPGA设计优化宝典》&#xff0c;他主要讲了两个东西&#xff1a; 第一个东西是代码的良好风格&#xff1b; 第二个是设计收敛等的本质。 这个书的结构是一个总论&#xff0c;加上另外的9个优化&#xff0c;包含的有&#xff1a;时钟网络、组合逻辑、触…

面试系列之《Spark》(持续更新...)

1.job&stage&task如何划分&#xff1f; job&#xff1a;应用程序中每遇到一个action算子就会划分为一个job。 stage&#xff1a;一个job任务中从后往前划分&#xff0c;分区间每产生了shuffle也就是宽依赖则划分为一个stage&#xff0c;stage这体现了spark的pipeline思…

picker选择器-年月日选择

从底部弹起的滚动选择器。支持五种选择器&#xff0c;通过mode来区分&#xff0c;分别是普通选择器&#xff0c;多列选择器&#xff0c;时间选择器&#xff0c;日期选择器&#xff0c;省市区选择器&#xff0c;默认是普通选择器。 学习一下日期选择器 平台差异说明 日期选择默…

k8s学习(RKE+k8s+rancher2.x)成长系列之简配版环境搭建(三)

3.19.切换RKE用户,并做免密登录(三台机器相互免密) su rke cd~ ssh-keygen[rke@master.ssh]$ssh-copy-id rke@slaver2 [rke@master.ssh]$ssh-copy-id rke@slaver1 [rke@master.ssh]$ssh-copy-id rke@master3.20.搭建RKE集群 为了方便理解,我们把通RKE部署的Kubernetes集群称…

浏览网页记录工具,企业如何查看员工网页浏览记录

随着信息技术的飞速发展&#xff0c;网络已成为企业日常运营和员工工作中不可或缺的一部分。然而&#xff0c;随之而来的是网络安全和员工上网行为管理的挑战。在这种情况下&#xff0c;浏览网页记录工具成为了企业监控员工上网行为的重要手段之一。 一、浏览网页记录工具的重要…

MySQL 基础知识(十)之 MySQL 架构

目录 1 MySQL 架构说明 2 连接层 3 核心业务层 3.1 查询缓存 3.2 解析器 3.3 优化器 3.4 执行器 4 存储引擎层 5 参考文档 1 MySQL 架构说明 下图是 MySQL 5.7 及其之前版本的逻辑架构示意图 MySQL 架构大致可分为以下三层&#xff1a; 连接层&#xff1a;负责跟客户…

unity学习(29)——GameInfo角色信息

1.把GameInfo.cs PlayerModel.cs Vector3.cs Vector4.cs PlayerStateConstans.cs GameState.cs依次粘到model文件夹中&#xff0c;此时项目没有错误&#xff0c;如下图所示&#xff1b; 对应处所修改的代码如下&#xff1a; case LoginProtocol.LOGIN_SRES://1 {Debug.Log(&qu…

软件工程师,AI手机元年到来,我们怎么办

概述 OPPO创始人、总裁、CEO陈明永在2024年2月18日发表了名为《开启AI手机新时代》的内部信。陈明永认为&#xff1a;“2024年是AI手机元年。未来五年&#xff0c;AI对手机行业的影响&#xff0c;完全可以比肩当年智能手机替代功能机”。他预测AI手机时代将成为继功能机、智能手…

docker jenkins 报错:script.sh.copy: 1: mvn: not found

找不到mvn,一般是没配置环境变量的问题。点开系统配置&#xff0c;设置环境变量即可

Python教程(27)——如何使用Python中的上下文管理器

当我们在编写代码时&#xff0c;经常会遇到需要管理资源的情况&#xff0c;比如打开和关闭文件&#xff0c;如果遇到了一些异常情况&#xff0c;我们需要关闭资源&#xff0c;不然会导致资源泄露&#xff0c;虽然我们可以通过手动的方式来关闭&#xff0c;但如果有多个异常情况…

(十)【Jmeter】线程(Threads(Users))之jp@gc - Stepping Thread Group (deprecated)

简述 操作路径如下: 作用:通过逐步增加线程数来模拟用户并发访问。配置:设置This group will start、First,wait for 、Then start、Next , add等参数。使用场景:模拟逐步增长的并发访问,观察应用程序的性能变化。优点:适用于测试应用程序在逐步增加负载下的性能表现。…

【STM32 物联网】AT指令的介绍

文章目录 前言一、什么是AT指令二、使用AT指令需要注意什么 三、AT指令的分类和提示信息3.1 AT指令的分类3.2 是否保存到Flash的含义3.3 提示信息 总结 前言 本系列STM32物联网使用的为esp8266-01S作为通信模块 在物联网&#xff08;IoT&#xff09;应用中&#xff0c;通信模…

【Java大数据期末】银行管理系统(MySQL数据库)

诚接C语言、C、Java、Python、HTML、JavaScript、vue、MySQL相关编程作业&#xff0c; 标价10-20每份&#xff0c;如有需要请加文章最下方QQ。 本文资源&#xff1a;https://download.csdn.net/download/weixin_47040861/88850902https://download.csdn.net/download/weixin_4…

四旋翼无人机控制-零散笔记整理

四旋翼无人机控制-零散笔记整理 说明仿真框架 说明 这是低创文章&#xff0c;本意是整理本科留下来的一堆零碎的纸质笔记&#xff0c;整理完就把纸质的扔了。所以前后不连贯&#xff0c;也可能有错误&#xff0c;图片都是直接拍的笔记照片&#xff0c;很丑。如果想系统学习的可…

OpenAI划时代大模型——文本生成视频模型Sora作品欣赏(二)

Sora介绍 Sora是一个能以文本描述生成视频的人工智能模型&#xff0c;由美国人工智能研究机构OpenAI开发。 Sora这一名称源于日文“空”&#xff08;そら sora&#xff09;&#xff0c;即天空之意&#xff0c;以示其无限的创造潜力。其背后的技术是在OpenAI的文本到图像生成模…