一篇文章带你学会向量数据库Milvus

news2025/1/19 22:24:06

一篇文章带你学会向量数据库Milvus

索引管理

Milvus 提供多种索引类型来对字段值进行排序,以实现高效的相似性搜索。它还提供三种度量类型:余弦相似度 (COSINE)、欧几里得距离 (L2) 和内积 (IP)来测量向量嵌入之间的距离。

建议对经常使用的向量字段和标量字段创建索引

如果集合创建请求中指定了以下任一条件,Milvus 在创建集合时会自动生成索引并将其加载到内存中:

  • 向量的维度和类型
  • schema 和索引参数

下面的代码片段重新调整了现有代码的用途,以建立与 Milvus 实例的连接并创建一个集合,而无需指定其索引参数。在这种情况下,集合缺少索引并且保持卸载状态。

 from pymilvus import MilvusClient, DataType
 ​
 # 实例化客户端,连接 Milvus 服务
 client = MilvusClient(
     uri="http://localhost:19530"
 )
 ​
 # 创建 schema
 schema = MilvusClient.create_schema(
     auto_id=False,
     enable_dynamic_field=True,
 )
 ​
 # schema 添加字段 id、vector
 schema.add_field(field_name="id", datatype=DataType.INT64, is_primary=True)
 schema.add_field(field_name="vector", datatype=DataType.FLOAT_VECTOR, dim=5)
 ​
 # 创建集合
 client.create_collection(
     collection_name="demo_v4", 
     schema=schema, 
 )

集合索引

要为集合创建索引或为集合建立索引,我们需要设置索引参数并调用create_index()

 # 设置索引的参数
 index_params = MilvusClient.prepare_index_params()
 ​
 # 在向量字段 vector 上面添加一个索引
 index_params.add_index(
     field_name="vector",
     metric_type="COSINE",
     index_type=,
     index_name="vector_index"
 )
 ​
 # 在集合demo_v4创建索引文件
 client.create_index(
     collection_name="demo_v4",
     index_params=index_params
 )

Milvus 目前只支持为集合的每个字段创建一个索引文件

查看索引详细信息

创建索引后我们可以检索索引的详细信息:

 res = client.list_indexes(
     collection_name="demo_v4"
 )
 ​
 # Output
 #
 # [
 #     "vector_index",
 # ]
 ​
 res = client.describe_index(
     collection_name="demo_v4",
     index_name="vector_index"
 )
 ​
 # Output
 #
 # {
 #     "index_type": ,
 #     "metric_type": "COSINE",
 #     "field_name": "vector",
 #     "index_name": "vector_index"
 # }

我们可以查看针对特定字段创建的索引文件,并统计使用该索引简历的索引行数。类比 关系性数据库的索引。

删除索引

如果不在需要索引,我们可以删除相关的索引

 client.drop_index(
     collection_name="demo_v4",
     index_name="vector_index"
 )

检索标量字段

什么是标量字段?变量字段就是除 vector 字段,id 字段之外的字段。在 Milvus 中,标量索引用于加速特定非向量字段值的元过滤,类似于传统的数据库索引。

变量索引类型

  • auto-index Milvus 根据标量字段的数据类型自动决定索引类型。这适用于不需要控制具体索引类型的情况。
  • custom-index 可以指定明确的索引类型,比如倒排索引。这就提供了对索引的类型的更多选择。
Auto index 自动索引

要使用自动索引,请省略 index_type 参数,以便 Milvus 可以根据标量字段类型推断索引类型。

例子:

 # Auto indexing
 client = MilvusClient(
     uri="http://localhost:19530"
 )
 #准备一个空的IndexParams对象,无需指定任何索引参数。
 index_params = client.create_index_params() 
 ​
 index_params.add_index(
     field_name="scalar_1", # 要索引的标量字段的名称
     index_type="", # 要创建的索引类型。对于自动索引,请将其留空或省略此参数。
     index_name="default_index" # 要创建的指数名称
 )
 ​
 # 在集合中添加索引
 client.create_index(
   collection_name="demo_v4", # 指定集合名称
   index_params=index_params
 )

自定义索引

如果我们要使用自定义索引,请在 index_type 参数中指定特定索引类型。

看下面的例子:

 index_params = client.create_index_params() #  准备一个 IndexParams 对象
 ​
 index_params.add_index(
     field_name="scalar_2", # 标量字段名称
     index_type="INVERTED", # 明确索引类型
     index_name="inverted_index" # 索引的名称
 )
 ​
 client.create_index(
   collection_name="demo_v4", # 将索引添加到集合中
   index_params=index_params
 )

对于自定义索引,有效值为:
  • INVERTED:(推荐)倒排索引由术语词典组成,其中包含按字母顺序排序的所有标记化单词。有关详细信息,请参阅标量索引。
  • STL_SORT:使用标准模板库排序算法对标量字段进行排序。支持布尔和数字字段(例如 INT8、INT16、INT32、INT64、FLOAT、DOUBLE)。
  • Trie:用于快速前缀搜索和检索的树形数据结构。支持 VARCHAR 字段。

索引检索

使用 list_indexes() 方法验证标量索引的创建:

 client.list_indexes(
     collection_name="demo_v4"  # 指定集合名称
 )
 ​
 # Output:
 # ['default_index','inverted_index']

索引限制

目前,标量索引支持 INT8INT16INT32INT64FLOATDOUBLEBOOLVARCHAR 数据类型,但不支持 JSONARRAY 类型。

数据 CRUD

在 Milvus 集合的上下文中,实体是集合中单个、可识别的实例。它代表特定类别的独特成员,无论是图书馆中的一本书、基因组中的基因还是任何其他可识别的实体。

集合中的实体共享一组通用的属性,称为schema,概述了每个实体必须遵守的结构,包括字段名称、数据类型和任何其他约束。

将实体成功插入集合中要求提供的数据应包含目标集合的所有架构定义字段。此外,仅当您启用了动态字段时,您还可以包含非架构定义的字段。

准备工作

 from pymilvus import MilvusClient
 ​
 # Milvus 连接数据库
 client = MilvusClient(
     uri="http://localhost:19530"
 )
 ​
 # 创建 collection
 client.create_collection(
     collection_name="demo_v5",
     dimension=5,
     metric_type="IP"
 )

插入实体

要插入实体,您需要将数据组织到字典列表中,其中每个字典代表一个实体。每个字典都包含与目标集合中的预定义字段和动态字段对应的键。

# 3. Insert some data
data=[
    {"id": 0, "vector": [0.3580376395471989, -0.6023495712049978, 0.18414012509913835, -0.26286205330961354, 0.9029438446296592], "color": "pink_8682"},
    {"id": 1, "vector": [0.19886812562848388, 0.06023560599112088, 0.6976963061752597, 0.2614474506242501, 0.838729485096104], "color": "red_7025"},
    {"id": 2, "vector": [0.43742130801983836, -0.5597502546264526, 0.6457887650909682, 0.7894058910881185, 0.20785793220625592], "color": "orange_6781"},
    {"id": 3, "vector": [0.3172005263489739, 0.9719044792798428, -0.36981146090600725, -0.4860894583077995, 0.95791889146345], "color": "pink_9298"},
    {"id": 4, "vector": [0.4452349528804562, -0.8757026943054742, 0.8220779437047674, 0.46406290649483184, 0.30337481143159106], "color": "red_4794"},
    {"id": 5, "vector": [0.985825131989184, -0.8144651566660419, 0.6299267002202009, 0.1206906911183383, -0.1446277761879955], "color": "yellow_4222"},
    {"id": 6, "vector": [0.8371977790571115, -0.015764369584852833, -0.31062937026679327, -0.562666951622192, -0.8984947637863987], "color": "red_9392"},
    {"id": 7, "vector": [-0.33445148015177995, -0.2567135004164067, 0.8987539745369246, 0.9402995886420709, 0.5378064918413052], "color": "grey_8510"},
    {"id": 8, "vector": [0.39524717779832685, 0.4000257286739164, -0.5890507376891594, -0.8650502298996872, -0.6140360785406336], "color": "white_9381"},
    {"id": 9, "vector": [0.5718280481994695, 0.24070317428066512, -0.3737913482606834, -0.06726932177492717, -0.6980531615588608], "color": "purple_4976"}
]

res = client.insert(
    collection_name="demo_v5",
    data=data
)

插入分区

要将数据插入到特定分区,可以在插入请求中指定分区名称,如下所示:

data=[
    {"id": 10, "vector": [-0.5570353903748935, -0.8997887893201304, -0.7123782431855732, -0.6298990746450119, 0.6699215060604258], "color": "red_1202"},
    {"id": 11, "vector": [0.6319019033373907, 0.6821488267878275, 0.8552303045704168, 0.36929791364943054, -0.14152860714878068], "color": "blue_4150"},
    {"id": 12, "vector": [0.9483947484855766, -0.32294203351925344, 0.9759290319978025, 0.8262982148666174, -0.8351194181285713], "color": "orange_4590"},
    {"id": 13, "vector": [-0.5449109892498731, 0.043511240563786524, -0.25105249484790804, -0.012030655265886425, -0.0010987671273892108], "color": "pink_9619"},
    {"id": 14, "vector": [0.6603339372951424, -0.10866551787442225, -0.9435597754324891, 0.8230244263466688, -0.7986720938400362], "color": "orange_4863"},
    {"id": 15, "vector": [-0.8825129181091456, -0.9204557711667729, -0.935350065513425, 0.5484069690287079, 0.24448151140671204], "color": "orange_7984"},
    {"id": 16, "vector": [0.6285586391568163, 0.5389064528263487, -0.3163366239905099, 0.22036279378888013, 0.15077052220816167], "color": "blue_9010"},
    {"id": 17, "vector": [-0.20151825016059233, -0.905239387635804, 0.6749305353372479, -0.7324272081377843, -0.33007998971889263], "color": "blue_4521"},
    {"id": 18, "vector": [0.2432286610792349, 0.01785636564206139, -0.651356982731391, -0.35848148851027895, -0.7387383128324057], "color": "orange_2529"},
    {"id": 19, "vector": [0.055512329053363674, 0.7100266349039421, 0.4956956543575197, 0.24541352586717702, 0.4209030729923515], "color": "red_9437"}
]

# 创建分区
client.create_partition(
    collection_name="demo_v4",
    partition_name="partitionA"
)

# 分区中插入数据
res = client.insert(
    collection_name="demo_v4",
    data=data,
    partition_name="partitionA"
)

更新插入数据

更新插入数据是更新和插入操作的组合。在 Milvus 中,upsert 操作执行数据级操作,根据集合中是否已存在主键来插入或更新实体。具体来说:

  • 如果集合中已存在该实体的主键,则现有实体将被覆盖。
  • 如果集合中不存在主键,则将插入一个新实体。
data=[
    {"id": 0, "vector": [-0.619954382375778, 0.4479436794798608, -0.17493894838751745, -0.4248030059917294, -0.8648452746018911], "color": "black_9898"},
    {"id": 1, "vector": [0.4762662251462588, -0.6942502138717026, -0.4490002642657902, -0.628696575798281, 0.9660395877041965], "color": "red_7319"},
    {"id": 2, "vector": [-0.8864122635045097, 0.9260170474445351, 0.801326976181461, 0.6383943392381306, 0.7563037341572827], "color": "white_6465"},
    {"id": 3, "vector": [0.14594326235891586, -0.3775407299900644, -0.3765479013078812, 0.20612075380355122, 0.4902678929632145], "color": "orange_7580"},
    {"id": 4, "vector": [0.4548498669607359, -0.887610217681605, 0.5655081329910452, 0.19220509387904117, 0.016513983433433577], "color": "red_3314"},
    {"id": 5, "vector": [0.11755001847051827, -0.7295149788999611, 0.2608115847524266, -0.1719167007897875, 0.7417611743754855], "color": "black_9955"},
    {"id": 6, "vector": [0.9363032158314308, 0.030699901477745373, 0.8365910312319647, 0.7823840208444011, 0.2625222076909237], "color": "yellow_2461"},
    {"id": 7, "vector": [0.0754823906014721, -0.6390658668265143, 0.5610517334334937, -0.8986261118798251, 0.9372056764266794], "color": "white_5015"},
    {"id": 8, "vector": [-0.3038434006935904, 0.1279149203380523, 0.503958664270957, -0.2622661156746988, 0.7407627307791929], "color": "purple_6414"},
    {"id": 9, "vector": [-0.7125086947677588, -0.8050968321012257, -0.32608864121785786, 0.3255654958645424, 0.26227968923834233], "color": "brown_7231"}
]

# 插入与更新
res = client.upsert(
    collection_name='demo_v4',
    data=data
)

分区更新也是同样的操作:

res = client.upsert(
    collection_name="demo_v4",
    data=data,
    partition_name="partitionA" # 指定分区名称
)

删除实体

如果不再需要某个实体,您可以将其从集合中删除。 Milvus 提供两种方式供您识别要删除的实体。

  • 通过过滤器删除实体。
  • 按 ID 删除实体。
# 按过滤器删除
res = client.delete(
    collection_name="quick_setup",
    filter="id in [4,5,6]"
)

# 按 id 删除
res = client.delete(
    collection_name="quick_setup",
    ids=[18, 19],
    partition_name="partitionA"
)

向量查询

插入数据后,下一步是在 Milvus 中检索集合执行相似性搜索。

Milvus 允许您进行两种类型的搜索,具体取决于集合中向量字段的数量:

  • 单向量搜索:如果您的集合只有一个向量字段,请使用search()方法查找最相似的实体。此方法将您的查询向量与集合中的现有向量进行比较,并返回最接近匹配的 ID 以及它们之间的距离。或者,它还可以返回结果的向量值和元数据。
  • 多向量搜索:对于具有两个或多个向量场的集合,请使用hybrid_search()方法。此方法执行多个近似最近邻 (ANN) 搜索请求,并组合结果以在重新排名后返回最相关的匹配项。

多种搜索类型可以满足不同的搜索需求:

  • 基本搜索:包括单向量搜索、批量向量搜索、分区搜索和指定输出字段搜索。
  • 过滤搜索: 应用基于标量字段的过滤条件来细化搜索结果。
  • 范围搜索: 查找距查询向量特定距离范围内的向量。
  • 分组搜索: 根据特定字段对搜索结果进行分组,以确保结果的多样性。

基本搜索:

发送 search 请求时,我们可以提供一个或多个表示查询嵌入的向量值以及指示要返回的结果数的 limit 值。根据数据和查询向量,我们获得的结果可能会少于 limit 个。当 limit 大于查询可能匹配向量的数量时,就会发生这种情况。

单向量搜索

单向量搜索是 Milvus 中search操作的最简单形式,旨在查找与给定查询向量最相似的向量。

要执行单向量搜索,请指定目标集合名称、查询向量和所需的结果数量 (limit)。此操作返回一个结果集,其中包含最相似的向量、它们的 ID 以及与查询向量的距离。

批量向量搜索

批量向量搜索通过允许在单个请求中搜索多个查询向量来扩展单向量搜索概念。这种类型的搜索非常适合需要为一组查询向量查找相似向量的场景,从而显着减少所需的时间和计算资源。

在批量向量搜索中,您可以在 data 字段中包含多个查询向量。系统并行处理这些向量,为每个查询向量返回一个单独的结果集,每个结果集包含在集合中找到的最接近的匹配项。

下面是从两个查询向量中搜索两个不同的最相似实体集的示例:

# 批量向量搜索
res = client.search(
    collection_name="demo_v4",
    data=[
        [0.19886812562848388, 0.06023560599112088, 0.6976963061752597, 0.2614474506242501, 0.838729485096104],
        [0.3172005263489739, 0.9719044792798428, -0.36981146090600725, -0.4860894583077995, 0.95791889146345]
    ], 
    limit=2,
    search_params={"metric_type": "IP", "params": {}}
)

result = json.dumps(res, indent=4)

分区搜索

分区搜索将搜索范围缩小到集合的特定子集或分区。这对于有组织的数据集特别有用,其中数据被分段为逻辑或分类部分,从而通过减少要扫描的数据量来实现更快的搜索操作。

要进行分区搜索,只需在搜索请求的 partition_names 中包含目标分区的名称即可。这指定search操作仅考虑指定分区内的向量。

res = client.search(
    collection_name="test_collection", 
    data=[[0.02174828545444263, 0.058611125483182924, 0.6168633415965343, -0.7944160935612321, 0.5554828317581426]],
    limit=5, 
    search_params={"metric_type": "IP", "params": {}}, 
    partition_names=["partition_1"] # 这里指定搜索的分区
)

使用输出字段进行搜索

使用输出字段进行搜索允许您指定搜索结果中应包含匹配向量的哪些属性或字段。

您可以在请求中指定output_fields以返回包含特定字段的结果。

# 输出字段搜索
res = client.search(
    collection_name="test_collection", 
    data=[[0.3580376395471989, -0.6023495712049978, 0.18414012509913835, -0.26286205330961354, 0.9029438446296592]],
    limit=5,
    search_params={"metric_type": "IP", "params": {}},
    output_fields=["color"] # 返回定义的字段
)

过滤搜索

筛选搜索将标量筛选器应用于矢量搜索,允许我们根据特定条件优化搜索结果。

例如,要根据字符串模式优化搜索结果,可以使用 like 运算符。此运算符通过考虑前缀、中缀和后缀来启用字符串匹配:

  • 若要匹配以特定前缀开头的值,请使用语法. 如: ‘like “prefix%”’
  • 若要匹配字符串中任意位置包含特定字符序列的值,请使用语法 ‘like “%infix%”’
  • 若要匹配以特定后缀结尾的值,请使用语法: ‘like “%suffix”’ .
  • like 运算符还可以通过使用下划线 (_) 表示任何单个字符来用于单字符匹配。 ‘like “y_llow”’ .

筛选颜色绿色为前缀的结果:

# 过滤器搜索
res = client.search(
    collection_name="test_collection", 
    data=[[0.3580376395471989, -0.6023495712049978, 0.18414012509913835, -0.26286205330961354, 0.9029438446296592]],
    limit=5, 
    search_params={"metric_type": "IP", "params": {}},
    output_fields=["color"], 
    filter='color like "gree%"'
)

范围搜索

范围搜索允许查找距查询向量指定距离范围内的向量。

通过设置 radius 和可选的 range_filter,可以调整搜索的广度以包含与查询向量有些相似的向量,从而提供潜在匹配的更全面的视图。

  • radius:定义搜索空间的外边界。只有距查询向量在此距离内的向量才被视为潜在匹配。
  • range_filter:虽然radius设置搜索的外部限制,但可以选择使用range_filter来定义内部边界,创建一个距离范围,在该范围内向量必须落下才被视为匹配。
# 范围搜索
search_params = {
    "metric_type": "IP",
    "params": {
        "radius": 0.8, # 搜索圆的半径
        "range_filter": 1.0 # 范围过滤器,用于过滤出不在搜索圆内的向量。
    }
}

res = client.search(
    collection_name="test_collection", 
    data=[[0.3580376395471989, -0.6023495712049978, 0.18414012509913835, -0.26286205330961354, 0.9029438446296592]],
    limit=3, # 返回的搜索结果最大数量
    search_params=search_params,
    output_fields=["color"],
)

更多搜索方式可以参考 Milvus 官网。

多向量搜索

在 Milvus2.4 版本开始,引入了多想两支持和混合搜索功能。这就意味着用户可以将多个向量字段引入到单个集合中。不同的向量长可以表示不同的方面,不同的 embedding Model 甚至表征同一实体的不同数据模态。这同时意味着扩展了信息的丰富性。有了这个功能我们可以在综合场景使用,比如:根据图片、语言、指纹等各种属性来识别向量中最相似的人。

多向量搜索支持在各种字段上执行搜索请求,并使用重新排名策略的组合结果。

示例:

from pymilvus import connections, Collection, FieldSchema, CollectionSchema, DataType
import random

# 连接 Milvus
connections.connect(
    host="127.0.0.1", # 可以替换为自己的服务地址
    port="19530"
)

# 创建 schema
fields = [
    FieldSchema(name="film_id", dtype=DataType.INT64, is_primary=True),
    FieldSchema(name="filmVector", dtype=DataType.FLOAT_VECTOR, dim=5), # 向量字段
    FieldSchema(name="posterVector", dtype=DataType.FLOAT_VECTOR, dim=5)] # 向量字段

schema = CollectionSchema(fields=fields,enable_dynamic_field=False)

# 创建 collection
collection = Collection(name="test_collection", schema=schema)

# 添加索引
index_params = {
    "metric_type": "L2",
    "index_type": "IVF_FLAT",
    "params": {"nlist": 128},
}
# 字段 filmVector 创建索引
collection.create_index("filmVector", index_params)
# 字段 posterVector 创建索引
collection.create_index("posterVector", index_params)

# 向量数据库中插入的实体
entities = []

for _ in range(1000):
    # 构造实体
    film_id = random.randint(1, 1000)
    film_vector = [ random.random() for _ in range(5) ]
    poster_vector = [ random.random() for _ in range(5) ]

    entity = {
        "film_id": film_id,
        "filmVector": film_vector,
        "posterVector": poster_vector
    }
    entities.append(entity)
# 集合中插入实体    
collection.insert(entities)

创建 AnnSearchRequest 实例

多向量搜索使用 hybrid_search() API 在一次调用中执行多个 ANN 搜索请求。每个 AnnSearchRequest 代表特定矢量场上的单个搜索请求。

示例创建两个 AnnSearchRequest 实例以对两个向量字段执行单独的相似性搜索。

from pymilvus import AnnSearchRequest

# 创建多搜索请求 filmVector
query_filmVector = [[0.8896863042430693, 0.370613100114602, 0.23779315077113428, 0.38227915951132996, 0.5997064603128835]]

search_param_1 = {
    "data": query_filmVector, # 请求查询的向量数据
    "anns_field": "filmVector", # 搜索的向量字段 filmVector
    "param": {
        "metric_type": "L2", # 该参数值必须与集合模式中使用的值相同。
        "params": {"nprobe": 10}
    },
    "limit": 2 # 限定 AnnSearchRequest 搜索中返回的结束数量
}
request_1 = AnnSearchRequest(**search_param_1)

# 创建多搜索请求 posterVector
query_posterVector = [[0.02550758562349764, 0.006085637357292062, 0.5325251250159071, 0.7676432650114147, 0.5521074424751443]]
search_param_2 = {
    "data": query_posterVector, #请求查询的向量数据
    "anns_field": "posterVector", # 搜索的向量字段 posterVector
    "param": {
        "metric_type": "L2", # 该参数值必须与集合模式中使用的值相同。
        "params": {"nprobe": 10}
    },
    "limit": 2 # 限定 AnnSearchRequest 搜索中返回的结束数量
}
request_2 = AnnSearchRequest(**search_param_2)

reqs = [request_1, request_2]

配置排名策略

创建 AnnSearchRequest 实例后,配置重新排名策略以组合结果并重新排名。目前有两个选项:WeightedRankerRRFRanker

  • 使用加权评分:WeightedRanker 用于为每个具有指定权重的向量场搜索结果分配重要性。如果将某些向量字段的优先级置于其他向量字段之上,WeightedRanker(value1, value2, ..., valueN) 可以在组合搜索结果中提现出来。
from pymilvus import WeightedRanker
# 使用 WeightedRanker 来结合具有指定权重的结果
# 将文本搜索赋予权重 0.8,将图像搜索赋予权重 0.2。
rerank = WeightedRanker(0.8, 0.2)  

使用WeightedRanker时,请注意:

每个权重值的范围从 0(最不重要)到 1(最重要),影响最终的总分。

WeightedRanker 中提供的权重值总数应等于您创建的 AnnSearchRequest 实例的数量。

执行混合搜索

设置 AnnSearchRequest 实例和重新排名策略后,使用 hybrid_search() 方法执行多向量搜索。

# 在进行多向量搜索之前,将集合加载到内存中。
collection.load()

res = collection.hybrid_search(
    reqs, # 第1步创建的AnnSearchRequests列表
    rerank, # 在第2步指定的重新排序策略
    limit=2 # 限定最终返回数据量
)

参数说明:

  • reqs: 搜索请求列表,其中每个请求都是一个 ANNSearchRequest 对象。每个请求可以对应于不同的矢量场和不同的搜索参数集。
  • rerank对象):用于混合搜索的重新排名策略。可能的值:WeightedRanker(value1, value2, ..., valueN)RRFRanker()
  • limit (int):混合搜索中返回的最终结果的最大数量。

limits 限制

  • 通常,每个集合默认允许最多 4 个向量字段。但是,您可以选择调整 proxy.maxVectorFieldNum 配置以扩展集合中矢量字段的最大数量,每个集合的最大限制为 10 个矢量字段
  • 集合中部分索引或加载的向量字段将导致错误。
  • 目前,混合搜索中的每个 AnnSearchRequest 只能携带一个查询向量。

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

自己也整理很多AI大模型资料:AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2033998.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

零基础学会机器学习,到底要多久?

这两天啊,有不少朋友和我说,想学机器学习,但是之前没有基础,不知道能不能学得会。 首先说结论,只要坚持,就能学会,但是一定不能三天打鱼两天晒网,要持之以恒,至少每隔两…

小白零基础学数学建模系列-Day4-线性规划基础与案例分析

文章目录 1. 线性规划基础1.1 基本概念1.2 求解方法 2 线性规划经典问题2.1 生产计划问题2. 2 运输问题 案例1:生产计划问题背景模型建立模型求解 案例2:运输问题背景模型建立模型求解 案例3:货机货物装载问题问题背景假设条件问题要求模型建…

【微信小程序】WXSS 模板样式

1. 什么是 WXSS WXSS (WeiXin Style Sheets)是一套样式语言,用于美化 WXML 的组件样式,类似于网页开发中的 CSS。 2. WXSS 和 CSS 的关系 3.rpx (1). 什么是 rpx 尺寸单位 rpx(responsive pixel)是微信小程序独有的,用来解决屏适配的尺寸单位。 (2). rpx 的实现原理 …

哈希表 -四数相加II

454. 四数相加II 方法一:分组哈希表 /*** param {number[]} nums1* param {number[]} nums2* param {number[]} nums3* param {number[]} nums4* return {number}*/ var fourSumCount function(nums1, nums2, nums3, nums4) {const twoSumMap new Map();let coun…

【机器学习之深度学习】深度学习和机器学习的关系以及深度学习的应用场景

引言 深度学习和机器学习是人工智能领域的两个重要分支,它们之间既有联系也有区别 文章目录 引言一、深度学习和机器学习的关系1.1 联系1.2 区别1.2.1 模型复杂度1.2.2 数据需求1.2.3 特征提取1.2.4 训练速度和计算资源 二、深度学习有哪些应用场景2.1 计算机视觉2.…

Unity | AmplifyShaderEditor插件基础(第一集:简单了解ASE和初识)

前言 我本来老老实实的写着我的Shader,群里的小伙伴强烈建议我开始讲ASE,我只能说,我是一个听话的Up。 一、什么是ASE 全称AmplifyShaderEditor,是一个unity插件,存在于unity商城中,售价看他们心情。&am…

deepin V23 前瞻丨深度适配RISC-V架构,打造全面兼容与高性能的开源桌面操作系统

查看原文 中国工程院院士倪光南曾表示,RISC-V架构因其开放性和灵活性,已成为中国CPU领域最受欢迎的选择之一,并有望成为推动新一代信息技术发展的关键驱动力。目前,deepin(深度)社区已与RISC-V生态系统建立…

ECMAScript6语法:类

在 ES6 中新增了类的概率,多个具有相同属性和方法的对象就可以抽象为类。类和对象的关系如下: (1)类抽象了对象的公共部分,它泛指某一大类(class)。 (2)对象特指通过类…

haproxy 7000字配图超详细教程 从小白到入门

简介:HAProxy是一个免费的负载均衡软件,可以运行于大部分主流的Linux操作系统上。HAProxy提供了L4(TCP)和L7(HTTP)两种负载均衡能力,具备丰富的功能。HAProxy的社区非常活跃,版本更新快速,HAProxy具备媲美商用负载均衡器的性能和稳…

基于python理解最大似然MLE-(简单正态分布估计、高斯混合模型GMM)

最大似然法(Maximum Likelihood Estimation,简称MLE)是一种统计方法,用于估计概率模型的参数。其基本思想是寻找一组参数值,使得在这组参数下,观测数据出现的概率(即似然性)最大。这…

ARM64 在线仿真器

今天在晚上找到一个简单的ARM64在线仿真器,它非常适合学习ARM64的指令,在教学中应该很好用。网址ARM64 Online Simulatorhttp://163.238.35.161/~zhangs/arm64simulator/ 它是由康涅狄格州立大学的Shuqun Zhang教授开发的。软件基于Alexandro Sanchez开…

评价算法(topsis熵权法)

评价算法 熵权法 上面箭头的一步用到了带权重的距离公式。 上面是某种求权重的方法,合理就行。 但是在使用熵权法的时候,一定要注意用的是规范化矩阵再用熵权法求权重。 规范化之前一定要判断每一列的性质 #熵权法:import xlrd import num…

巴黎奥运会背后的8K国际公用信号制作

北京时间2024年8月12日凌晨3时,举世瞩目的巴黎奥运会闭幕式在法兰西体育场举行,闭幕式演出部分的主题为“记录”。BOSMA博冠首款8K 50P小型化广播级摄像机B1跟随中央广播电视总台“中国红”8K转播车,为田径比赛和闭幕式提供8K国际公用信号制作…

【Ajax使用说明】Ajax、Axios以及跨域

目录 一、原生Ajax 1.1 Ajax简介 1.2 XML简介 1.3 AJAX 的特点 1.3.1 AJAX的优点 1.3.2 AJAX 的缺点 1.4 AJAX 的使用 1.4.1AJAX的基本操作 1.4.2AJAX的传参 1.4.3 AJAX的post请求及设置请求体 1.4.4 AJAX响应json数据 1.4.5 AJAX请求超时与网络异常处理 1.4.5 AJ…

windows 使用Clion开发FreeSWITCH源码

1.准备环境 window安装clion可以编译freeswitch的docker镜像 2.clion配置ssh和Toolchain的配置 去这里看吧 3.makefile配置 Toolchain记得选ssh的 成功之后左下角有这个小锤子,这个小锤子就是生成makefile文件的,记得点击 同时就会出现这个东西 这样…

长文_ZATA

文章目录 环境配置问题miniconda安装torch报错OSError: [WinError 126] 找不到指定的模块。 环境配置问题 miniconda安装torch报错OSError: [WinError 126] 找不到指定的模块。 CSDN 原因:fbegmm.dll文件出现问题 解决方案: 使用依赖分析工具https:/…

SuccBI+低代码文档中心 —数据(数据连接、调度管理)

连接数据 数据加工和分析需要连接已存在的数据,通常是业务系统的数据或文件数据,业务系统数据一般存储在关系型数据库中。对于存储在json文件中的,也可以通过脚本数据加工的方式获取数据。 在数据模块下,点击新建,可以…

【Python机器学习】无监督学习——K-均值聚类算法

聚类是一种无监督的学习,它将相似的对象归到同一簇中,它有点像全自动分类。聚类方法几乎可以应用于所有的对象,簇内的对象越相似,聚类的效果越好。 K-均值聚类算法就是一种典型的聚类算法,之所以称之为K-均值是因为它…

【qt】QMainWindow下实现一个记事本

之前我们学过QWidget,QMainWindow会在ui界面多一个菜单 先实现ui界面 1.添加文本编辑,实现可以写多行 2.将文本编辑放大,拖动即可 3.编辑菜单栏 4.然后我们要实现对应子列表的功能,但是在这里不能转到槽,所以我们…

【Vue3】Pinia store 组合式写法

【Vue3】Pinia store 组合式写法 背景简介开发环境开发步骤及源码 背景 随着年龄的增长,很多曾经烂熟于心的技术原理已被岁月摩擦得愈发模糊起来,技术出身的人总是很难放下一些执念,遂将这些知识整理成文,以纪念曾经努力学习奋斗…