基于Truss+Docker+Kubernetes把开源模型Falcon-7B送上云端(译)

news2025/1/4 17:38:32

背景

到目前为止,我们已经看到了ChatGPT的能力及其所能提供的强大功能。然而,对于企业应用来说,像ChatGPT这样的封闭源代码模型可能会带来风险,因为企业自身无法控制他们的数据。尽管OpenAI公司声称用户数据不会被存储或用于训练模型,但是这并不能保证数据不会以某种方式泄露。

为了解决与封闭源代码模型相关的一些问题,研究人员正急于构建与ChatGPT等模型竞争的开源大型语言模型(LLM)。有了开源模型,企业可以在安全的云环境中托管模型,从而降低数据泄露的风险。最重要的是,你可以完全透明地了解模型的内部工作,这有助于用户与人工智能系统建立更多的信任关系。

随着开源LLM的最新进展,人们很想尝试新的模型,看看它们与ChatGPT等封闭源代码模型的对比。

然而,如今运行开源模型还存在着巨大的障碍。例如,调用ChatGPT API要比了解如何运行开源LLM要容易得多。

在这篇文章中,我的目标是通过展示如何在类似生产的环境中在云中运行Falcon-7B模型这样的开源模型来克服上述困难。最终,我们将能够通过类似于ChatGPT的API端点方式来访问这些模型。

挑战

运行开源模型的一个重大挑战是缺乏计算资源。即使是像Falcon-7B这样的“小”模型也需要GPU才能运行。

为了解决这个问题,我们可以利用云中的GPU。但是,这又带来了另一个挑战。我们如何将LLM进行容器化封装呢?我们如何启用GPU支持?启用GPU支持可能很棘手,因为它需要CUDA的知识。使用CUDA可能会很痛苦,因为您必须弄清楚如何安装正确的CUDA依赖项以及哪些版本是兼容的。

【译者注】CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。CUDA™是一种由NVIDIA推出的通用并行计算架构,它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员可以使用C、C++和FORTRAN语言来为CUDA™架构编写程序。

因此,为了避开CUDA的死亡陷阱,许多公司已经创建了解决方案,可以在支持GPU的同时轻松地将模型容器化封装。在这篇博客文章中,我们将使用一个名为Truss的开源工具来帮助我们轻松地将LLM容器化,而不会带来太多麻烦。

Truss允许开发人员轻松地将使用任何框架构建的模型进行容器化封装。

为什么使用Truss?

Truss — https://truss.baseten.co/e2e。

Truss — https://truss.baseten.co/e2e。

Truss有很多现成的有用功能,例如:

  • 将Python模型转换为具有生产就绪API端点的微服务
  • 通过Docker冻结依赖关系
  • 支持GPU推理
  • 模型的简单预处理和后处理
  • 轻松安全的秘密管理

我以前用过Truss来部署机器学习模型,这个过程非常顺利和简单。Truss自动创建dockerfile并管理Python依赖项。我们所要做的就是为我们的模型提供代码。

其实,我们想使用像Truss这样的工具的主要原因是,借助GPU支持可以使部署我们的模型变得更加容易。

计划

以下是我将在这篇博客文章中介绍的主要内容:

  1. 使用Truss在本地设置Falcon 7B
  2. 如果你有GPU(我有RTX 3080),请在本地运行模型
  3. 容器化模型并使用Docker运行它
  4. 在谷歌云中创建一个支持GPU的Kubernetes集群来运行我们的模型

不过,不要担心,如果步骤2没有GPU,您仍然可以在云端运行模型。

以下是Github代码仓库地址,其中包含本文后面描述中所有有关代码(如果您想继续阅读的话):

https://github.com/htrivedi99/falcon-7b-truss

让我们开始吧!

步骤1:使用Truss进行Falcon 7B本地设置

首先,我们需要创建一个Python版本≥3.8的项目。

然后,我们将从HuggingFace官网下载模型,并使用Truss进行包装。以下是我们需要安装的依赖项:

pip install truss

然后,在Python项目中创建一个名为main.py的脚本。这是一个临时脚本,我们将使用它来处理Truss。

接下来,我们将通过在终端中运行以下命令来设置Truss软件包:

truss init falcon_7b_truss

如果提示您创建新的Truss,请按“y”。完成后,您应该会看到一个名为falcon_7b_truss的新目录。在该目录中,将有一些自动生成的文件和文件夹。我们需要填写以下几项:model.py,它位于model文件夹下,也被文件config.yaml所引用。

正如我之前提到的,Truss只需要我们模型的代码,它会自动处理所有其他事情。我们将在model.py中编写代码,但它必须以特定的格式编写。

Truss希望每个模型至少支持三个功能:__init__、load和predict。

  • __init__主要用于创建类变量
  • load是我们从HuggingFace官网下载模型的地方
  • predict是我们调用模型的地方以下是model.py的完整代码:
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
from typing import Dict
 
MODEL_NAME = "tiiuae/falcon-7b-instruct"
DEFAULT_MAX_LENGTH = 128
 
 
class Model:
 def __init__(self, data_dir: str, config: Dict, **kwargs) -> None:
 self._data_dir = data_dir
 self._config = config
 self.device = "cuda" if torch.cuda.is_available() else "cpu"
 print("THE DEVICE INFERENCE IS RUNNING ON IS: ", self.device)
 self.tokenizer = None
 self.pipeline = None
 
 def load(self):
 self.tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model_8bit = AutoModelForCausalLM.from_pretrained(
 MODEL_NAME,
 device_map="auto",
 load_in_8bit=True,
 trust_remote_code=True)
 
 self.pipeline = pipeline(
 "text-generation",
 model=model_8bit,
 tokenizer=self.tokenizer,
 torch_dtype=torch.bfloat16,
 trust_remote_code=True,
 device_map="auto",
 )
 
 def predict(self, request: Dict) -> Dict:
 with torch.no_grad():
 try:
 prompt = request.pop("prompt")
 data = self.pipeline(
 prompt,
 eos_token_id=self.tokenizer.eos_token_id,
 max_length=DEFAULT_MAX_LENGTH,
 **request
 )[0]
 return {"data": data}
 
 except Exception as exc:
 return {"status": "error", "data": None, "message": str(exc)}

这里发生了什么:

  • MODEL_NAME是我们将要使用的模型,在我们的案例中是falcon-7b-instruct模型
  • 在load内部,我们从HuggingFace官网下载8位的模型。我们想要8位的原因是,当量化时,该模型在GPU上使用的内存明显更少。
  • 此外,如果您想在低于13GB VRAM的GPU上本地运行模型,则需要以8位加载模型。
  • predict函数接受JSON请求作为参数,并使用self.pipeline调用模型。torch.no_grad告诉Pytorch我们处于推理模式,而不是训练模式。很酷吧!这就是我们设置模型所需要的全部内容。

步骤2:在本地运行模型(可选)

如果你有一个拥有超过8GB VRAM的英伟达GPU,那么,你能够在本地运行该模型。

如果没有,请继续下一步。

我们需要下载更多的依赖项才能在本地运行模型。在下载依赖项之前,您需要确保安装了CUDA和正确的CUDA驱动程序。

因为我们试图在本地运行模型,所以Truss无法帮助我们管理CUDA的强大功能。

pip install transformers
pip install torch
pip install peft
pip install bitsandbytes
pip install einops
pip install scipy 

接下来,在falcon_7b_truss目录外创建的脚本main.py中,我们需要加载我们的Truss。

以下是main.py的代码:

import truss
from pathlib import Path
import requests
tr = truss.load("./falcon_7b_truss")
output = tr.predict({"prompt": "Hi there how are you?"})
print(output)

这里发生了什么:

  • 如果您还记得的话,falcon_7b_truss目录是由Truss自动创建的。我们可以使用truss.load加载整个包,包括模型和依赖项
  • 一旦我们加载了我们的包,我们就可以简单地调用predict方法来获得模型输出运行main.py即可从模型中获取输出。此模型文件的大小约为15 GB,因此下载该模型可能需要5-10分钟。运行脚本后,您应该会看到这样的输出:
• {'data': {'generated_text': "Hi there how are you?\nI'm doing well. I'm in the middle of a move, so I'm a bit tired. I'm also a bit overwhelmed. I'm not sure how to get started. I'm not sure what I'm doing. I'm not sure if I'm doing it right. I'm not sure if I'm doing it wrong. I'm not sure if I'm doing it at all.\nI'm not sure if I'm doing it right. I'm not sure if I'm doing it wrong. I"}}

步骤3:使用Docker封装模型

通常,当人们将模型容器化封装时,他们会获取模型二进制文件和Python依赖项,并使用Flask或Fast API服务器将其打包。

很多都是样板化操作,我们不必自己费事。Truss会自动处理这些任务。我们已经提供了模型,Truss将创建服务器,所以剩下的唯一要做的就是提供Python依赖项。

config.yaml保存了我们模型的配置。这就是我们可以为模型添加依赖项的地方。配置文件已经提供了我们需要的大部分内容,但我们还需要添加一些内容。

以下是您需要添加到config.yaml中的内容:

apply_library_patches: true
bundled_packages_dir: packages
data_dir: data
description: null
environment_variables: {}
examples_filename: examples.yaml
external_package_dirs: []
input_type: Any
live_reload: false
model_class_filename: model.py
model_class_name: Model
model_framework: custom
model_metadata: {}
model_module_dir: model
model_name: Falcon-7B
model_type: custom
python_version: py39
requirements:
- torch
- peft
- sentencepiece
- accelerate
- bitsandbytes
- einops
- scipy
- git+https://github.com/huggingface/transformers.git
resources:
 use_gpu: true
 cpu: "3"
 memory: 14Gi
secrets: {}
spec_version: '2.0'
system_packages: []

所以,我们添加的主要内容都围绕着需求进行。所有列出的依赖项都是下载和运行模型所必需的。

我们增加的另一件重要的事情是资源(resources)。use_gpu:true非常重要,因为这告诉Truss在启用GPU支持的情况下为我们创建一个Dockerfile。这是用于配置任务的。

下一步,我们将对我们的模型进行容器化封装。如果您不知道如何使用Docker将模型封装,不要担心,Truss已经为您提供了服务。

在main.py文件中,我们将告诉Truss将所有内容打包在一起。以下是您需要的代码:

import truss
from pathlib import Path
import requests
tr = truss.load("./falcon_7b_truss")
command = tr.docker_build_setup(build_dir=Path("./falcon_7b_truss"))
print(command)

发生了什么:

  • 首先,我们加载falcon_7b_truss。
  • 接下来,docker_build_setup函数处理所有复杂的事情,比如创建Dockerfile和设置Fast API服务器。
  • 如果您查看您的falcon_7b_truss目录,您会看到生成了更多的文件。我们不需要担心这些文件是如何工作的,因为它们都将在幕后进行管理。
  • 在运行结束时,我们得到一个Docker命令来构建我们的Docker映像:
docker build falcon_7b_truss -t falcon-7b-model:latest

如果您想构建Docker镜像,请继续运行build命令。该映像的大小约为9 GB,因此可能需要一段时间才能构建完成。如果你不想构建它,但想一直阅读下去的话,你可以详细观察我提供的图片:

htrivedi05/truss-falcon-7b:latest .

如果您自己构建映像的话,则需要对其进行标记并将其推送到dockerhub,以便我们在云中的容器可以提取图像。以下是构建映像后需要运行的命令:

docker tag falcon-7b-model <docker_user_id>/falcon-7b-model
docker push <docker_user_id>/falcon-7b-model

令人惊叹的是,到目前我们已经准备好在云中运行我们的模型了!

【说明】以下可选步骤(到步骤4前)用于使用GPU在本地运行图像。

如果您有Nvidia GPU,并且希望在本地运行带有GPU支持的容器化模型,则需要确保Docker配置为使用您的GPU。

为此,只需要您打开终端并运行以下命令:

distributinotallow=$(. /etc/os-release;echo $ID$VERSION_ID) && curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - && curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

apt-get update
apt-get install -y nvidia-docker2

sudo systemctl restart docker

现在,您的Docker已配置为访问GPU,下面是如何运行容器的命令:

docker run --gpus all -d -p 8080:8080 falcon-7b-model

同样,下载该模型需要一段时间。为了确保一切正常工作,你可以检查容器日志,你应该看到“设备推理正在is:cuda上运行(THE DEVICE INFERENCE IS RUNNING ON IS: cuda)”。

您可以通过API端点对模型进行调用,如下所示:

import requests

data = {"prompt": "Hi there, how's it going?"}
res = requests.post("http://127.0.0.1:8080/v1/models/model:predict", jsnotallow=data)
print(res.json())

步骤4:将模型部署到生产环境中

我在这里使用“生产”这个词算是相当松散的表达方式。我们将在Kubernetes中运行我们的模型,因为在此环境里可以轻松地扩展和处理可变数量的流量。

话虽如此,Kubernetes提供了很多配置,如网络策略、存储、配置映射、负载平衡、机密管理等。

尽管Kubernetes是为“扩展”和运行“生产”工作负载而构建的,但您需要的许多生产级配置并不是现成可用的。涵盖那些高级的Kubernetes主题的讨论超出了本文的范围,也偏离了我们在这里试图实现的目标。因此,对于这篇博客文章,我们将创建一个基础类型的最小集群。

事不宜迟,让我们抓紧着手创建我们的集群!

先决条件:

  1. 拥有创建了一个项目的对应的谷歌云端账户
  2. 在您的计算机上安装成功gcloud CLI
  3. 请确保您有足够的配额来运行启用GPU的计算机。您可以在“IAM & Admin”命令组下检查您的配额。

创建我们的GKE集群

我们将使用谷歌的Kubernetes引擎来创建和管理我们的集群。下面了解一些重要信息:

谷歌的Kubernetes引擎不是免费的。谷歌不会允许我们免费使用功能强大的GPU。话虽如此,我们正在创建一个功能较弱的GPU的单节点集群。这个实验的花费不应该超过1到2美元。

以下是我们将要运行的Kubernetes集群的配置:

  • 1个节点,标准Kubernetes集群
  • 1个Nvidia T4 GPU
  • n1-standard-4机器(4 vCPU,15GB内存)
  • 所有这些都将在一个Spot实例上运行

注意:如果您在另一个地区,并且无法访问完全相同的资源,请随时进行修改。

创建集群的步骤:

1.前往谷歌云控制台,搜索名为Kubernetes Engine的服务:

2.单击“创建(CREATE)”按钮:

  • 确保您正在创建一个标准集群,而不是自动驾驶(autopilot)型集群。它应该在页面顶部显示“创建一个Kubernetes集群(Create a kubernetes cluster)”。

3.集群基础:

  • 在“集群基础(Cluster basics)”选项卡中,我们不想做太多更改。只需给集群一个名称。您不需要更改区域或控制平面。

4.单击“默认池(default-pool)”选项卡并将节点数更改为1。

5.在“默认池(default-pool)”选项卡下,单击左侧边栏中的“节点(Nodes)”选项卡:

  • 将机器配置(General purpose)从通用更改为GPU
  • 选择英伟达T4作为GPU类型,并将数量设置1
  • 启用GPU分时消费(Time-sharing)方式(即使我们不会使用此功能)
  • 将每个GPU的最大共享客户端数设置为8
  • 对于机器类型,选择n1-standard-4(4 vCPU,15 GB内存)
  • 将引导磁盘大小更改为50
  • 向下滚动到最底部,选中上面写着:启用现场虚拟机上的节点(Enable nodes on spot VMs)

配置好集群后,继续往下进行,创建此群集。

谷歌需要几分钟的时间来设置一切。在您的集群启动并运行后,我们需要连接到此群集。为此,打开您的终端并运行以下命令:

gcloud config set compute/zone us-central1-c
gcloud container clusters get-credentials gpu-cluster-1

如果您使用了不同的集群名称区域,请相应地更新这些区域。要检查我们是否已连接,请运行以下命令:

kubectl get nodes

您应该看到1个节点出现在您的终端中。尽管我们的集群有GPU,但它缺少一些我们必须安装的Nvidia驱动程序。值得庆幸的是,安装它们是一件很容易的事情。运行以下命令即可安装驱动程序:

kubectl apply -f https://raw.githubusercontent.com/GoogleCloudPlatform/container-engine-accelerators/master/nvidia-driver-installer/cos/daemonset-preloaded.yaml

庆祝一下吧,我们终于准备好部署我们的模型了。

部署模型

为了将我们的模型部署到集群上,我们需要创建一个Kubernetes部署。Kubernetes部署允许我们管理容器化模型的实例。在此,我不会深入讨论Kubernetes或如何编写yaml文件,因为这超出了本文主题的范围。

您需要创建一个名为truss-falcon-deployment.yaml的文件。打开该文件并粘贴以下内容:

apiVersion: apps/v1
kind: Deployment
metadata:
 name: truss-falcon-7b
 namespace: default
spec:
 replicas: 1
 selector:
 matchLabels:
 component: truss-falcon-7b-layer
 template:
 metadata:
 labels:
 component: truss-falcon-7b-layer
 spec:
 containers:
 - name: truss-falcon-7b-container
 image: <your_docker_id>/falcon-7b-model:latest
 ports:
 - containerPort: 8080
 resources:
 limits:
 nvidia.com/gpu: 1
---
apiVersion: v1
kind: Service
metadata:
 name: truss-falcon-7b-service
 namespace: default
spec:
 type: ClusterIP
 selector:
 component: truss-falcon-7b-layer
 ports:
 - port: 8080
 protocol: TCP
 targetPort: 8080

发生了什么:

  • 我们告诉Kubernetes,我们想用我们的falcon-7b-model映像创建pods。确保将<your_docker_id>替换为实际id。如果您没有创建自己的Docker映像,而想使用我的,请将其替换为以下内容:htrivedi05/truss-falcon-7b:latest。
  • 我们通过设置资源限制nvidia.com/GPU:1来启用容器的GPU访问。这告诉Kubernetes只为我们的容器请求一个GPU。
  • 为了与我们的模型交互,我们需要创建一个将在8080端口上运行的Kubernetes服务。

通过在终端中运行以下命令来创建部署:

kubectl create -f truss-falcon-deployment.yaml

如果运行该命令:

kubectl get deployments

你应该看到类似下面这样的显示内容:

NAME READY UP-TO-DATE AVAILABLE AGE
truss-falcon-7b 0/1 1 0 8s

部署将需要几分钟时间才能更改为就绪状态。记住,每次容器重新启动时,模型都必须从HuggingFace页面下载。您可以通过运行以下命令来检查容器的进度:

kubectl get pods
 
kubectl logs truss-falcon-7b-8fbb476f4-bggts

相应地更改吊舱名称。

您需要在日志中查找以下内容:

  • 查找打印语句THE DEVICE INFERENCE IS RUNNING ON IS: cuda。这确认了我们的容器已正确连接到GPU。

接下来,您应该看到一些关于正在下载的模型文件的打印语句。

Downloading (…)model.bin.index.json: 100%|██████████| 16.9k/16.9k [00:00<00:00, 1.92MB/s]
Downloading (…)l-00001-of-00002.bin: 100%|██████████| 9.95G/9.95G [02:37<00:00, 63.1MB/s]
Downloading (…)l-00002-of-00002.bin: 100%|██████████| 4.48G/4.48G [01:04<00:00, 69.2MB/s]
Downloading shards: 100%|██████████| 2/2 [03:42<00:00, 111.31s/it][01:04<00:00, 71.3MB/s]

下载模型并创建微服务后,您应该在日志末尾看到以下输出:

{"asctime": "2023-06-29 21:40:40,646", "levelname": "INFO", "message": "Completed model.load() execution in 330588 ms"}

根据此消息,我们可以确认模型已加载并准备好进行推理任务了。

模型推理

我们不能直接调用模型;相反,我们必须调用模型的服务。

运行以下命令即可获取服务的名称:

kubectl get svc

输出结果如下:

AME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE
kubernetes ClusterIP 10.80.0.1 <none> 443/TCP 46m
truss-falcon-7b-service ClusterIP 10.80.1.96 <none> 8080/TCP 6m19s

我们想调用的是truss-falcon-7b服务。为了使服务可访问,我们需要使用以下命令将其端口转发:

kubectl port-forward svc/truss-falcon-7b-service 8080

输出如下:

Forwarding from 127.0.0.1:8080 -> 8080
Forwarding from [::1]:8080 -> 8080

很漂亮,我们的模型在127.0.0.1:8080作为REST API端点提供。打开任何一个Python脚本,如main.py,并运行以下代码:

import requests

data = {"prompt": "Whats the most interesting thing about a falcon?"}
res = requests.post("http://127.0.0.1:8080/v1/models/model:predict", jsnotallow=data)
print(res.json())

输出如下:

{'data': {'generated_text': 'Whats the most interesting thing about a falcon?\nFalcons are known for their incredible speed and agility in the air, as well as their impressive hunting skills. They are also known for their distinctive feathering, which can vary greatly depending on the species.'}}

哇!我们已经成功地将Falcon 7B模型容器化,并将其作为生产中的微服务成功部署!

您可以随意使用不同的提示来查看模型返回的内容。

关闭集群

一旦你在Falcon 7B上玩得很开心,你可以通过运行以下命令删除你的部署:

kubectl delete -f truss-falcon-deployment.yaml

接下来,转到谷歌云中的Kubernetes引擎,删除Kubernete集群。

注:除非另有说明;否则,本文中所有图片均由作者本人提供。

结论

尽管运行和管理像ChatGPT这样的生产级模型并不容易;但是,随着时间的推移,开发人员可以更好地将自己的模型部署到云中。

在这篇博客文章中,我们谈到了在基本层级上将LLM部署到生产中所需的所有内容。归纳起来,我们首先需要使用Truss打包模型,然后使用Docker将其容器化,最后使用Kubernetes将其部署在云中。我知道要作详细介绍会涉及到很多内容,虽然这不是世界上最容易做的事情,但我们还是做到了。

最后,我希望你能从这篇博文中学到一些有趣的东西。感谢阅读!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/787674.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【玩转Linux】标准IO函数

(꒪ꇴ꒪ ),hello我是祐言博客主页&#xff1a;C语言基础,Linux基础,软件配置领域博主&#x1f30d;快上&#x1f698;&#xff0c;一起学习&#xff01;送给读者的一句鸡汤&#x1f914;&#xff1a;集中起来的意志可以击穿顽石!作者水平很有限&#xff0c;如果发现错误&#x…

Emvirus: 基于 embedding 的神经网络来预测 human-virus PPIs【Biosafety and Health,2023】

研究背景&#xff1a; Human-virus PPIs 预测对于理解病毒感染机制、病毒防控等十分重要&#xff1b;大部分基于 machine-learning 预测 human-virus PPIs 的方法利用手动方法处理序列特征&#xff0c;包括统计学特征、系统发育图谱、理化性质等&#xff1b;本文作者提出了一个…

redis面试1

Redis基础面试题 1、为什么要使用Redis做缓存 缓存的好处 使用缓存的目的就是提升读写性能。而实际业务场景下&#xff0c;更多的是为了提升读性能&#xff0c;带来更好的性 能&#xff0c;带来更高的并发量。Redis 的读写性能比 Mysql 好的多&#xff0c;我们就可以把 Mysq…

探索APP开发的新趋势:人工智能和大数据的力量

随着5G技术的不断发展&#xff0c;人工智能和大数据将会更加广泛的应用于我们生活和工作中&#xff0c;作为 APP开发公司&#xff0c;应该及时的对新技术进行研发&#xff0c;进而更好的为用户服务。目前 APP开发已经不是传统的软件开发了&#xff0c;而是向移动互联网转型&…

完全背包相关题

class Solution { public:int dp[5005];int change(int amount, vector<int>& coins) {//dp[j]表示金额为j时的组合数dp[0]1;for(int i0;i<coins.size();i){for(int jcoins[i];j<amount;j){dp[j]dp[j-coins[i]];}}return dp[amount];} }; 题解&#xff1a;如果…

Pandas库:从入门到应用(四)--数学函数

一、测试数据 import numpy as np import pandas as pd## 5行3列 0到100的数据 df pd.DataFrame(datanp.random.randint(0, 100, size(5, 3))) df二、基础聚合函数 2.1、count()函数 df.count() # 统计每列的行数(非空),默认axis0 df.count(axis1) # 统计每行的列数(非空)…

mysql的主键选择

一.没有定义主键有什么问题 如果定义了主键&#xff0c;那么InnoDB会使用主键作为聚簇索引如果没有定义主键&#xff0c;那么会使用第一非空的唯一索引&#xff08;NOT NULL and UNIQUE INDEX&#xff09;作为聚簇索引如果既没有主键也找不到合适的非空索引&#xff0c;那么In…

案例研究|DataEase助力亚加达智能医学实验室场景BI展示

深圳市亚加达信息技术有限公司&#xff08;以下简称为亚加达&#xff09;成立于2018年&#xff0c;是一家专注于医疗信息系统研发的高科技公司&#xff0c;隶属于亚辉龙集团。 亚加达深入理解医疗实验室业务和日常工作流程&#xff0c;通过物联网和大数据技术&#xff0c;基于…

数据库概述和DDL语句(学会并使用数据库day1)

数据库概述和DDL语句&#xff08;day1&#xff09; 一、数据库概述概念数据库的集中式控制有什么优点数据库分类mysql数据库mysql简介基本术语数据表的组成 数据库管理系统数据库管理系统、数据库和表的关系 二、SQL的概念三、SQL语句分类1、SQL语句被分为四大类2、MySQL的语法…

电脑上怎么进行pdf合并免费?看看这种方法

电脑上怎么进行pdf合并免费&#xff1f;在日常工作中&#xff0c;我们经常需要将多个PDF文档合并成一个文件&#xff0c;以方便管理和传输。如果你正在寻找一种简单易用的PDF合并工具&#xff0c;那么接下来就给大家介绍一种简单好用的合并方法。 【迅捷PDF转换器】是一款PDF转…

godot引擎c++源码深度解析系列一

许久没有使用c开发过项目了&#xff0c;如果按照此时单位的入职要求&#xff0c;必须拥有项目经验的话&#xff0c;那我就得回到十多年前&#xff0c;大学的时代&#xff0c;哪个时候真好&#xff0c;电脑没有这么普及&#xff0c;手机没有这么智能&#xff0c;网络没有这么发达…

01背包相关题

题解&#xff1a;dp[j]表示目标和为j时的最大组合种数 class Solution { public:int dp[1005];int findTargetSumWays(vector<int>& nums, int target) {int val;int sum0;for(int i0;i<nums.size();i){sumnums[i];}int wsumtarget;if(w%21){return 0;}else{valw…

重磅来袭 | 2023数字供应链安全大会邀请函(DSS 2023)

2023数字供应链安全大会&#xff08;DSS 2023&#xff09;将于8月10日在北京国家会议中心隆重开幕。本次大会由悬镜安全主办&#xff0c;ISC互联网安全大会组委会、中国软件评测中心&#xff08;工业和信息化部软件与集成电路促进中心&#xff09;、中国信息通信研究院云计算与…

基于IMX6ULL的智能车载终端项目(代码开源)

前言&#xff1a;本文为手把手教学智能车载终端项目&#xff08;LinuxQT&#xff09;&#xff0c;该项目是综合性非常强的 Linux 系列项目&#xff01;项目核心板使用 NXP 的 IMX6ULL 作为 CPU&#xff0c;整体实现了简化版本的车载终端功能需求。项目可以学习的点非常多&#…

物联网网关模块可以带几台plc设备吗?可以接几个modbus设备?

随着物联网技术的快速发展&#xff0c;物联网网关模块已经成为了实现物联网应用的重要工具。很多客户在选择物联网网关模块时想了解物联网网关模块的设备接入能力&#xff0c;一个物联网网关模块可以带几台PLC设备&#xff1f;可以接几个Modbus设备&#xff1f; 物联网网关模块…

leetcode 50. Pow(x, n)(x的n次方)

求x的n次方。 思路&#xff1a; 第一个想到的思路是x和它自己乘n次&#xff0c; 但是这样做会面临一些问题&#xff1a; 如果是简单的n很小的情况还好&#xff0c;但是可以看到n的取值横跨整个整数范围&#xff0c; 如果n非常大&#xff0c;一次一次乘x效率低是其一。 一般来…

十、数据结构——链式队列

数据结构中的链式队列 目录 一、链式队列的定义 二、链式队列的实现 三、链式队列的基本操作 ①初始化 ②判空 ③入队 ④出队 ⑤获取长度 ⑥打印 四、循环队列的应用 五、总结 六、全部代码 七、结果 在数据结构中&#xff0c;队列&#xff08;Queue&#xff09;是一种常见…

【MySQL】存储引擎(六)

&#x1f697;MySQL学习第六站~ &#x1f6a9;本文已收录至专栏&#xff1a;MySQL通关路 ❤️文末附全文思维导图&#xff0c;感谢各位点赞收藏支持~ 一.引入 大家可能没有听说过存储引擎&#xff0c;但是一定听过引擎这个词&#xff0c;引擎就是发动机&#xff0c;是一个机器…

PCB封装设计指导(十五)验证封装的正确性

PCB封装设计指导(十五)验证封装的正确性 封装建立好之后,我们需要验证封装是否能够正常的放入PCB文件中,最好最直接的办法就是直接放入PCB中来验证。 具体操作如下 任意新建一个空白的PCB文件点击File 选择NEW

搭建关键字驱动自动化测试框架

前言 上篇文章我们已经了解到了数据驱动自动化测试框架是如何构建和驱动测试的&#xff01;那么这篇文章我们将了解关键字驱动测试又是如何驱动自动化测试完成整个测试过程的。关键字驱动框架是一种功能自动化测试框架&#xff0c;它也被称为表格驱动测试或者基于动作字的测试…