Docker 入门:如何使用 Docker 容器化 AI 项目(二)

news2024/12/27 3:06:59

四、将 AI 项目容器化:示例实践 - 完整的图像分类与 API 服务

让我们通过一个更完整的 AI 项目示例,展示如何将 AI 项目容器化。我们以一个基于 TensorFlow 的图像分类模型为例,演示如何将训练、推理、以及 API 服务过程容器化。

4.1 创建 AI 项目文件

首先,创建一个 Python 项目目录结构,包含以下文件:

/my-ai-project
    ├── Dockerfile
    ├── requirements.txt
    ├── main.py
    ├── model.py
    └── app.py
  • requirements.txt:列出项目的所有 Python 依赖。
tensorflow==2.6.0
numpy==1.19.5
matplotlib==3.4.3
flask==2.0.2
  • main.py:包含模型训练和保存的逻辑代码。
import tensorflow as tf
from tensorflow.keras.datasets import mnist

# 加载数据
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 数据预处理
x_train = x_train / 255.0
x_test = x_test / 255.0

# 构建模型
model = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(10)
])

# 编译模型
model.compile(optimizer='adam', loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True), metrics=['accuracy'])

# 训练模型
model.fit(x_train, y_train, epochs=5)

# 评估模型
model.evaluate(x_test, y_test)

# 保存模型
model.save('saved_model/my_model')
  • model.py: 包含模型加载和推理的逻辑。
import tensorflow as tf
import numpy as np

def load_model():
    model = tf.keras.models.load_model('saved_model/my_model')
    return model

def predict(model, image):
    img_array = np.expand_dims(image, axis=0)
    predictions = model.predict(img_array)
    score = tf.nn.softmax(predictions[0])
    class_id = np.argmax(score)
    return class_id
  • app.py:使用 Flask 构建一个简单的 API 服务,接收图片进行预测。
from flask import Flask, request, jsonify
import numpy as np
import tensorflow as tf
from model import load_model, predict
from PIL import Image
import io

app = Flask(__name__)
model = load_model()

@app.route('/predict', methods=['POST'])
def predict_api():
    if 'file' not in request.files:
        return jsonify({'error': 'No file part'}), 400

    file = request.files['file']
    if file.filename == '':
        return jsonify({'error': 'No selected file'}), 400

    try:
        img = Image.open(io.BytesIO(file.read())).convert('L').resize((28, 28)) # Convert to grayscale and resize
        img_array = np.array(img) / 255.0
        result = predict(model, img_array)
        return jsonify({'prediction': int(result)})
    except Exception as e:
        return jsonify({'error': str(e)}), 500

if __name__ == '__main__':
    app.run(host='0.0.0.0', port=5000, debug=True)

4.2 创建 Dockerfile

接下来,创建一个优化的 Dockerfile 来容器化这个项目,示例如下:

# 使用 TensorFlow 官方的 Python 3 镜像作为基础镜像, 选择更轻量级的版本
FROM tensorflow/tensorflow:2.6.0-py3

# 设置工作目录
WORKDIR /app

# 复制 requirements.txt
COPY requirements.txt /app/

# 安装依赖, 使用 --no-cache-dir 减小镜像大小
RUN pip install --no-cache-dir -r requirements.txt

# 复制项目文件到容器中
COPY . /app

# 暴露 API 服务的端口
EXPOSE 5000

# 运行训练脚本并保存模型
RUN python main.py

# 启动 API 服务
CMD ["python", "app.py"]

Dockerfile 优化说明:

  • 基础镜像选择: 使用 tensorflow/tensorflow:2.6.0-py3tensorflow/tensorflow:2.6.0 更轻量级。如果需要 GPU 支持,可以选择 tensorflow/tensorflow:2.6.0-gpu-py3
  • .dockerignore: 可以在项目根目录下创建一个 .dockerignore 文件,排除不必要的文件或目录被复制到镜像中,例如:
.git
__pycache__
saved_model
  • 多阶段构建 (可选):如果你的项目需要编译或其他构建步骤,可以使用多阶段构建来减小最终镜像大小。例如,先在一个包含完整构建工具链的镜像中构建应用,然后将构建产物复制到一个更轻量级的运行时镜像中。

4.3 构建并运行 Docker 容器

  • 构建镜像:
docker build -t my-ai-tensorflow .
  • 启动容器并运行 API 服务:
docker run -it -p 5000:5000 my-ai-tensorflow

-p 5000:5000 将容器的 5000 端口映射到主机的 5000 端口,这样你就可以通过 http://localhost:5000 访问 API 服务了。

4.4 测试 API 服务

在这里插入图片描述

你可以使用 curl 或 Postman 等工具来测试 API 服务。例如,使用 curl 发送一个 POST 请求:

curl -X POST -F "file=@<your_image.png>" http://localhost:5000/predict

<your_image.png> 替换为你本地的一张 MNIST 手写数字图片。

五、使用 Docker Compose 编排多容器应用 (可选)

如果你的 AI 项目需要多个容器协同工作,例如数据库、Web 服务器、消息队列等,可以使用 Docker Compose 来简化多容器应用的部署和管理。

创建一个 docker-compose.yml 文件,例如:

version: '3.8'
services:
  web:
    build: .
    ports:
      - "5000:5000"
    depends_on:
      - db
  db:
    image: postgres:13-alpine
    environment:
      - POSTGRES_PASSWORD=example

这个示例定义了两个服务:webdbweb 服务使用当前目录的 Dockerfile 构建镜像,并将容器的 5000 端口映射到主机的 5000 端口。db 服务使用 PostgreSQL 数据库镜像。

使用 docker-compose up 命令启动所有服务:

docker-compose up -d

-d 表示后台运行。

六、Docker 安全性最佳实践 (简要)

  • 使用非 root 用户: 默认情况下,容器内的进程以 root 用户身份运行。为了提高安全性,可以在 Dockerfile 中创建一个非 root 用户,并使用 USER 指令切换到该用户。
  • 限制容器资源: 使用 Docker 的资源限制功能(例如 --memory--cpus)来限制容器可以使用的资源,防止容器耗尽主机资源。
  • 定期更新镜像: 及时更新基础镜像和应用程序依赖,修复已知的安全漏洞。
  • 最小化镜像: 只安装必要的软件包,避免安装不必要的组件,减小攻击面。
  • 使用安全扫描工具: 使用 Clair、Anchore 等工具扫描镜像中的安全漏洞。

七、总结

在本文中,我们介绍了如何使用 Docker 容器化 AI 项目。通过 Docker,我们能够将 AI 项目的环境和依赖打包成一个容器,从而简化了项目的部署和管理。Docker 不仅提升了开发者的效率,还确保了项目在不同环境中的一致性。

最佳实践

  • 保持镜像简洁:在 Dockerfile 中,尽量选择合适的基础镜像,避免冗余的安装和配置。
  • 多阶段构建:对于需要构建和编译的项目,可以使用 Docker 的多阶段构建来减少最终镜像的体积。
  • 数据持久化:在生产环境中,确保使用 Docker 的数据卷(Volumes)来持久化数据。
  • 优化镜像大小:通过清理不必要的文件,减小镜像的体积,提升部署效率。

附:Docker安装流程图:

在这里插入图片描述

流程图说明:

  1. 开始: 安装流程开始。
  2. 选择操作系统: 根据你的操作系统选择相应的安装步骤。
  3. Windows:
    • 访问 Docker 官网下载 Docker Desktop for Windows。
    • 启用 Hyper-V 或 WSL 2?: 选择使用 Hyper-V 或 WSL 2 作为 Docker 的后端。
      • Hyper-V: 启用 Hyper-V。
      • WSL 2 (推荐): 启用 WSL 2 (性能更好)。
    • 双击安装文件并按照向导安装。
    • 启动 Docker Desktop。
    • 验证安装: docker --version
  4. macOS:
    • 访问 Docker 官网下载 Docker Desktop for macOS。
    • 双击 .dmg 文件并将 Docker 拖入应用程序文件夹。
    • 启动 Docker。
    • 验证安装: docker --version
  5. Linux:
    • 选择 Linux 发行版: 选择你使用的 Linux 发行版 (Ubuntu 或 CentOS)。
    • Ubuntu:
      • sudo apt-get update
      • sudo apt-get install apt-transport-https ca-certificates curl software-properties-common
      • curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
      • sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable"
      • sudo apt-get update
      • sudo apt-get install docker-ce
      • 验证安装: docker --version
    • CentOS:
      • sudo yum install -y yum-utils
      • sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo
      • sudo yum install docker-ce
      • sudo systemctl start docker
      • sudo systemctl enable docker (设置开机自启)
      • 验证安装: docker --version
  6. 安装完成。

关键步骤说明:

  • WSL 2 和 Hyper-V (D, E, W) 使用不同的填充色,表示这是 Windows 安装中两个重要的选项,WSL 2 通常是更好的选择。
  • Ubuntu 和 CentOS 安装步骤 分别使用蓝色和橙色填充,方便区分不同发行版的安装命令。

这个流程图清晰地展示了在不同操作系统上安装 Docker 的步骤,希望对你有所帮助!

附:AI 项目容器化流程图:

以下是一个更详细的、包含模型训练、API 服务构建以及 Docker Compose 编排的 AI 项目容器化流程图:
在这里插入图片描述

流程图说明:

  1. 开始: 项目开始。
  2. 准备 AI 项目代码: 准备好包含模型训练、推理和 API 服务 (例如 Flask 或 FastAPI) 的代码。
  3. 创建 requirements.txt: 列出项目所有 Python 依赖。
  4. 项目是否需要多容器?: 判断项目是否需要使用 Docker Compose。
    • : 创建 docker-compose.yml 文件,定义各个服务及其依赖关系。
    • : 继续创建 Dockerfile。
  5. 创建 Dockerfile: 编写 Dockerfile 文件。
  6. 选择基础镜像 FROM: 根据项目需求选择合适的基础镜像,例如 tensorflow/tensorflow:2.6.0-py3
  7. 设置工作目录 WORKDIR /app: 设置容器内的工作目录。
  8. 复制项目文件 COPY . /app: 将项目代码复制到容器中。
  9. 安装依赖 RUN pip install -r requirements.txt: 安装 requirements.txt 中列出的依赖。
  10. 项目是否包含训练步骤?:
    • : RUN python main.py 执行训练脚本并保存模型 (例如到 /app/saved_model 目录)。
    • : 跳过训练步骤。
  11. 暴露端口 EXPOSE 5000: 如果有 API 服务,暴露相应的端口。
  12. 设置启动命令 CMD [“python”, “app.py”]: 设置容器启动时执行的命令,例如启动 API 服务。
  13. 构建 Docker 镜像 docker build -t my-ai-project .: 构建 Docker 镜像。
  14. 是否使用 Docker Compose?:
    • : 使用 docker-compose up -d 命令启动所有服务。
    • : 使用 docker run -it -p 5000:5000 my-ai-project 命令运行容器,-p 参数进行端口映射。
  15. 访问 API 服务 例如: http://localhost:5000: 通过映射的端口访问 API 服务。
  16. 测试 API 服务: 使用 curl 或 Postman 等工具测试 API。
  17. 部署到生产环境: 将构建好的镜像部署到生产环境 (例如 Kubernetes 集群)。
  18. 结束: 项目部署完成。

关键步骤说明:

  • 训练步骤 (J) 使用虚线边框和不同的填充色,表示这是一个可选步骤,取决于项目中是否包含模型训练逻辑。
  • 使用 Docker Compose 启动 (O) 和直接运行容器 (Q) 使用不同的填充色,表示这是两种不同的启动方式。

这个流程图更详细地展示了 AI 项目容器化的各个步骤,并考虑了模型训练、API 服务构建和 Docker Compose 编排等情况,希望能更好地帮助你理解整个流程。

点击进入:AI 项目实战:从原理到落地
点击进入:Docker 入门:如何使用 Docker 容器化 AI 项目(一)

本文为原创内容,未经许可不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2266139.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java和Go语言的优劣势对比

文章目录 Java和Go语言的优劣势对比一、引言二、设计哲学与语法特性1、设计哲学2、语法特性 三、性能与内存管理1、性能2、内存管理和垃圾回收 四、并发编程模型五、使用示例1、Go语言示例代码2、Java语言示例代码 六、对比表格七、总结 Java和Go语言的优劣势对比 一、引言 在…

Docker怎么关闭容器开机自启,批量好几个容器一起操作?

环境&#xff1a; WSL2 docker v25 问题描述&#xff1a; Docker怎么关闭容器开机自启&#xff0c;批量好几个容器一起操作&#xff1f; 解决方案&#xff1a; 在 Docker 中&#xff0c;您可以使用多种方法来关闭容器并配置它们是否在系统启动时自动启动。以下是具体步骤和…

Pytorch | 利用BIM/I-FGSM针对CIFAR10上的ResNet分类器进行对抗攻击

Pytorch | 利用BIM/I-FGSM针对CIFAR10上的ResNet分类器进行对抗攻击 CIFAR数据集BIM介绍基本原理算法流程 BIM代码实现BIM算法实现攻击效果 代码汇总bim.pytrain.pyadvtest.py 之前已经针对CIFAR10训练了多种分类器&#xff1a; Pytorch | 从零构建AlexNet对CIFAR10进行分类 Py…

网狐旗舰版源码搭建概览

简单的列一下&#xff1a; 服务端源码内核源码移动端源码核心移动端源码AI控制工具源码多款子游戏源码前端、管理后台、代理网站源码数据库自建脚本UI工程源码配置工具及二次开发帮助文档 编译环境要求 VS2015 和 Cocos3.10 环境&#xff0c;支持移动端 Android 一键编译&am…

【QT】:QT(介绍、下载安装、认识 QT Creator)

背景 &#x1f680; 在我们的互联网中的核心岗位主要有以下几种 开发&#xff08;程序员&#xff09;测试运维&#xff08;管理机器&#xff09;产品经理&#xff08;非技术岗位&#xff0c;提出需求&#xff09; 而我们这里主要关注的是开发方向&#xff0c;开发岗位又分很…

MySQL 数据”丢失”事件之 binlog 解析应用

事件背景 客户反馈在晚间数据跑批后,查询相关表的数据时,发现该表的部分数据在数据库中不存在 从应用跑批的日志来看,跑批未报错,且可查到日志中明确显示当时那批数据已插入到数据库中 需要帮忙分析这批数据丢失的原因。 备注:考虑信息敏感性,以下分析场景测试环境模拟,相关数据…

熊军出席ACDU·中国行南京站,详解SQL管理之道

12月21日&#xff0c;2024 ACDU中国行在南京圆满收官&#xff0c;本次活动分为三个篇章——回顾历史、立足当下、展望未来&#xff0c;为线上线下与会观众呈现了一场跨越时空的技术盛宴&#xff0c;吸引了众多业内人士的关注。云和恩墨副总经理熊军出席此次活动并发表了主题演讲…

Spring01 - 工厂篇

Spring入门(上)-工厂篇 文章目录 Spring入门(上)-工厂篇一&#xff1a;引言1&#xff1a;EJB存在的问题2&#xff1a;什么是Spring3&#xff1a;设计模式和反射工厂 二&#xff1a;第一个spring程序1&#xff1a;环境搭建2&#xff1a;核心API - ApplicationContext2.1&#xf…

攻防世界 unserialize3

开启场景 题目为unserialize3&#xff0c;这个单词在php中代表反序列化&#xff0c;代码 __wakeup 也是php反序列化中常见的魔术方法&#xff0c;所以这个题基本就是和反序列化有关的题目。根据代码提示&#xff0c;编写一个Exploit运行&#xff0c;将对象xctf的信息序列化 得到…

汽车免拆诊断案例 | 2011 款奔驰 S400L HYBRID 车发动机故障灯异常点亮

故障现象 一辆2011款奔驰 S400L HYBRID 车&#xff0c;搭载272 974发动机和126 V高压电网系统&#xff0c;累计行驶里程约为29万km。车主反映&#xff0c;行驶中发动机故障灯异常点亮。 故障诊断 接车后试车&#xff0c;组合仪表上的发动机故障灯长亮&#xff1b;用故障检测…

GitLab安装及使用

目录 一、安装 1.创建一个目录用来放rpm包 2.检查防火墙状态 3.安装下载好的rpm包 4.修改配置文件 5.重新加载配置 6.查看版本 7.查看服务器状态 8.重启服务器 9.输网址 二、GitLab的使用 1.创建空白项目 2.配置ssh 首先生成公钥&#xff1a; 查看公钥 把上面的…

Electron 学习笔记

目录 一、安装和启动electron 1. 官网链接 2. 根据文档在控制台输入 3. 打包必填 4. 安装electron开发依赖 5. 在开发的情况下打开应用 6. 修改main为main.js&#xff0c;然后创建main.js 7.启动 二、启动一个窗口 1. main.js 2. index.html 3. 隐藏菜单栏 三、其他…

网络管理-期末项目(附源码)

环境&#xff1a;网络管理 主机资源监控系统项目搭建 &#xff08;保姆级教程 建议点赞 收藏&#xff09;_搭建网络版信息管理系统-CSDN博客 效果图 下面3个文件的项目目录(python3.8.8的虚拟环境) D:\py_siqintu\myproject5\Scripts\mytest.py D:\py_siqintu\myproject5\Sc…

62.基于SpringBoot + Vue实现的前后端分离-驾校预约学习系统(项目+论文)

项目介绍 伴随着信息技术与互联网技术的不断发展&#xff0c;人们进到了一个新的信息化时代&#xff0c;传统管理技术性没法高效率、容易地管理信息内容。为了实现时代的发展必须&#xff0c;提升管理高效率&#xff0c;各种各样管理管理体系应时而生&#xff0c;各个领域陆续进…

MySQL用表组织数据

用表组织数据 文章目录 用表组织数据一.四种完整性约束二.数值类型2-1三.数值类型2-2四.字符串.日期类型五.设置1.设置主键2.设置标识列3.设置非空4.设置默认值 六.主外键建立后注意事项 一.四种完整性约束 1.域完整性 列 域完整性约束方法:限制数据类型,检查约束,外键约束,默…

iOS开发代码块-OC版

iOS开发代码块-OC版 资源分享资源使用详情Xcode自带代码块自定义代码块 资源分享 自提&#xff1a; 通过网盘分享的文件&#xff1a;CodeSnippets 2.zip 链接: https://pan.baidu.com/s/1Yh8q9PbyeNpuYpasG4IiVg?pwddn1i 提取码: dn1i Xcode中的代码片段默认放在下面的目录中…

基于微信小程序的校园访客登记系统

基于微信小程序的校园访客登记系统 功能列表 用户端功能 注册与登录 &#xff1a;支持用户通过手机号短信验证码注册和登录。个人资料管理 &#xff1a;允许用户编辑和更新个人信息及其密码。站内信消息通知&#xff1a;通知公告。来访预约&#xff1a;提交来访预约支持车牌…

mac启ssh服务用于快速文件传输

x.1 在mac上启SSH服务 方法一&#xff1a;图形交互界面启ssh&#xff08;推荐&#xff09; 通过sharing - advanced - remote login来启动ssh&#xff1b;&#xff08;中文版mac应该是 “系统设置 → 通用 → 共享”里打开“远程登录”来启动&#xff09; 查看自己的用户名和…

Magnet: 基于推送的大规模数据处理Shuffle服务

本文翻译自&#xff1a;《Magnet: Push-based Shuffle Service for Large-scale Data Processing》 摘要 在过去的十年中&#xff0c;Apache Spark 已成为大规模数据处理的流行计算引擎。与其他基于 MapReduce 计算范式的计算引擎一样&#xff0c;随机Shuffle操作&#xff08;即…

面试真题:Integer(128)引发的思考

引言 在 Java 编程语言中&#xff0c;数据类型的使用至关重要。作为一种静态类型语言&#xff0c;Java 提供了丰富的基本数据类型和对应的包装类。其中&#xff0c;Integer 类是 int 类型的包装类&#xff0c;承载着更复杂的功能&#xff0c;如缓存、装箱和拆箱等。掌握 Integ…