Dockerfile:
FROM kevinchina/deeplearning:llamafactory20241027
# 设置工作目录
WORKDIR /app
# 暴露端口
EXPOSE 8000
EXPOSE 7860
# 使用 JSON 格式的 ENTRYPOINT,指定要执行的命令
ENTRYPOINT ["vllm", "serve", "/data/xiedong/LLM-Research/Meta-Llama-3.1-70B-Instruct-GPTQ-INT4", "--dtype", "bfloat16", "--port"</