参考:
https://github.com/ollama/ollama/issues/5272
https://deepseek.csdn.net/67cfd7c93b685529b708fdee.html
通过-e传入环境变量,ollama运行:
docker run -d --gpus=all -e OLLAMA_KEEP_ALIVE=-1 -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
进入运行模型
docker exec -it 容器id bash
ollama run qwen2.5:7b
持续时间永远