Ollama 相关命令

📅 2026/7/4 9:45:31 👁️ 阅读次数 📝 编程学习

Ollama 常用命令大全

1. 模型管理

下载与拉取

# 下载指定模型ollama pull llama3# 下载特定版本ollama pull llama3:8b ollama pull qwen2:7b# 下载量化版本（节省空间）ollama pull llama3:8b-q4_0 ollama pull llama3:8b-q5_K_M# 从镜像源下载（如需要）OLLAMA_PROXY=http://your-proxy:port ollama pull llama3

查看模型

# 列出所有已下载模型ollama list# 查看模型详细信息ollama show llama3# 查看模型参数和配置ollama show--modelfilellama3# 查看模型大小和占用空间ollama list--formatjson

删除模型

# 删除指定模型ollamarmllama3# 删除特定版本ollamarmllama3:8b# 批量删除（需脚本）ollama list|grepllama3|awk'{print $1}'|xargs-I{}ollamarm{}

复制模型

# 创建模型副本ollamacpllama3 my-llama3# 复制特定版本ollamacpllama3:8b my-llama3:latest

2. 运行与交互

基础运行

# 交互式运行ollama run llama3# 运行特定版本ollama run llama3:8b# 单条命令运行ollama run llama3"解释量子力学"# 从标准输入读取echo"写一首诗"|ollama run llama3# 从文件读取ollama run llama3<prompt.txt

参数控制

# 设置温度（0.0-2.0，越高越随机）ollama run llama3--temperature0.7# 设置最大生成 token 数ollama run llama3 --num-predict500# 设置上下文窗口大小ollama run llama3 --num-context4096# 设置重复惩罚ollama run llama3 --repeat-penalty1.1# 多参数组合ollama run llama3--temperature0.5--num-predict1000--num-context8192

会话控制

# 保持会话时间ollama run llama3--keepalive30m# 在交互模式中：# /bye - 退出# /help - 显示帮助# /show info - 显示模型信息# /set parameter temperature 0.5 - 设置参数# /set system "你是一位..." - 设置系统提示词

3. 模型创建与自定义

创建 Modelfile

# 基础示例 FROM llama3 PARAMETER temperature 0.7 PARAMETER num_predict 1000 SYSTEM You are a helpful assistant.

创建自定义模型

# 从现有模型创建ollama create my-model-fModelfile# 从文件创建（支持 .gguf 格式）ollama create my-model-f./model.gguf# 创建多模态模型ollama create my-model-fModelfile

修改模型参数

# 基于现有模型修改参数ollama create my-llama3-f-<<EOF FROM llama3 PARAMETER temperature 0.5 PARAMETER num_ctx 8192 SYSTEM You are a coding assistant. EOF

4. API 与服务管理

启动服务

# 启动 Ollama 服务ollama serve# 指定主机和端口OLLAMA_HOST=127.0.0.1:11435 ollama serve# 后台运行（Linux/macOS）nohupollama serve>ollama.log2>&1&# Windows 后台运行start /B ollama serve

API 调用示例

# 生成补全curlhttp://localhost:11434/api/generate-d'{ "model": "llama3", "prompt": "Hello", "stream": false }'# 对话补全curlhttp://localhost:11434/api/chat-d'{ "model": "llama3", "messages": [ {"role": "user", "content": "你好"} ], "stream": false }'# 流式输出curlhttp://localhost:11434/api/chat-d'{ "model": "llama3", "messages": [{"role": "user", "content": "写故事"}], "stream": true }'# 检查模型是否加载curlhttp://localhost:11434/api/tags# 获取系统信息curlhttp://localhost:11434/api/version

服务控制

# 查看服务状态ollamaps# 停止服务（Linux/macOS）killallollama# Windows 停止taskkill /F /IM ollama.exe

5. 系统管理

环境变量

# 设置代理exportOLLAMA_PROXY="http://proxy:port"# 设置模型存储目录exportOLLAMA_MODELS="/path/to/models"# 设置主机地址exportOLLAMA_HOST="0.0.0.0:11434"# 设置最大并发数exportOLLAMA_NUM_PARALLEL=4# 设置最大内存使用exportOLLAMA_MAX_LOADED_MODELS=2# Windows (PowerShell)$env:OLLAMA_PROXY="http://proxy:port"$env:OLLAMA_MODELS="D:\ollama\models"

服务管理（Linux）

# 启动服务sudosystemctl start ollama# 停止服务sudosystemctl stop ollama# 重启服务sudosystemctl restart ollama# 设置开机自启sudosystemctlenableollama# 查看服务状态sudosystemctl status ollama# 查看日志sudojournalctl-uollama-f

服务管理（macOS）

# 启动服务launchctl start com.ollama# 停止服务launchctl stop com.ollama# 查看状态launchctl list|grepollama

服务管理（Windows）

# 启动服务Start-Serviceollama# 停止服务Stop-Serviceollama# 重启服务Restart-Serviceollama# 设置开机自启Set-Serviceollama-StartupType Automatic

6. 实用工具命令

查看帮助

# 显示所有命令ollama--help# 查看具体命令帮助ollama run--helpollama pull--helpollama create--help

版本信息

# 查看版本ollama--version# 查看详细信息ollama version

清理缓存

# 清理未使用的模型层ollama prune# 清理所有缓存（谨慎使用）rm-rf~/.ollama/blobs

导入模型

# 从 GGUF 文件导入ollama create my-model-f./model.gguf# 从 Ollama 模型导出（需脚本）ollama show--modelfilellama3>Modelfile

7. 批量操作脚本

批量下载模型

#!/bin/bashMODELS=("llama3:8b""qwen2:7b""mistral:7b""gemma:2b")formodelin"${MODELS[@]}";doecho"下载：$model"ollama pull$modeldone

批量测试模型

#!/bin/bashPROMPT="用一句话介绍自己"formodelin$(ollama list|tail-n+2|awk'{print $1}');doecho"测试模型：$model"ollama run$model"$PROMPT"--temperature0.5echo"---"done

清理旧模型

#!/bin/bash# 删除超过 30 天未使用的模型ollama list|tail-n+2|whilereadmodel sizedate;do# 这里可以添加日期判断逻辑echo"准备删除：$model"# ollama rm $modeldone

8. 诊断与调试

检查系统兼容性

# 查看 GPU 使用情况ollamaps# 查看模型加载状态ollama list# 测试模型运行ollama run llama3"测试"--num-predict10

日志查看

# 查看服务日志（Linux）sudojournalctl-uollama-f# 查看应用日志tail-f~/.ollama/logs/server.log# Windows 日志Get-Content$env:APPDATA\ollama\logs\server.log-Tail50-Wait

网络诊断

# 检查服务是否运行curlhttp://localhost:11434/api/version# 检查端口占用netstat-an|grep11434# Windowsnetstat-an|findstr11434

这些命令涵盖了 Ollama 的主要功能。建议先掌握pull、run、list、rm等基础命令，再逐步学习高级功能。

编程学习技术分享实战经验

资讯详情

Ollama 相关命令

Ollama 常用命令大全

1. 模型管理

下载与拉取

查看模型

删除模型

复制模型

2. 运行与交互

基础运行

参数控制

会话控制

3. 模型创建与自定义

创建 Modelfile

创建自定义模型

修改模型参数

4. API 与服务管理

启动服务

API 调用示例

服务控制

5. 系统管理

环境变量

服务管理（Linux）

服务管理（macOS）

服务管理（Windows）

6. 实用工具命令

查看帮助

版本信息

清理缓存

导入模型

7. 批量操作脚本

批量下载模型

批量测试模型

清理旧模型

8. 诊断与调试

检查系统兼容性

日志查看

网络诊断

相关新闻

最新新闻

日新闻

周新闻

月新闻