Ollama run 使用指南：轻松部署你的AI模型

在人工智能飞速发展的今天，将大型语言模型 (LLMs) 部署到本地机器上进行测试和应用，已成为许多开发者和研究人员的需求。Ollama 正是一款开源工具，旨在简化这一过程，它将模型权重、配置和依赖项打包成一个独立的 “Modelfile”，类似于容器化应用，让您能够轻松在本地运行和管理各类 AI 模型。

本文将详细介绍 ollama run 命令的使用方法，帮助您快速部署和体验 AI 模型。

1. 安装 Ollama

在使用 ollama run 之前，您需要先在您的系统上安装 Ollama。您可以访问 Ollama 官方网站下载适用于您操作系统的安装包。

安装完成后，打开终端或命令行工具，运行以下命令验证安装：

bash ollama --version

如果安装成功，您将看到 Ollama 的版本信息。

2. 拉取 AI 模型（推荐）

ollama run 命令在执行时会自动下载所需的模型（如果本地不存在）。然而，一个好的习惯是提前明确拉取模型。这能确保模型在您需要时已准备就绪，尤其是在网络条件不佳的情况下。

要从 Ollama 模型库中拉取一个模型（例如 llama3.2），请使用 ollama pull 命令：

bash ollama pull llama3.2

您可以在 Ollama 官方模型库网站上找到更多可用的模型。

3. 使用 `ollama run` 运行和交互模型

ollama run 命令允许您与模型进行交互式对话，或者对特定提示词快速获取单次响应。

交互式会话

要与模型（例如 llama3.2）启动一个交互式聊天会话，请使用以下命令：

bash ollama run llama3.2

模型加载完成后，您可以在终端中直接输入您的提示词，模型将实时给出响应。

单次提示

如果您只需要对一个特定问题获取快速、非交互式的响应，您可以直接将提示词作为参数传递：

bash ollama run llama3.2 "天空为什么是蓝色的？"

模型将处理该提示并直接输出其响应。

4. 创建和运行自定义模型

Ollama 还支持通过 Modelfile 创建自定义模型。Modelfile 允许您定义基础模型、参数以及系统消息等关键设置，从而对模型行为进行个性化定制。

创建 Modelfile：
新建一个文件（例如 Modelfile），并在其中定义您的自定义模型。例如：

dockerfile FROM llama3.2 PARAMETER temperature 1 SYSTEM """ 你是《超级马里奥兄弟》中的马里奥。请以马里奥的身份回答问题。 """

在这个例子中，我们基于 llama3.2 模型，设置了 temperature 参数，并定义了系统消息，让模型以马里奥的口吻进行回复。
创建自定义模型：
使用 ollama create 命令从 Modelfile 构建您的自定义模型：

bash ollama create mario -f ./Modelfile
运行您的自定义模型：
自定义模型创建成功后，您就可以像运行其他模型一样运行它：

bash ollama run mario

这将启动一个交互式会话，模型将严格遵循您在 Modelfile 中设置的指令进行响应。

总结

Ollama 的 run 命令极大地简化了本地部署和使用 AI 模型的过程。无论是快速体验预训练模型，还是深度定制模型行为，Ollama 都提供了一套直观而强大的工具集，让 AI 模型的本地化应用触手可及。