互动

最近评论

正在加载中...

标签

寻找感兴趣的领域

文章

微信
支付宝

原创人工智能

Ollama——开源本地ai模型搭建

zxb 字数: 14244 阅读耗时: 35 分钟 2024/04/06 2024/04/06 博客独享热度: 20 评论:

Ollama简介

Ollama 是一个强大的框架，设计用于在 Docker 容器中部署 LLM（大型语言模型）。它简化了 AI 模型的开发和使用过程，解决了硬件配置和环境搭建的棘手问题。Ollama 可以在本地机器上运行模型，消除了基于云的解决方案所面临的延迟、数据传输和定制限制，同时提供更安全的环境。它能将模型推理时间最多缩短 50%，具体取决于硬件配置。

准备环境

系统环境：windows 11（gpu跑模型比较快）
官网：https://ollama.com/

搭建步骤

下载ollama

进入官网后，点击Download

llama

下载链接

由于很多人没办法上外网，我这里分享我下载的安装包

https://cloudreve.zxbdwy.online/s/WJhg
提取码：

8qoa83

双击打开安装包后

点击install

桌面上就会出现ollama的图标

运行llama2

默认ollama已经写入环境变量了，所以我们直接输入 win + r ，在运行中输入cmd，然后

验证ollama是否安装

在控制台输入 ollama --version

下载模型

模型列表可以参考官网：https://ollama.com/library

这里使用ollama2

ollama2的配置如下：

7b models generally require at least 8GB of RAM
13b models generally require at least 16GB of RAM
70b models generally require at least 64GB of RAM

下载模型指令：

运行模型

在cmd中输入 ollama run llama2:7b

运行gemma

在cmd中输入 ollama run gemma

接入open webui

关于open webui的搭建可以参考：Open WebUI搭建

设置系统环境变量

用户变量添加 OLLAMA_HOST值为0.0.0.0

使用serve命令来运行ollama

在cmd输入 ollama serve

验证

浏览器输入 127.0.0.1:11434

输入连接地址

这边是将ollama的地址用内网穿透给穿透到外部了，如果有需要，后面会出相关教程

选择模型

测试

zxb的博客

分享设计与科技生活

打赏作者

感谢你赐予我前进的力量

微信
支付宝

赞赏者名单

因为你们的支持让我意识到写文章的价值🙏

本文是原创文章，采用 CC BY-NC-ND 4.0 协议，完整转载请注明来自 zxb

ChatGPT 5 LLM 1

阅读建议

沉浸式翻译接入API V3

Open WebUI搭建

Open WebUI导入api v3接口

ChatGPT代理地址的注册——V3 API

评论

隐私政策

你无需删除空行，直接评论以获取最佳展示效果