当前位置：

社区首页

电脑数码

存储设备

网络存储

NAS存储

文章详情

NAS不要试，CPU会炸！记录一次本地部署Llama 3大语言模型和Open WebUI的尝试

哈喽小伙伴们好，我是Stark-C~

这几天关注AI 领域的应该都知道这个重磅新闻吧：Meta 正式发布了人们等待已久的开源大模型 Llama 3！此次发布的Llama 3 在多个关键的基准测试中性能优于业界先进同类模型，其在代码生成等任务上实现了全面领先，能够进行复杂的推理，可以更遵循指令，能够可视化想法并解决很多微妙的问题。

根据官方的描述，它的亮点包括但不限于以下：

基于超过 15T token 训练，相当于 Llama 2 数据集的 7 倍还多；
支持 8K 长文本，改进的 tokenizer 具有 128K token 的词汇量，可实现更好的性能；
在大量重要基准中均具有最先进性能；
新能力范畴，包括增强的推理和代码能力；
训练效率比 Llama 2 高 3 倍；
带有 Llama Guard 2、Code Shield 和 CyberSec Eval 2 的新版信任和安全工具。

此次新发布的Llama 3模型以开源形式提供，包含 8B 和 70B 两种参数规模，涵盖预训练和指令调优的变体。需要说明的是，Llama的中文本土化使用起来是没有问题的，但是略有水土不服，所以很多技术玩家都会在原Llama的基础上进行针对中文使用环境的微调，从而达到了非常理想的使用效果，比如说LLama3-Chinese项目。

另外一点就是Llama作为大型语言模型，虽说免费开源并且可以部署在本地，并且部署起来还非常的简单，Docker就能搞定，但是对于本地部署环境要求非常高，需要强大的CPU以及GPU支持才可以。

而我不忘“不作死就不会死”的折腾初心，今天闲来无事，硬是在自己的NAS上将Llama 3模型跑起来了。

部署

想要使用Docker的方式在自己的NAS上将Llama 3跑起来需要两个容器的支持：

Ollama：一个开源的大型语言模型服务工具，专门用于部署和本地运行开源大型语言模型，比如今天要说的Llama 3模型。
Open WebUI：一个开源的 Web 用户界面工具，为用户提供了友好的界面来与 Ollama 平台进行交互。

NAS不要试，CPU会炸！记录一次本地部署Llama 3大语言模型和Open WebUI的尝试

🔺一般遇到一个项目需要多个容器同时运行的时候，很明显Docker compose堆栈部署效率会更高。今天Llama 3部署的Docker Compose 文件代码为：

version: '3.5' services: ollama: image: ollama/ollama container_name: ollama restart: always volumes: - /share/Docker/ollama:/root/.ollama #提前做好路径映射 ports: - "11434:11434" #端口本地不冲突 open-webui: image: ghcr.io/open-webui/open-webui:main container_name: open-webui restart: always ports: - "3003:8080" #端口本地不冲突 add-host: - "host.docker.internal:host-gateway" volumes: - /share/Docker/Llama3/open-webui:/app/backend/data #提前做好路径映射 volumes: open-webui:

基本上代码修改的地方不多，做好路径映射与端口映射即可。

体验

🔺部署成功后我们需要打开Open WebUI容器的WEB页面，也就是【http:// NAS的局域网IP:端口号】就可以了。首次进入需要点击“Sign up”注册一个账号。

🔺注册很简单，就随意设置名称、邮箱、密码三项即可。

🔺进入Open WebUI后台它默认还是英文主页面，好在它是原生支持中文的。，点击右上角的“设置”按钮。

🔺根据上图提示就能轻松设置成简体中文了。

🔺接着我们就可以直接添加Llama 3大语言模型，也是在“设置”页面，选择“模型”。它会提示让你拉取一个模型，但前提是我们需要知道模型的名称。如果你不清楚可以点它给出的提示“点击这里”。

🔺然后会重新打开另一个新的页面，第一个便是Llama 3。

🔺进入Llama 3页面会有版本选择，以及对应的模型容量大小。我选择了容量相对小一点的“8b”，然后它对应的名称就是上图方框所示的“llama 3:8b”，我们将这个名称复制下来。

🔺粘贴到Open WebUI“设置”页面的模型这里，点“下载”图标。

🔺它就会将模型下载到本地了，并且在下方会有一个下载的进度条显示。因为llama 3:8b模型较大，所以下载的时候可能会比较长，咱们耐心等待便是。

🔺下载完成后回到Open WebUI主页，在顶部位置选中我们下载好的llama 3:8b模型就可以直接使用了。

🔺我先用中文问了它是谁，足足等了三分钟它才回答我，并且还是一个单词一个单词的蹦出来，非常慢。等等，它为什么用英文回答我？

🔺接着我直接让它使用中文介绍下自己，又是等了三分钟，它才一个字一个字的蹦出了如图所示的回答。使用没问题，但是体验真的一言难尽。

🔺在它运行过程中（也就是搜寻答案的时候），NAS风扇狂啸，CPU直接干到99%，并且还是长时间满负载。很明显是处理器到了瓶颈，影响Llama 3模型发挥了。

🔺当我们不运行Llama 3模型的时候，NAS处理器运行又恢复正常。

最后

本次我部署的NAS是华硕AS6704T，处理器为Intel N5105 四核心四线程处理器，这配置放在NAS上还是很能打的，不过用它来跑AI模型还是够呛，特别是Llama 3这种大语言模型，完全就不合适，所以很多玩Llama 模型的爱好者一般会将它部署在本地主机电脑上体验。

说到部署到本地电脑最近知名小主机品牌零刻上新了两款性能小主机：零刻SER8、零刻SEi14。我预计会在下周时候为大家分享零刻SEi14的开箱体验，顺便也会正在该小主机跑一下这个Llama 3大语言模型，我想到时候绝对又是另一番体验了，有兴趣的小伙伴可以关注下我最近的动态哈~

好了，以上就是今天给大家分享的内容，我是爱分享的Stark-C，如果今天的内容对你有帮助请记得收藏，顺便点点关注，咱们下期再见！谢谢大家~

展开收起

使用评测
话题：使用评测关注
数码配件节
话题：数码配件节关注
ASUS/华硕
品牌：ASUS/华硕关注
UGREEN/绿联
品牌：UGREEN/绿联关注
QNAP/威联通
品牌：QNAP/威联通关注
ZSpace/极空间
品牌：ZSpace/极空间关注

+1 63 424 58

Stark-C

一个非主流数码搞机爱好者！致力于发现各种数码好物，分享各类优质软件！ v_x:Stark-CCC

915文章| 1484爆料| 31055粉丝

关注

威联通（QNAP）TS-464C2宇宙魔方四核心处理器nas网络存储服务器内置双M.2插槽

暂无报价

看百科去购买

华硕（ASUS）AS6704T4盘位四核心处理器NAS网络存储/私有云存储服务器/网盘个人云/双2.5G口（不含硬盘）

暂无报价

看百科去购买

极空间私有云Z4Pro16G版四盘位NAS家庭网络存储服务器手机平板扩容

暂无报价

看百科去购买

绿联私有云DX4600Pro四盘位Nas网络存储个人云硬盘服务器相册备份文件同步手机扩容适用iPhone15

￥2699起 去购买

UGREEN 绿联 DX4600 Pro 4盘位NAS（奔腾N6005、8GB）

1899元起

看百科去购买

ZSpace 极空间私有云 Z4Pro 8G版 4盘位NAS存储（N97、8GB)

2499元起

看百科去购买

UGREEN 绿联 DX4600 四盘位NAS存储（赛扬N5105、8GB）

1779元起

看百科去购买

ZSpace 极空间私有云 Z4Pro 性能版 NAS存储（N305、16GB）

3499元起

看百科去购买

QNAP 威联通 TS-464C2 四盘位 NAS网络存储（赛扬N5095、8GB）黑色

2679元起

看百科去购买

ZSpace 极空间私有云 Z4Pro 16G版 4盘位NAS存储（N97、16GB)

2799元起

看百科去购买

ZSpace 极空间私有云 Z423 旗舰版 8盘位NAS存储（锐龙R7-5825U、64GB）

5899元起

看百科去购买

UGREEN 绿联 DX4600+ 4盘位NAS（赛扬N5105、8GB）

1979元起

看百科去购买

ASUS 华硕 AS6702T 4盘位NAS存储黑色（Core2 Quad Q8300、4GB）

4279元起

看百科去购买

QNAP 威联通 TS-466C 四盘位NAS（奔腾N6005、8GB）

3279元起

看百科去购买

UGREEN 绿联 DH2600 双盘位NAS (N5105、4GB)

1329元起

看百科去购买

ZSpace 极空间私有云Z2Pro 四核2盘位NAS家庭个人云网络存储服务器手机平板扩容适用iPhone15 水

1290.51元起

看百科去购买

ZSpace 极空间私有云 T2 2盘位NAS存储（RK 3568、4GB）

1779元起

看百科去购买

QNAP 威联通 TS-464C 4盘位NAS（赛扬N5095、8GB）

2079元起

看百科去购买

ZSpace 极空间私有云Z2Pro 四核2盘位NAS家庭个人云网络存储服务器手机平板扩容适用iPhone15

1299元起

看百科去购买

ZSpace 极空间私有云Q2C四核Nas网络存储服务器家庭个人云网盘水墨黑

899元起

看百科去购买

文中相关商品

京东

QNAP 威联通 TS-464C2 四盘位 NAS网络存储（赛扬N5095、8GB）黑色

全网3家在售

¥2679

降价提醒

¥ 低于此价格提醒我

+关注

历史价格 2024-04-24 历史最低到手价￥2582.5

60天数据来源:什么值得买整理提供

去购买

京东

ASUS 华硕 AS6702T 4盘位NAS存储黑色（Core2 Quad Q8300、4GB）

全网1家在售

¥4279

降价提醒

¥ 低于此价格提醒我

+关注

历史价格 2024-02-06 历史最低到手价￥3791.55

60天数据来源:什么值得买整理提供

去购买

京东

ZSpace 极空间私有云 Z4Pro 16G版 4盘位NAS存储（N97、16GB)

全网2家在售

¥2799

降价提醒

¥ 低于此价格提醒我

+关注

历史价格 2024-04-25 历史最低到手价￥2644.05

60天数据来源:什么值得买整理提供

去购买

京东

绿联私有云DX4600Pro四盘位Nas网络存储个人云硬盘服务器相册备份文件同步手机扩容适用iPhone15

58评论

精彩
最新

birdhuman

举报踩评论(1)

这方面的话x86甚至可能不如arm。rk3568已经有个0.8Tops的NPU了，现在手机U全都带神经处理单元，专用芯片效率高。

04-26 14:59 · 上海

3

回复

校验提示文案

提交

橘子校区

birdhuman

举报踩评论(0)

您真会说笑话

04-27 08:01 · 北京

2

回复

校验提示文案

提交

值友9316152340

birdhuman

举报踩评论(0)

您真会说笑

04-27 09:57 · 河南

2

回复

校验提示文案

提交

还有2条回复

收起所有回复
非正常天气

举报踩评论(0)

这cpu承担了他不应承担的负担

04-26 14:06 · 北京

8

回复

校验提示文案

提交

Stark-C

作者

非正常天气

举报踩评论(0)

没炸就好

04-26 17:13 · 湖北

1

回复

校验提示文案

提交

收起所有回复
冥冰薇

举报踩评论(0)

我明天用独显试一下

04-25 23:31 · 北京

1

回复

校验提示文案

提交

Stark-C

作者

冥冰薇

举报踩评论(0)

可以，我的老显卡5700xt跑起来都没问题，另外，如果是使用gpu部署指令会有略微改动，不过对于你来说你应该会知道怎么做

04-26 07:33 · 湖北

1

回复

校验提示文案

提交

vcta

冥冰薇

举报踩评论(0)

大哥该起床更新了

04-26 12:17 · 陕西

1

回复

校验提示文案

提交

收起所有回复
长广溪铁公鸡

举报踩评论(0)

我有3090 不怕

04-26 09:51 · 江苏

赞

回复

校验提示文案

提交

Stark-C

作者

长广溪铁公鸡

举报踩评论(0)

可以起飞了

04-26 11:36 · 湖北

赞

回复

校验提示文案

提交

收起所有回复
值友9918046395

举报踩评论(0)

a卡可行？

04-26 11:56 · 黑龙江

赞

回复

校验提示文案

提交

Stark-C

作者

值友9918046395

举报踩评论(0)

可行

04-26 13:38 · 湖北

赞

回复

校验提示文案

提交

收起所有回复
大兄弟在瞅着你

举报踩评论(0)

终于有开源的了，这下可以抄车了

04-26 00:30 · 广东

5

回复

校验提示文案

提交

快乐的袋袋

大兄弟在瞅着你

举报踩评论(0)

问题是考试抄学霸有比学霸考的还高的吗

04-26 10:31 · 天津

赞

回复

校验提示文案

提交

Stark-C

作者

快乐的袋袋

举报踩评论(0)

不管咋样绝对比nas高啊

04-26 11:35 · 湖北

2

回复

校验提示文案

提交

还有1条回复

收起所有回复
可恶的大O

举报踩评论(0)

文字都认识，连在一起就看不懂了

04-26 15:03 · 广东

4

回复

校验提示文案

提交

夏马和纱

可恶的大O

举报踩评论(0)

你还看这个

05-03 07:16 · 湖南

赞

回复

校验提示文案

提交

可恶的大O

夏马和纱

举报踩评论(0)

主页推的

05-04 17:43 · 广东

赞

回复

校验提示文案

提交

收起所有回复
你说你爱了不该爱的人

举报踩评论(0)

会不会硬盘涨价也跟这个有关

04-26 14:33 · 上海

2

回复

校验提示文案

提交
雨鱼1988国酿精品

举报踩评论(0)

没啥乱用，语言的，一大堆，要是图片的做点被禁的事儿自己部署还有意思

04-26 12:45 · 浙江

1

回复

校验提示文案

提交

diy-yes

雨鱼1988国酿精品

举报踩评论(0)

Gemini 开源的。

04-27 09:24 · 北京

赞

回复

校验提示文案

提交

收起所有回复
呱呱爱吃瓜瓜

举报踩评论(0)

我准备好了

04-27 11:14 · 天津

1

回复

校验提示文案

提交
暮色雪影

举报踩评论(0)

我mbp跑8b模型cpu也飙到90%

04-27 22:40 · 北京

1

回复

校验提示文案

提交
1saac丶

举报踩评论(0)

有没有 win 的攻略来一个学习一下

04-26 09:55 · 福建

赞

回复

校验提示文案

提交

值友9316152340

1saac丶

举报踩评论(0)

jan.ai

04-27 09:57 · 河南

赞

回复

校验提示文案

提交

值友9316152340

1saac丶

举报踩评论(0)

但是因为模型在huggingface...可能需要科学

04-27 09:58 · 河南

赞

回复

校验提示文案

提交

还有1条回复

收起所有回复
值友2959201326

举报踩评论(0)

8b 4g显存就可以了，我用mac玩的

04-26 09:57 · 陕西

赞

回复

校验提示文案

提交

fivebaby

值友2959201326

举报踩评论(0)

我32G 内存有独立显卡的 MacBook Pro 跑8B都费劲.当然 phi3勉强可以

04-27 07:46 · 陕西

赞

回复

校验提示文案

提交

收起所有回复
往记

举报踩评论(0)

刚好组了个电脑，跑下试试

04-26 10:16 · 江西

赞

回复

校验提示文案

提交
mige

举报踩评论(0)

我在服务器上部署了，根本跑不动

04-26 12:04 · 云南

赞

回复

校验提示文案

提交
灵KOYB

举报踩评论(0)

上tpu

04-26 13:46 · 广东

赞

回复

校验提示文案

提交
灵KOYB

举报踩评论(0)

已经在威联通用GUI部署，确实很有趣

04-26 20:00 · 广东

赞

回复

校验提示文案

提交

喜欢吃小龙虾

灵KOYB

举报踩评论(0)

威联通什么型号，跑这个ai吃力吗

04-27 02:15 · 安徽

赞

回复

校验提示文案

提交

灵KOYB

喜欢吃小龙虾

举报踩评论(0)

1290和1688都测试了，可以运行，部署不需要任何命令行，全程GUI点，1290测试给n卡可行。没有独显的情况，软件只会占用50%左右的cpu，图片可以识别，文字对话太ai，也算对得起这个那么大的本地模型。

04-28 00:16 · 广东

赞

回复

校验提示文案

提交

收起所有回复
yulll

举报踩评论(0)

Intel Xeon D-1527不知道能跑不

04-26 22:45 · 河南

赞

回复

校验提示文案

提交
股票大涨

举报踩评论(0)

相比于现在这些心甘情愿花钱花时间给ai当肥料的，当年挖矿的那些人要靠谱的多。

04-27 05:34 · 黑龙江

赞

回复

校验提示文案

提交
iQing

举报踩评论(0)

炸是什么意思？。。。。

04-27 05:54 · 福建

赞

回复

校验提示文案

提交

1
2
转至页
GO

羊毛还要吗

举报踩评论(0)

你是不是对nas有什么误解?
别说大模型了，小模型cpu跑都够呛。13900k满载效率也很低。

04-30 10:03 · 江苏

赞

回复

校验提示文案

提交
陸沁瓷

举报踩评论(0)

直接在docker里面部署吗

04-29 09:37 · 湖北

赞

回复

校验提示文案

提交
陸沁瓷

举报踩评论(0)

有没有整合包

04-29 09:26 · 湖北

赞

回复

校验提示文案

提交
深中医林医生

举报踩评论(0)

我的黑裙的E2176M申请一战！！

04-28 22:44 · 广东

赞

回复

校验提示文案

提交
咖啡泠

举报踩评论(0)

nas跑这个，这是有啥想不开的吗。。。

04-28 08:08 · 上海

赞

回复

校验提示文案

提交
今天天气不错啊

举报踩评论(0)

可惜要显卡，不然部署v上玩玩了

04-28 07:56 · 天津

赞

回复

校验提示文案

提交
暮色雪影

举报踩评论(0)

我mbp跑8b模型cpu也飙到90%

04-27 22:40 · 北京

1

回复

校验提示文案

提交
李沐衡

举报踩评论(0)

不入虎穴，焉得虎子

04-27 16:50 · 北京

赞

回复

校验提示文案

提交
极客速报

举报踩评论(0)

介绍的很详细，学习了

04-27 14:18 · 黑龙江

赞

回复

校验提示文案

提交
霹雳猫

举报踩评论(0)

@AI小值-电脑数码把

04-27 12:27 · 山东

赞

回复

校验提示文案

提交

AI小值-电脑数码

霹雳猫

举报踩评论(0)

Llama 3是Meta最新发布的开源大模型，性能出色，尤其在代码生成和推理方面。部署它需要强大的CPU和GPU，不适合在NAS如华硕AS6704T上运行，可能导致CPU长时间满载。若想本地部署，建议考虑更高性能的设备。

04-27 12:27

赞

回复

校验提示文案

提交

收起所有回复
贷款吃肉肉

举报踩评论(0)

可以用核显跑不？比如N100

04-27 11:49 · 美国

赞

回复

校验提示文案

提交
DUOi

举报踩评论(0)

不知道8700带不带得动……

04-27 11:44 · 湖南

赞

回复

校验提示文案

提交
呱呱爱吃瓜瓜

举报踩评论(0)

我准备好了

04-27 11:14 · 天津

1

回复

校验提示文案

提交
值友9316152340

举报踩评论(0)

如果是电脑的话可以试一下jan.ai

04-27 09:59 · 河南

赞

回复

校验提示文案

提交
esmilesjj

举报踩评论(0)

我在mac mini m1上跑，基本上问题扔进去，实时出结果

04-27 09:46 · 辽宁

赞

回复

校验提示文案

提交

值友9316152340

esmilesjj

举报踩评论(0)

m1性能要比这个n5105快差不多十倍吧。

04-27 09:59 · 河南

1

回复

校验提示文案

提交

收起所有回复
风筝一线牵

举报踩评论(0)

可以直接下载不需要翻吗

04-27 08:08 · 安徽

赞

回复

校验提示文案

提交
iQing

举报踩评论(0)

炸是什么意思？。。。。

04-27 05:54 · 福建

赞

回复

校验提示文案

提交
股票大涨

举报踩评论(0)

相比于现在这些心甘情愿花钱花时间给ai当肥料的，当年挖矿的那些人要靠谱的多。

04-27 05:34 · 黑龙江

赞

回复

校验提示文案

提交
yulll

举报踩评论(0)

Intel Xeon D-1527不知道能跑不

04-26 22:45 · 河南

赞

回复

校验提示文案

提交
灵KOYB

举报踩评论(0)

已经在威联通用GUI部署，确实很有趣

04-26 20:00 · 广东

赞

回复

校验提示文案

提交

喜欢吃小龙虾

灵KOYB

举报踩评论(0)

威联通什么型号，跑这个ai吃力吗

04-27 02:15 · 安徽

赞

回复

校验提示文案

提交

灵KOYB

喜欢吃小龙虾

举报踩评论(0)

1290和1688都测试了，可以运行，部署不需要任何命令行，全程GUI点，1290测试给n卡可行。没有独显的情况，软件只会占用50%左右的cpu，图片可以识别，文字对话太ai，也算对得起这个那么大的本地模型。

04-28 00:16 · 广东

赞

回复

校验提示文案

提交

收起所有回复