大语言模型LLaMA13搭建教程你知道吗?要注意什么?
2023-05-22 09:53:11 来源:中国商业新闻网
用2060就能跑了!大语言模型LLaMA13搭建教程
Meta的大语言模型LLaMA 13B,现在用2060就能跑了~
羊驼家族的Alpaca和Vicuna也都能运行,显存最低只需要6G,简直是低VRAM用户的福音有木有。
GitHub上的搭建教程火了之后,网友们纷纷跑来问苹果M2是不是也能跑。
这通操作的大致原理是利用最新版CUDA,可以将Transformer中任意数量的层放在GPU上运行。
与此前llama.cpp项目完全运行在CPU相比,用GPU替代一半的CPU可以将效率提高将近2倍。
而如果纯用GPU,这一数字将变成6倍。
网友实测的结果中,使用CPU每秒能跑2.1个token,而用GPU能跑3.2个。
生成的内容上,开发者成功用它跑出了“尼采文学”。
如何操作在开始搭建之前,我们需要先申请获得LLaMA的访问权限。
传送门:https://ai.facebook.com/blog/large-language-model-llama-meta-ai/
此外还需要有一个Linux环境。(Windows用户可以用WSL2)
准备工作完成之后,第一步是将llama.cpp克隆到本地。
相关阅读
-
大语言模型LLaMA13搭建教程你知道吗?要...
用2060就能跑了!大语言模型LLaMA13搭建教程Meta的大语言模型LLaMA ... -
微星发布PCIe4.0SSDM480PRO系列了吗?有...
微星发布PCIe4 0SSDM480PRO系列发布PCIe 5 0 SSD虽然已经开始浮... -
红魔公布电竞新物种 氘锋150W充电器 ...
红魔公布电竞新物种:氘锋150WN充电器红魔电竞宇宙新品发布会将于5... -
龙芯桌面和服务器平台又新增172款适配产...
新增172款适配产品!龙芯中科发布新架构2021年4月份,龙芯中科发布了... -
帮同事打卡被公司开除 法院会怎样判呢?
【以案释法】帮人打卡被公司开除,法院判了你有帮同事打卡的经历吗... -
x86和ARM之后 中国第三大CPU架构诞生了...
x86和ARM之后的第三大CPU架构:Raja-V加入董事会在宣布从Intel离开...