Llama3 是Meta公司开发的。2024年4月18号开源,8B,70B两个版本。最大支持的8192的token的序列长度(GPT-4 支持128K)
Llama3在Meta自制的两个24K GPU集群进行预训练,使用15T的训练数据。其中5%位非英文数据(95%是英文数据),故Llama3的中文能力稍弱,Meta当时认为Llama3是当时最强的开源大模型。
硬件要求
8B部署测试
1.*Cpu*: Intel Core i7或者AMD等价(至少4个核心)
2.*GPU*:NVIDIA GeForce GTX 1060或AMD Radeon RX 580(至少6GB VRAM)
3.*内存*:至少16GB的RAM
4.*操作系统*:Ubuntu 20.04或者更高版本
部署环境
- Llama3的部署环境困境对各个包的版本需求有些严格,需要注意,否则会报各种错误。最需要注意的是Transformers的版本,必须大于4.39.0
- Llama3比较新,老版本的transformers里面没有Llamas3的模型和分词器,另外就是pytorch和cuda的版本,torch2.1.0 +, cuda11.8+
llama3.2-1B-Instruct
SDK 下载
pip install modlescope
魔塔社区:下载模型
vocab 字符集放到了模型文件内。modelscope
transformers模型用的数据类型有三种float32,float16,float8
llama3使用的float16
vocab size:128256