当前位置: 首页> 健康> 科研 > 大模型学习

大模型学习

时间:2025/9/12 5:45:16来源:https://blog.csdn.net/weixin_44021553/article/details/139823906 浏览次数:0次

大模型

  • Llama-factory平台使用lora微调Qwen
    • 1. 配置环境
    • 2. 在阿里云平台上下载llama-factory的git clone代码
    • 3. 下载千问大模型Qwen1.5-0.5b,放到llama-factory项目代码下面
    • 4. 训练自己的数据集
      • 4.1 模仿dataset_info.json中的其他数据集格式,添加自己的数据集
      • 4.2 写一个自己的数据集json文件
      • 4.3 训练需要修改的yaml文件
  • QLore
    • NF4是一种数据类型(具体怎么表示的,没学会)

Llama-factory平台使用lora微调Qwen

github地址:https://github.com/hiyouga/LLaMA-Factory

1. 配置环境

在阿里云服务器上配置,镜像不要包含TensorFlow,且满足github上的环境要求就行

2. 在阿里云平台上下载llama-factory的git clone代码

3. 下载千问大模型Qwen1.5-0.5b,放到llama-factory项目代码下面

记录放代码的路径

4. 训练自己的数据集

在这里插入图片描述

4.1 模仿dataset_info.json中的其他数据集格式,添加自己的数据集

4.2 写一个自己的数据集json文件

4.3 训练需要修改的yaml文件

调epoch,数据集,模型等等
在这里插入图片描述

QLore

B站up讲解

NF4是一种数据类型(具体怎么表示的,没学会)

是专门对符合正态分布的数据做量化用的
也就是,把数据换个更节省空间的方式储存起来,就叫量化,用的时候再
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

关键字:大模型学习

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

责任编辑: