访谈 |股票 |创投人物 |产业 |金融 |维修 |车展 |报价 |行情 |时评 |新车 |数码 |互联网 |名企 |IT业 |能源

当前位置：首页> 财经> 产业 > gpt、llama大模型模型结构细节探索

gpt、llama大模型模型结构细节探索

时间:2025/8/29 15:21:11来源：https://blog.csdn.net/weixin_42357472/article/details/139570183 浏览次数:0次

参考：
https://github.com/naklecha/llama3-from-scratch（一定要看看）
https://github.com/karpathy/build-nanogpt/blob/master/play.ipynb

视频：
https://www.youtube.com/watch?v=l8pRSuU81PU
在这里插入图片描述

https://tiktokenizer.vercel.app/ （可以查看场景大模型的tiktokenizer具体值encode与decode）
在这里插入图片描述

可以通过transformers加载模型查看具体结构和权重情况：

from transformers import GPT2LMHeadModelmodel_hf = GPT2LMHeadModel.from_pretrained("gpt2") # 124M
sd_hf = model_hf.state_dict()for k, v in sd_hf.items():print(k, v.shape)

在这里插入图片描述
可以查看打印每层权重：

sd_hf["transformer.wpe.weight"].view(-1)[:20]import matplotlib.pyplot as plt
%matplotlib inlineplt.imshow(sd_hf["transformer.wpe.weight"], cmap="gray")

在这里插入图片描述

关键字：gpt、llama大模型模型结构细节探索

版权声明:

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

责任编辑：

>> 相关文章

>> 热门图片

精品毛卡卡1卡2卡3麻豆_商城高中_seo策略_友情链接站长平台

精品毛卡卡1卡2卡3麻豆_商城高中_seo策略_友情链接站长平台

电子商务网站策划书_科技侠智能锁_百度权重查询工具_网站目录提交

电子商务网站策划书_科技侠智能锁_百度权重查询工具_网站目录提交

移动电子商务的概念_win7优化工具_杭州专业seo公司_百度快照提交入口

移动电子商务的概念_win7优化工具_杭州专业seo公司_百度快照提交入口

深圳外贸商城网站建设_黄冈网站推广下载_大连seo优化_百度快照是怎么做上去的

深圳外贸商城网站建设_黄冈网站推广下载_大连seo优化_百度快照是怎么做上去的

免费ppt模板下载医院_绍兴网站设计_内容企业推广_今日重要新闻

免费ppt模板下载医院_绍兴网站设计_内容企业推广_今日重要新闻

免费货源在线永久_五大门户网站_推广网站制作_关键词排名点击软件怎样

免费货源在线永久_五大门户网站_推广网站制作_关键词排名点击软件怎样

交换链接营销的成功案例_黄冈网站_2022近期重大新闻事件10条_网络营销文案实例

交换链接营销的成功案例_黄冈网站_2022近期重大新闻事件10条_网络营销文案实例

肇庆网站建设推广_浙江省省委领导_合肥百度关键词推广_互联网推广的方式

肇庆网站建设推广_浙江省省委领导_合肥百度关键词推广_互联网推广的方式

>> 热门搜索

评论排行

图片新闻

怎么查询域名是否备案_冰桶挑战是什么网络营销方式_b2b平台网站_线上营销活动案例

网站建设项目管理论文_免费二维码生成工具_外贸平台推广_google seo整站优化

简单的网页制作源代码大全_商丘seo公司甄选24火星_百度怎么优化网站关键词_市场营销四大分析方法

昆明网红打卡地有哪些地方_安卓手机软件开发_上海seo培训_北京发生大事了

点击排行