项目之 头满分_4大模型LLM

📅 2026/6/20 17:52:05
项目之 头满分_4大模型LLM
一、回顾模型选型的第四个方案三期中Bert的实际速度慢点使用了 30多ms但是效果不错Bert在 2018-2021 这四年中占主流模型2022、2023年开始后有些大模型发展起来了第四期尝试使用大模型来做二、关于大模型LLM1. 什么是LLMLLM是具有大规模参数的深度学习模型参数量通常十亿到万亿级别。参数十亿以上才算大模型Bert不算大模型Bert最大模型参数量最多才3亿所以Bert不是大模型独立意义上的大模型指的是 具有涌现能力的大模型参数量至少百亿以上达到人类大脑神经元个数10亿 1B大模型发展历程基于Transformer发展而来的① 2017年Transformer — 2018年BERT、GPT严格意义上前面的BERT GPT都不算大模型从GPT-2开始才算—② 2019年GPT-2 — 2020年GPT-3 — 2022年GPT-3.5真正的大模型从2022年ChatGPT这个时间点开始 后面的都是大模型 —③ 2022年ChatGPT —2022年11月3号ChatGPT发布后面的三年2023年LLaMA羊驼系列、GPT-42024年GPT-4o、LLaMA-3.1、OpenAI-o12025年DeepSeek-R1、Qwen-3 千问系列、文心一言-4.5 最新的文心一言系列、华为盘古系列1.1 模型单位1.2 大模型训练硬件三、代码结构图四、原理及代码实现1. 数据预处理操作1.对于导包深度学习框架是Pytorch 》LLM框架LangChain2. 初始化语言模型ChatOpenAI( )参数基础的base_url、api_key、模型model、model_kwargsbase_url知道从哪里进行访问因为其收费需要秘钥 api_key4.定义LLM调用函数通过 .invoke加载问题提示词来回复问题这就是回答问题的过程后面是文本和label的处理2. DeepSeek分类逻辑实现提示词工程声明角色、回复格式、写示例Text、类别自己调用DeepSeek案例最终的准确率为86%所以用大模型也并不一定可行