项目之头满分_4大模型LLM

📅 2026/6/20 17:52:05

一、回顾模型选型的第四个方案三期中Bert的实际速度慢点使用了 30多ms但是效果不错Bert在 2018-2021 这四年中占主流模型2022、2023年开始后有些大模型发展起来了第四期尝试使用大模型来做二、关于大模型LLM1. 什么是LLMLLM是具有大规模参数的深度学习模型参数量通常十亿到万亿级别。参数十亿以上才算大模型Bert不算大模型Bert最大模型参数量最多才3亿所以Bert不是大模型独立意义上的大模型指的是具有涌现能力的大模型参数量至少百亿以上达到人类大脑神经元个数10亿 1B大模型发展历程基于Transformer发展而来的① 2017年Transformer — 2018年BERT、GPT严格意义上前面的BERT GPT都不算大模型从GPT-2开始才算—② 2019年GPT-2 — 2020年GPT-3 — 2022年GPT-3.5真正的大模型从2022年ChatGPT这个时间点开始后面的都是大模型 —③ 2022年ChatGPT —2022年11月3号ChatGPT发布后面的三年2023年LLaMA羊驼系列、GPT-42024年GPT-4o、LLaMA-3.1、OpenAI-o12025年DeepSeek-R1、Qwen-3 千问系列、文心一言-4.5 最新的文心一言系列、华为盘古系列1.1 模型单位1.2 大模型训练硬件三、代码结构图四、原理及代码实现1. 数据预处理操作1.对于导包深度学习框架是Pytorch 》LLM框架LangChain2. 初始化语言模型ChatOpenAI( )参数基础的base_url、api_key、模型model、model_kwargsbase_url知道从哪里进行访问因为其收费需要秘钥 api_key4.定义LLM调用函数通过 .invoke加载问题提示词来回复问题这就是回答问题的过程后面是文本和label的处理2. DeepSeek分类逻辑实现提示词工程声明角色、回复格式、写示例Text、类别自己调用DeepSeek案例最终的准确率为86%所以用大模型也并不一定可行

新闻详情

相关阅读

任意文件下载漏洞挖掘：30个实战技巧与防御方案

Time-LLM：大语言模型重编程技术实现时间序列预测的范式转变

Kimi 2.6深度解析：长上下文、树状推理与Agent集群实战

嵌入式GUI开发实战：HEADER与ICONVIEW控件详解与应用

5个关键理由告诉你为什么awesome-shadcn-ui是开发者的必备资源宝库

终极指南：用jExifToolGUI轻松管理照片元数据的完整解决方案

ComfyUI_TTP_Toolset终极指南：零基础实现8K超分辨率图像处理

Gemini 3.1 Pro 国内可用性实测与云函数中转方案

Postman+Newman+GitLab+Jenkins接口自动化测试流水线搭建指南

HarmonyOS6踩坑记录之Navigation + Tabs 嵌套后路由栈全乱了？每个 Tab 独立 NavPathStack 才是正解

MCU系统集成模块(SIM)详解：复位、中断与低功耗管理实战

目标检测进阶：从IoU到CIoU，边框回归损失函数演进全解析与实战对比