离线大模型的种类

📅 2026/6/28 18:33:31

下载离线大模型在下载离线大模型前要先在命令行执行下面的pip安装命令pip install modelscope接着命令行通过cd命令进入Python工程的所在目录再执行下面的模型下载命令modelscope download --model Qwen/Qwen1.5-1.8B-Chat --local_dir qwen1.5-1.8b-chat上面下载命令的“--model”参数表示离线大模型为“Qwen/Qwen1.5-1.8B-Chat”而“--local_dir”参数表示离线大模型的本地保存目录。注意Qwen1.5-1.8B-Chat的总大小为3.69GB下载过程较耗时请耐心等待。下载完毕即可在Python工程的目录下方找到qwen1.5-1.8b-chat文件夹里面保存的便是Qwen1.5-1.8B-Chat的具体模型文件。三、使用离线大模型输出摘要接下来演示如何使用Qwen1.5-1.8B-Chat对一段文本生成摘要。在编写Python代码前要先在命令行执行下面的pip安装命令pip install transformers然后编写下面的Python摘要测试代码from transformers import AutoTokenizer, AutoModelForCausalLM model_path ./qwen1.5-1.8b-chat # 离线大模型的本地保存目录 def local_model_summary(text: str, max_new_tokens256) - str: 加载本地离线模型 Qwen1.5-1.8B-Chat 做摘要【无需联网、无需下载、纯本地运行】 # 加载本地分词器本地模型完全离线 tokenizer AutoTokenizer.from_pretrained( model_path, trust_remote_codeTrue # Qwen 必须加这个 ) model AutoModelForCausalLM.from_pretrained( model_path, trust_remote_codeTrue, # Qwen 必须加这个 dtypeauto, device_mapauto ).eval() # 构造 Qwen1.5 官方对话格式 messages [ {role: system, content: 请对用户输入的内容做精简摘要摘要文字压缩在50字以内}, {role: user, content: text} ] # 官方模板构造 text_input tokenizer.apply_chat_template( messages, tokenizeFalse, add_generation_promptTrue ) inputs tokenizer( [text_input], return_tensorspt, truncationTrue ).to(model.device) # 离线生成摘要 outputs model.generate( **inputs, max_new_tokensmax_new_tokens, # 返回文本最多占用多少Token temperature0.3, top_p0.7, do_sampleTrue, pad_token_idtokenizer.eos_token_id ) # 提取摘要结果 response outputs[0][len(inputs[input_ids][0]):] summary tokenizer.decode(response, skip_special_tokensTrue) return summary.strip() if __name__ __main__: content 火山方舟是火山引擎推出的大模型平台提供模型训练、推理、评测、精调等全方位功能与服务。平台支持多种主流大模型接入具有稳定可靠、安全互信的特点。企业可以通过火山方舟快速构建自己的AI应用降低开发成本与技术门槛。 print(正在使用【本地离线模型】生成摘要...\n) result local_model_summary(content, max_new_tokens28) print(【离线摘要结果】) print(-, result)运行上面的Python代码输出日志结果如下

新闻详情

相关阅读

如何用SMU Debug Tool终极优化AMD Ryzen处理器性能：完整调试指南

Flow Launcher完整指南：如何用免费开源工具3倍提升Windows效率

终极mikufans直播录制指南：录播姬让你不再错过任何精彩内容

DBF Viewer 2000：解锁遗留数据库文件的现代工作流

零基础到硬件部署：3个步骤掌握Logisim-Evolution数字电路仿真

电源系统噪声抑制实战：LDO选型中的PSRR与输出噪声深度解析

3个关键问题：为什么专业艺术家都在使用Blender FLIP Fluids流体模拟插件？

工具：Slidev 进阶实战：打造高互动技术演示

抖音批量下载助手：一键保存创作者所有视频的完整指南

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！