模型初始化常用参数设置

📅 2026/6/29 19:28:26
模型初始化常用参数设置
模型初始化参数temperature 参数练习max_tokens 参数练习在LangChain中Model Class 和init_chat_model初始化模型共同的参数及解释。API参考文档:https://docs.langchain.org.cn/oss/python/langchain/models#parameterstemperature 参数使用场景选择:0.0-0.3需要一致性、准确性的任务数学计算、数据提取、分类、代码生成0.5-0.7平衡创造性和一致性聊天、问答0.8-1.5创造性任务写作、头脑风暴1.5-2.0高度创造性诗歌、故事创作.env文件#从DeepSeek官网获取的配置信息DEEPSEEK_API_KEYsk-31c9440dxxxxxfb91eeec513XXXXX DEEPSEEK_BASE_URLhttps://api.deepseek.comtemperature 参数练习代码如下# 模型初始化的参数使用情况# temperature# 在langChain中, Model Class和init_chat_model初始化模型共同的参数和解释# API文档https://docs.langchain.org.cn/oss/python/langchain/models#parameters# model :使用的特定提供商的模型名称(必需)。比如openai:gpt-4o、groq:gemma2-9b-it# model_provider模型提供商名称# api_key :API 密钥。如果不提供会从环境变量中读取如DEEPSEEK_API_KEY # base_url 大模型供应商API请求地址。# temperature : 控制输出随机性范围 0.0-2.0温度越高输出越随机。- 0.0 最确定性输出几乎不 - 1.0 平衡创造性和一致性- 2.0 最随机最有创造性# max_tokens 限制模型输出的最大 token 数量# timeout :float 超时时间秒超时未响应请求会被取消。# max_retries:请求失败如网络问题、速率限制时的最大重试次数# temperature 参数根据使用场景选择# 0.0-0.3需要一致性、准确性的任务数学计算、数据提取、分类、代码生成# 0.5-0.7平衡创造性和一致性聊天、问答# 0.8-1.5创造性任务写作、头脑风暴# 1.5-2.0高度创造性诗歌、故事创作fromlangchain.chat_modelsimportinit_chat_modelimportosfromdotenvimportload_dotenv# 加载配置文件load_dotenv(overrideTrue)DEEPSEEK_API_KEYos.getenv(DEEPSEEK_API_KEY)DEEPSEEK_BASE_URLos.getenv(DEEPSEEK_BASE_URL)# 获取大模型modelinit_chat_model(modeldeepseek-v4-flash,model_providerdeepseek,temperature1.5,api_keyDEEPSEEK_API_KEY,base_urlDEEPSEEK_BASE_URL,)#向模型发送单条数据foriinrange(3):responsemodel.invoke(帮我写一首易青娥的歌词)print(response.content)max_tokens 参数练习Token是什么基本单位 : 大模型通过分词器Tokenizer将文本拆分后的最小语义单元是token相当于自然语言中的词或字。不同的模型采用不同的 分词算法 如BPE、WordPiece因此同一段文本在不同模型中的Token数量可能不同。收费依据 大语言模型通常也是以token的数量作为其计量或收费的依据。1个中文Token≈1-1.8个汉字1个英文Token≈3-4个字符Token与字符转化的可视化工具OpenAI提供https://platform.openai.com/tokenizer百度智能云提供https://console.bce.baidu.com/support/#/tokenizer代码如下# 模型初始化的参数使用情况# Token:基本单位 : 大模型通过分词器Tokenizer将文本拆分后的最小语义单元是token相当于自然语言中的词或字。不同的模型采用不同的 分词算法 如BPE、WordPiece因此同一段文本在不同模型中的Token数量可能不同。# 收费依据 大语言模型通常也是以token的数量作为其计量或收费的依据。 1个中文Token≈1-1.8个汉字1个英文Token≈3-4个字符# Token与字符转化的可视化工具OpenAI提供https://platform.openai.com/tokenizer ,百度智能云提供https://console.bce.baidu.com/support/#/tokenizer# max_tokens 限制模型输出的最大 token 数量fromlangchain.chat_modelsimportinit_chat_modelimportosfromdotenvimportload_dotenv# 加载配置文件load_dotenv(overrideTrue)DEEPSEEK_API_KEYos.getenv(DEEPSEEK_API_KEY)DEEPSEEK_BASE_URLos.getenv(DEEPSEEK_BASE_URL)# 获取大模型modelinit_chat_model(modeldeepseek-v4-flash,model_providerdeepseek,# temperature1.5,max_tokens10,api_keyDEEPSEEK_API_KEY,base_urlDEEPSEEK_BASE_URL,)#向模型发送单条数据responsemodel.invoke(学首歌)print(response)