当前位置: 首页> 汽车> 时评 > 网页美工设计需求分析_网站优化北京哪家强?_软文网站推广_seo推广是什么意思

网页美工设计需求分析_网站优化北京哪家强?_软文网站推广_seo推广是什么意思

时间:2025/7/12 9:32:25来源:https://blog.csdn.net/qq_52241167/article/details/147222722 浏览次数: 0次
网页美工设计需求分析_网站优化北京哪家强?_软文网站推广_seo推广是什么意思

实例流程

显存优化

## BS=BatchSize 、 GA=梯度累加

## BS=1,GA=32  同等  BS=32

def process_function(examples):tokenized_examples = tokenizer(examples["review"], max_length=32, truncation=True, padding="max_length")tokenized_examples["labels"] = examples["label"]return tokenized_examplestrain_args = TrainingArguments(output_dir="./checkpoints",      # 输出文件夹per_device_train_batch_size=2,   # 训练时的batch_sizegradient_accumulation_steps=32,  # *** 梯度累加 ***gradient_checkpointing=True,     # *** 梯度检查点 ***  选择性保存激活值,未保存的在反向传播出,重新计算optim="adafactor",               # *** adafactor优化器 *** per_device_eval_batch_size=4,    # 验证时的batch_sizenum_train_epochs=1,              # 训练轮数logging_steps=10,                # log 打印的频率eval_strategy="epoch",     # 评估策略save_strategy="epoch",           # 保存策略save_total_limit=3,              # 最大保存数learning_rate=2e-5,              # 学习率weight_decay=0.001,              # weight_decaymetric_for_best_model="f1",      # 设定评估指标load_best_model_at_end=True)     # 训练完成后加载最优模型
train_args# *** 参数冻结 *** 
for name, param in model.bert.named_parameters():param.requires_grad = False

关键字:网页美工设计需求分析_网站优化北京哪家强?_软文网站推广_seo推广是什么意思

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

责任编辑: