网页美工设计需求分析_网站优化北京哪家强?_软文网站推广_seo推广是什么意思

时间:2025/8/27 11:50:26来源：https://blog.csdn.net/qq_52241167/article/details/147222722 浏览次数: 0次

实例流程

显存优化

## BS=BatchSize 、 GA=梯度累加

## BS=1,GA=32 同等 BS=32

def process_function(examples):tokenized_examples = tokenizer(examples["review"], max_length=32, truncation=True, padding="max_length")tokenized_examples["labels"] = examples["label"]return tokenized_examplestrain_args = TrainingArguments(output_dir="./checkpoints",      # 输出文件夹per_device_train_batch_size=2,   # 训练时的batch_sizegradient_accumulation_steps=32,  # *** 梯度累加 ***gradient_checkpointing=True,     # *** 梯度检查点 ***  选择性保存激活值，未保存的在反向传播出，重新计算optim="adafactor",               # *** adafactor优化器 *** per_device_eval_batch_size=4,    # 验证时的batch_sizenum_train_epochs=1,              # 训练轮数logging_steps=10,                # log 打印的频率eval_strategy="epoch",     # 评估策略save_strategy="epoch",           # 保存策略save_total_limit=3,              # 最大保存数learning_rate=2e-5,              # 学习率weight_decay=0.001,              # weight_decaymetric_for_best_model="f1",      # 设定评估指标load_best_model_at_end=True)     # 训练完成后加载最优模型
train_args# *** 参数冻结 *** 
for name, param in model.bert.named_parameters():param.requires_grad = False

关键字：网页美工设计需求分析_网站优化北京哪家强?_软文网站推广_seo推广是什么意思

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

责任编辑：