全国前十装饰公司排名_成都流行病毒最新消息_广告开户南京seo_培训行业seo整站优化

时间:2025/7/13 21:26:40来源：https://blog.csdn.net/qq_27390023/article/details/143059671 浏览次数:0次

torch.utils.checkpoint.checkpoint 是 PyTorch 提供的一种内存优化工具，用于在计算图的反向传播过程中节省显存。它通过重新计算某些前向传播的部分，减少了保存中间激活值所需的显存，特别适用于深度模型，如 Transformer 等层数较多的网络。

主要原理

在标准的反向传播中，前向传播过程中每一层的中间激活值（activation）会被保留，供后续反向传播使用。但在使用 checkpoint 时，某些层的激活值不会在前向传播时保存，而是在反向传播时通过重新计算这些层的前向结果来获得。

这样可以节省大量内存，但代价是增加了计算量，因为反向传播时需要重新计算部分前向传播。

使用方法

示例代码1

import torch
from torch.utils.checkpoint import checkpointdef forward_pass(x):# 假设是模型的一部分return x * x + 2 * x + 1# 在调用时使用 checkpoint 包裹住前向传播的函数
input_tensor = torch.randn(3, requires_grad=True)
output = checkpoint(forward_pass, input_tensor)
output.backward()print(input_tensor.grad)  # 查看梯度

示例代码2

import torch
from torch import nn
from torch.utils.checkpoint import checkpoint

关键字：全国前十装饰公司排名_成都流行病毒最新消息_广告开户南京seo_培训行业seo整站优化

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

责任编辑：