Python知识点：如何使用Python实现图像生成（GANs）

时间:2025/9/19 7:28:16来源：https://blog.csdn.net/bigorsmallorlarge/article/details/141882766 浏览次数:0次

要在 Python 中实现图像生成，通常可以使用生成对抗网络 (GANs)。GANs 是一种深度学习模型，它包含两个网络：生成器 (Generator) 和判别器 (Discriminator)。生成器负责生成伪造数据，判别器则负责区分生成的数据和真实的数据。训练过程中，这两个网络相互对抗，最终生成器可以生成看起来非常真实的图像。

以下是使用 TensorFlow 和 Keras 实现简单 GAN 的步骤，来生成类似 MNIST 手写数字的图像。

步骤 1：安装依赖库

你需要安装 TensorFlow 库来构建和训练 GANs：

pip install tensorflow

步骤 2：加载数据并预处理

我们将使用 MNIST 数据集来训练 GAN。这个数据集包含 28x28 像素的手写数字图片。

import tensorflow as tf
from tensorflow.keras import layers
import numpy as np
import matplotlib.pyplot as plt# 加载并预处理 MNIST 数据集
(train_images, _), (_, _) = tf.keras.datasets.mnist.load_data()
train_images = train_images.reshape(train_images.shape[0], 28, 28, 1).astype('float32')
train_images = (train_images - 127.5) / 127.5  # 将像素值归一化到[-1, 1]BUFFER_SIZE = 60000
BATCH_SIZE = 256# 创建数据集并打乱
train_dataset = tf.data.Dataset.from_tensor_slices(train_images).shuffle(BUFFER_SIZE).batch(BATCH_SIZE)

步骤 3：定义生成器和判别器

生成器将随机噪声转换为图像，而判别器则试图区分真实图像和生成器生成的图像。

生成器模型

def make_generator_model():model = tf.keras.Sequential()model.add(layers.Dense(7*7*256, use_bias=False, input_shape=(100,)))model.add(layers.BatchNormalization())model.add(layers.LeakyReLU())model.add(layers.Reshape((7, 7, 256)))model.add(layers.Conv2DTranspose(128, (5, 5), strides=(1, 1), padding='same', use_bias=False))model.add(layers.BatchNormalization())model.add(layers.LeakyReLU())model.add(layers.Conv2DTranspose(64, (5, 5), strides=(2, 2), padding='same', use_bias=False))model.add(layers.BatchNormalization())model.add(layers.LeakyReLU())model.add(layers.Conv2DTranspose(1, (5, 5), strides=(2, 2), padding='same', use_bias=False, activation='tanh'))return modelgenerator = make_generator_model()

判别器模型

def make_discriminator_model():model = tf.keras.Sequential()model.add(layers.Conv2D(64, (5, 5), strides=(2, 2), padding='same', input_shape=[28, 28, 1]))model.add(layers.LeakyReLU())model.add(layers.Dropout(0.3))model.add(layers.Conv2D(128, (5, 5), strides=(2, 2), padding='same'))model.add(layers.LeakyReLU())model.add(layers.Dropout(0.3))model.add(layers.Flatten())model.add(layers.Dense(1))return modeldiscriminator = make_discriminator_model()

步骤 4：定义损失函数和优化器

cross_entropy = tf.keras.losses.BinaryCrossentropy(from_logits=True)def discriminator_loss(real_output, fake_output):real_loss = cross_entropy(tf.ones_like(real_output), real_output)fake_loss = cross_entropy(tf.zeros_like(fake_output), fake_output)total_loss = real_loss + fake_lossreturn total_lossdef generator_loss(fake_output):return cross_entropy(tf.ones_like(fake_output), fake_output)generator_optimizer = tf.keras.optimizers.Adam(1e-4)
discriminator_optimizer = tf.keras.optimizers.Adam(1e-4)

步骤 5：训练模型

定义训练过程，包括如何在每个训练步骤中更新生成器和判别器。

import tensorflow as tfEPOCHS = 50
noise_dim = 100
num_examples_to_generate = 16# 生成的种子 (用来在训练过程中评估生成器的效果)
seed = tf.random.normal([num_examples_to_generate, noise_dim])@tf.function
def train_step(images):noise = tf.random.normal([BATCH_SIZE, noise_dim])with tf.GradientTape() as gen_tape, tf.GradientTape() as disc_tape:generated_images = generator(noise, training=True)real_output = discriminator(images, training=True)fake_output = discriminator(generated_images, training=True)gen_loss = generator_loss(fake_output)disc_loss = discriminator_loss(real_output, fake_output)gradients_of_generator = gen_tape.gradient(gen_loss, generator.trainable_variables)gradients_of_discriminator = disc_tape.gradient(disc_loss, discriminator.trainable_variables)generator_optimizer.apply_gradients(zip(gradients_of_generator, generator.trainable_variables))discriminator_optimizer.apply_gradients(zip(gradients_of_discriminator, discriminator.trainable_variables))def train(dataset, epochs):for epoch in range(epochs):for image_batch in dataset:train_step(image_batch)# 每个epoch结束后生成并保存图像generate_and_save_images(generator, epoch + 1, seed)# 训练完成后生成最终图像generate_and_save_images(generator, epochs, seed)def generate_and_save_images(model, epoch, test_input):predictions = model(test_input, training=False)fig = plt.figure(figsize=(4, 4))for i in range(predictions.shape[0]):plt.subplot(4, 4, i + 1)plt.imshow(predictions[i, :, :, 0] * 127.5 + 127.5, cmap='gray')plt.axis('off')plt.savefig(f'image_at_epoch_{epoch:04d}.png')plt.show()# 开始训练
train(train_dataset, EPOCHS)

步骤 6：生成图像

在每个训练 epoch 结束时，生成器会生成一组图像。这些图像会逐渐变得越来越像手写数字。你可以在训练结束后查看生成的图像。

进一步扩展

网络架构：你可以尝试使用不同的生成器和判别器架构，比如更深的网络或不同的激活函数。
数据集：尝试用其他数据集，比如 CIFAR-10 来生成彩色图像。
高级GANs：如 DCGAN、WGAN、CycleGAN 等，具有更好的性能和应用场景。

这个简单的示例展示了如何使用 GANs 来生成图像，适合入门理解 GANs 的基本原理。

关键字：Python知识点：如何使用Python实现图像生成（GANs）

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

责任编辑：