【中小学AI人工智能教育】图像生成——Anime Faces风格的头像实验、GAN参数计算
Ai创想实验室是专门为中小学AI教育开发的教学平台,包含了值计算、图像分类、音频分类、文本分类、数值回归、图像回归、图像分类+回归、平衡杆、手写数字生成、文本生成等中小学人工智能学习类项目。无需编程基础、无需添加硬件、无需购买算力、无隐私担忧、无需师资培训即可进行教学实践。
除了默认项目,我们还可以自定义项目(详见上一篇【中小学AI人工智能教育】声音分类——提琴分类:快速定义项目类型实例),但GAN项目中涉及一些计算,本篇以使用Anime Faces数据集为例,说明模型中参数的计算和调整模型大小的方法:
一、数据准备
1、自行下载Anime Faces数据集,其图像大小为64*64,3通道彩色图像。
2、打开训练数据管理器,设置输出参数如下(保持64*64*3):
3、导入一部分数据:
4、导出数据备用
二、模型设计
1、生成器模型如下:
我们逐一说明如何填写这些参数最终得到64*64*3:
①输入层:100——接收一个100维度的噪声向量,通常是从标准正态分布中采样。
②全连接层:16384——8×8×256,也就是说这个值是为了后续Reshape成(8,8,256)准备的(每个噪声响亮被线性变换扩展为16384个神经元)——我们最终希望输出64*64,每次Conv2DTranspose用strides=2会把尺寸翻倍,如果做3次,那么起点就是8(8→16→32→64)。这就成了!256是通道数,越大模型能力越强(例如之前数字生成写的512)但参数也越多。
③Reshape(重塑)层:(8,8,256)——8高度、8宽度、256通道数C,从一维变为三维为后续卷积操作做准备。
④输出层:到达输出层(none,64,64,32)→(node,64,64,3)——RGB三通道。
这样,生成器就输出一个64*64*3的图像。
2、判别器
判别器没有太多需要计算的地方:
将其输入改为和生成器输出匹配即可:64,64,3。
三、实训效果
使用800个样本、上述生成器模型、上述判别器模型和默认训练参数,在第5轮时:
依稀可以看到头像轮廓。在第10轮左右即可看到更清晰的、色彩更丰富的生成结果:
需要注意的是,使用如此小的数据量和模型,是无法得到非常清晰的图像的,这完全超出它们的能力范畴。如果需要更为清晰的图像,应采用更大的模型、更大的数据量以及更精细的调参,这需要更强大的硬件资源才能完成。但作为以中小学课堂教学为目的的人工智能教学平台,我们在不使用额外算力、仅用本机核显的条件下已经达到了理想的教学效果。
在AI创想实验室中,我们无需编程基础,不用学习框架,不用配置环境,无需购买费用高昂的显卡,更不用为云端算力付费,使用当前已有的各种硬件:仅有核显的个人、办公、机房电脑,希沃白板等都能达到理想的教学效果。操作简单但AI核心知识样样俱全,无需师资培训就可以进行教学且能取得理想的教学效果。如果加入试点或合作方那么只需要一台局域网服务器(无需显卡、服务器不用供算力)即可一次投入永久使用全部项目和功能,通过后台管理一分钟即可创建一个本地化、校本化的项目实例。
演示版本地址:www.AiEduLab.tech
有任何问题欢迎留言或发送邮件至:hello@AiEduLab.tech