【TensorFlow深度学习】前向传播实战:从理论到代码实现

前向传播实战:从理论到代码实现

    • 1. 前向传播理论基础
      • 1.1 激活函数
      • 1.2 损失函数
    • 2. 构建神经网络
      • 2.1 导入TensorFlow
      • 2.2 定义网络参数
      • 2.3 初始化权重和偏置
      • 2.4 实现前向传播
    • 3. 损失函数和梯度计算
      • 3.1 定义损失函数
      • 3.2 计算梯度
    • 4. 参数更新和训练过程
      • 4.1 选择优化器
      • 4.2 更新参数
      • 4.3 训练循环
    • 5. 结果评估
      • 5.1 模型预测
      • 5.2 计算准确率
    • 6. 总结

在深度学习中,前向传播是神经网络核心算法之一,它涉及从输入层到输出层的数据传递和计算过程。本文将深入探讨前向传播的理论基础,并展示如何在TensorFlow框架中实现这一过程。我们将通过构建一个简单的三层神经网络,来理解前向传播的每个步骤。

1. 前向传播理论基础

前向传播是神经网络中信号从输入层通过隐藏层传递到输出层的过程。在数学上,一个神经网络层的输出可以通过以下公式计算:
[ \text{Output} = \text{Activation}(\text{Weights} \times \text{Input} + \text{Bias}) ]
其中,Activation是激活函数,Weights是权重矩阵,Input是输入数据,Bias是偏置项。

1.1 激活函数

激活函数在神经网络中起到非线性变换的作用,常见的激活函数包括ReLU、Sigmoid和Tanh等。

1.2 损失函数

损失函数用于评估神经网络的输出与真实值之间的差异,常见的损失函数包括均方误差(MSE)和交叉熵(Cross-Entropy)等。

2. 构建神经网络

在TensorFlow中,我们可以通过以下步骤构建一个简单的三层神经网络:

2.1 导入TensorFlow

import tensorflow as tf

2.2 定义网络参数

input_size = 784  # 输入特征长度
hidden_size_1 = 256  # 第一个隐藏层节点数
hidden_size_2 = 128  # 第二个隐藏层节点数
output_size = 10  # 输出层节点数(例如MNIST手写数字识别)

2.3 初始化权重和偏置

# 权重和偏置初始化为正态分布
weights_1 = tf.Variable(tf.random.normal([input_size, hidden_size_1]))
biases_1 = tf.Variable(tf.random.normal([hidden_size_1]))
weights_2 = tf.Variable(tf.random.normal([hidden_size_1, hidden_size_2]))
biases_2 = tf.Variable(tf.random.normal([hidden_size_2]))
weights_out = tf.Variable(tf.random.normal([hidden_size_2, output_size]))
biases_out = tf.Variable(tf.random.normal([output_size]))

2.4 实现前向传播

def forward_propagation(inputs):
    with tf.GradientTape() as tape:
        # 第一个隐藏层的激活值
        hidden_1 = tf.nn.relu(tf.matmul(inputs, weights_1) + biases_1)
        # 第二个隐藏层的激活值
        hidden_2 = tf.nn.relu(tf.matmul(hidden_1, weights_2) + biases_2)
        # 输出层的原始分数(未应用激活函数)
        outputs = tf.matmul(hidden_2, weights_out) + biases_out
        return outputs

3. 损失函数和梯度计算

在前向传播的基础上,我们定义损失函数并计算梯度,以便进行参数更新。

3.1 定义损失函数

def compute_loss(outputs, labels):
    return tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=labels, logits=outputs))

3.2 计算梯度

with tf.GradientTape() as tape:
    logits = forward_propagation(inputs)
    loss = compute_loss(logits, labels)
grads = tape.gradient(loss, [weights_1, biases_1, weights_2, biases_2, weights_out, biases_out])

4. 参数更新和训练过程

使用优化器根据计算出的梯度更新网络参数。

4.1 选择优化器

optimizer = tf.optimizers.Adam()

4.2 更新参数

optimizer.apply_gradients(zip(grads, [weights_1, biases_1, weights_2, biases_2, weights_out, biases_out]))

4.3 训练循环

for epoch in range(num_epochs):
    for step, (x_batch, y_batch) in enumerate(train_dataset):
        with tf.GradientTape() as tape:
            logits = forward_propagation(x_batch)
            loss = compute_loss(logits, y_batch)
        grads = tape.gradient(loss, tf.trainable_variables())
        optimizer.apply_gradients(zip(grads, tf.trainable_variables()))
        
        if step % 100 == 0:
            print(f"Epoch {epoch}, Step {step}, Loss: {loss.numpy()}")

5. 结果评估

在训练完成后,我们通常需要评估模型的性能。

5.1 模型预测

predictions = forward_propagation(test_inputs)

5.2 计算准确率

accuracy = tf.reduce_mean(tf.cast(tf.equal(tf.argmax(predictions, 1), tf.argmax(test_labels, 1)), tf.float32))
print(f"Accuracy: {accuracy.numpy()}")

6. 总结

本文详细介绍了前向传播的理论基础和在TensorFlow中的实现方法。通过构建一个简单的神经网络模型,我们展示了从初始化参数到前向传播,再到损失计算和参数更新的完整流程。这为进一步探索深度学习模型提供了坚实的基础。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/577046.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

AIGC技术带来的安全与隐私问题探讨

如何看待AIGC技术? 简介:探讨AIGC技术的发展现状和未来趋势。提醒:在发布作品前,请把不需要的内容删掉。 方向一:技术应用 机遇和挑战 AIGC国内场景应用图谱 方向二:伦理与风险 垄断与隐私风险 AI民主化诉…

Linux--MyMiniTry--Vim

首先下载好vim,我们可以按以下的方式进行光标的移动(也可以回车进行换行) (--> 进入教程) (初始的时候没有文本,你怎么按都没有用) (我们要先按 i ,进行插入文本才…

前端单元测试的艺术:专业化策略与Vue项目高效实践指南

单元测试是软件开发中的基石,尤其对于前端领域,它为保证代码质量、提升开发效率、强化项目稳定性提供了不可或缺的支持。本文将深入剖析单元测试的核心理念,揭示其在前端开发中的独特价值,并提炼出一套专业且高效的实践策略&#…

全志ARM-官方库SDK安装和验证

进入界面,输入以下指令 git clone https://github.com/orangepi-xunlong/wiringOP //下载源码 cd wiringOP //进入文件夹 sudo ./build clean //清除编译信息 sudo ./build …

电容的理论基础

目录 1.电容的本质: 2.电容量的大小 2.1电容的单位 2.2电容的决定式 ​编辑3.电容的特点 5.电容器的类型 6.电容实际的电路模型 7.安装方法 ​编辑8.电容值 9.电容的耐压、封装 10.阻抗-频率特性 11.频率特性 12.等效串联电组ESR 13.电容器的温度特性…

[C++基础学习]----03-程序流程结构之选择结构详解

前言 本篇都是在自学C基础知识的基础上,加上本身理解所完成的,为了便于记录学习情况,使用更加容易理解的话术描述出来,方便使用。 在C程序中,选择结构(也称为条件结构)用于根据特定的条件执行不…

python 使用flask_httpauth和pyjwt实现登录权限控制

最近需要用到,学习了一下记录 首先安装依赖 pip install Flask-HTTPAuth pyjwt passlib Welcome to Flask-HTTPAuth’s documentation! — Flask-HTTPAuth documentation Welcome to PyJWT — PyJWT 2.8.0 documentation Passlib 1.7.4 documentation — Passl…

Unity类银河恶魔城学习记录15-1,2 p153 Audio Manager p154 Audio distance limiter

Alex教程每一P的教程原代码加上我自己的理解初步理解写的注释,可供学习Alex教程的人参考 此代码仅为较上一P有所改变的代码 【Unity教程】从0编程制作类银河恶魔城游戏_哔哩哔哩_bilibili AudioManager.cs using System.Collections; using System.Collections.Gen…

Grafana 系列|Grafana 监控 TDengine集群

Grafana 监控 TDengine集群有两种方式: 一、 taosKeeper监控 TDengine 通过 taosKeeper 将服务器的 CPU、内存、硬盘空间、带宽、请求数、磁盘读写速度等信息定时写入指定数据库。TDengine 还将重要的系统操作(比如登录、创建、删除数据库等&#xff0…

OpenHarmony语言基础类库【@ohos.util.HashSet (非线性容器HashSet)】

HashSet基于[HashMap]实现。在HashSet中,只对value对象进行处理。 HashSet和[TreeSet]相比,HashSet中的数据无序存放,即存放元素的顺序和取出的顺序不一致,而TreeSet是有序存放。它们集合中的元素都不允许重复,但Hash…

八国语言50种海外电子游戏源码 海外游戏开发BTC虚拟币支付 外国电子游艺 游戏源码交易平台 搭建教程

全新海外版的游戏竞猜玩法带搭建教程 系统支持八国语言,50种游戏,支持 Paypal、人工充值、BTC多种支付 源码下载:https://download.csdn.net/download/m0_66047725/89105597 更多资源下载:关注我。

WEB攻防-PHP特性-CMS审计实例

前置知识&#xff1a;PHP函数缺陷 测试环境&#xff1a;MetInfo CMS 函数缺陷导致的任意文件读取 漏洞URL&#xff1a;/include/thumb.php?dir 漏洞文件位置&#xff1a;MetInfo6.0.0\app\system\include\module\old_thumb.class.php <?phpdefined(IN_MET) or exit(No…

Python用于高级异常检测和聚类的工具库之BanditPAM使用详解

概要 Python BanditPAM库是一个用于高级异常检测和聚类的工具,具有强大的特性和灵活的功能,可以发现数据中的异常点并进行有效的聚类分析。本文将详细介绍Python BanditPAM库的安装、特性、基本功能、高级功能以及总结。 安装 首先,需要安装Python BanditPAM库。 可以使用…

2024年智能手表行业线上市场销售数据分析

智能手表市场近几年随着各大厂商的加入&#xff0c;逐渐朝着专业化、智能化发展。从一开始被认为是“智商税”、“鸡肋产品”到如今可以成为人体心脑血管健康监测、专业运动测速、移动定位的“多功能电子管家”&#xff0c;智能手表市场仍在不断发展中。 根据鲸参谋数据显示&a…

Git -- 运用总结

文章目录 1. Git2. 基础/查阅2.1 基础/查阅 - git2.2 仓库 - remote2.3 清理 - rm/clean2.4 版本回退 - reset 3. 分支3.1 分支基础 - branch3.2 分支暂存更改 - stash3.3 分支切换 - checkout 4. 代码提交/拉取4.1 代码提交 - push4.2 代码拉取 - pull 1. Git 2. 基础/查阅 2…

2分钟自己写小游戏:使用js和css编写石头剪刀布小游戏、扫雷小游戏、五子棋小游戏。新手老手毕业论文都能用。

系列文章目录 【复制就能用1】2分钟玩转轮播图,unslider的详细用法 【复制就能用2】css实现转动的大风车&#xff0c;效果很不错。 【复制就能用3】2分钟自己写小游戏&#xff1a;剪刀石头布小游戏、扫雷游戏、五子棋小游戏 【复制就能用4】2024最新智慧医疗智慧医院大数据…

【声网】实现web端与uniapp微信小程序端音视频互动

实现web端与uniapp微信小程序端音视频互动 利用声网实现音视频互动 开通声网服务 注册声网账号 进入Console 成功登录控制台后&#xff0c;按照以下步骤创建一个声网项目&#xff1a; 展开控制台左上角下拉框&#xff0c;点击创建项目按钮。 在弹出的对话框内&#xff0c;依…

严把质量关,饮片追溯系统应用,信息化追溯助力用药安全-亿发

中药饮片作为我国中药产业的重要组成部分&#xff0c;在医药工业中发挥着至关重要的作用。近年来&#xff0c;中药饮片行业虽然取得了稳步增长&#xff0c;但同时也面临着产业集中度低、竞争激烈、质量良莠不齐等诸多挑战。为了应对这些问题&#xff0c;国家和各地纷纷加强中药…

URL路由基础与Django处理请求的过程分析

1. URL路由基础 对于高质量的Web应用来讲&#xff0c;使用简洁、优雅的URL设计模式非常有必要。Django框架允许设计人员自由地设计URL模式&#xff0c;而不用受到框架本身的约束。对于URL路由来讲&#xff0c;其主要实现了Web服务的入口。用户通过浏览器发送过来的任何请求&am…

如何在vue3+vite中优雅的使用iconify图标

前言 从Vue2迁移到Vue3&#xff0c;在使用上有着很大的差别。本文的话主要是针对图标的使用差别上进行分析&#xff0c;同时给出基于iconify图标库中unplugin-icons的用法。这里特殊说明一下&#xff1a;其实element-plus中用到的图标也是基于iconify图标库的&#xff0c;在我们…
最新文章