09神经网络实例

发表于2020-10-09|更新于2020-10-11|机器学习

|总字数:724|阅读时长:2分钟|浏览量:

假设函数

神经网络本身，即是假设函数能够计算输入相对的输出。

代价函数

$L$表示神经网络的总层数。
$s_L$表示第L层单元的个数。
$K$表示输出层单元的个数
代价函数相当于第i组数据输入时，产生的误差。

$$
J(\theta)=-\frac{1}{m}[\sum_i^my^{(i)}\log h_\theta(x^{(i)})+(1-y^{(i)})\log (1-h_\theta (x^{(i)}))]+\frac{\lambda}{2m}\sum_1^n\theta_j^2
$$

$a^{(i)}$表示第i层的单元值。
$\Theta^{(i)}$第i层的权重
$z^{(i)}$第i层的加权值
$\delta^{(i)}$第i层的反向传播误差。

最小化代价函数：反向传播算法

在这里的上标，代表的不是输入的代数（即第几次迭代），而是神经网络的层数。下标表示的是神经网络某层的单元数。
原理：神经网络的值会随着假设函数正向传播。神经网络的误差会随着假设函数反向传播到第二层。利用每一层的单元值和神经网络的误差能够计算每一层的梯度下降向量，通过梯度下降向量，完成参数的更新。
神经网络的正向传播过程

神经网络的反向传播过程

神经网络反向传播算法实现

反向传播算法理解

$\delta_j^{(i)}$表示第i层的单元j的误差。他相当于单元j的代价函数$J=cost_j$关于加权值$z^{(i)}_j$的偏导数

$$
\delta_j^{(i)}=\frac{\partial}{\partial z}cost_j
$$

梯度检测

使用差分方法，近似某个点的梯度。普通的梯度是通过求导公式得到导数，然后进行梯度下降。可以使用差分近似导数，与梯度进行对比，完成梯度检测。

权重随机初始化

避免权重相同，出现高度冗余。
因为在梯度下降更新过程中，相同的权重，会进行相同程度的更新。
打破对称性流程

神经网络的组合

步骤

使用训练集中的每一个样本迭代训练。

选择神经网络的架构，随机初始化权重。输入层单元、隐藏层单元、输出层单元。选择一个隐藏层，或者多个隐藏层具有相同的单元数。
执行前向传播算法，计算假设函数的值。
计算代价函数。
通过反向传播算法，计算每一层的梯度（偏导数）。
使用梯度检测，对比梯度的偏导数。检测梯度算法的正确性。然后关闭梯度下降算法。
使用梯度下降算法或者其他更高级的优化算法+反向传播算法计算出的梯度。来优化权重参数。

编程任务

完成以上的六个步骤，寻找合适的训练数据集。

文章作者: Estom

文章链接: https://estom.github.io/2020/10/09/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/%E5%90%B4%E6%81%A9%E8%BE%BE%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0/09%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C%E5%AE%9E%E4%BE%8B/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Estom的博客！

使用进行函数

相关推荐

01深度学习的实用层面

# 深度学习的实用层面 > * [笔记模板](https://github.com/bighuang624/Andrew-Ng-Deep-Learning-notes) > * 相关的笔记都可以在github上先找到相关的笔记然后再修改，方便。 ## 数据划分：训练 / 验证 / 测试集 * 应用深度学习是一个典型的迭代过程。 * `->idea -> code -> employment->` * 对于一个需要解决的问题的样本数据，在建立模型的过程中，数据会被划分为以下几个部分： * 训练集（train set）：用训练集对算法或模型进行**训练**过程； * 验证集（development set）：利用验证集（又称为简单交叉验证集，hold-out cross validation set）进行**交叉验证**，**选择出最好的模型**； * 测试集（test set）：最后利用测试集对模型进行测试，**获取模型运行的无偏估计**（对学习方法进行评估）。 * 在**小数据量**的时代，如 100、1000、10000 的数据量大小，可以将数据集...

$cover$

四、训练模型译者：@C-PIG 校对者：@PeterHo、@飞龙、@YuWang、@AlecChen 在之前的描述中，我们通常把机器学习模型和训练算法当作黑箱子来处理。如果你实践过前几章的一些示例，你惊奇的发现你可以优化回归系统，改进数字图像的分类器，你甚至可以零基础搭建一个垃圾邮件的分类器，但是你却对它们内部的工作流程一无所知。事实上，许多场合你都不需要知道这些黑箱子的内部有什么，干了什么。然而，如果你对其内部的工作流程有一定了解的话，当面对一个机器学习任务时候，这些理论可以帮助你快速的找到恰当的机器学习模型，合适的训练算法，以及一个好的假设集。同时，了解黑箱子内部的构成，有助于你更好地调试参数以及更有效的误差分析。本章讨论的大部分话题对于机器学习模型的理解，构建，以及神经网络（详细参考本书的第二部分）的训练都是非常重要的。首先我们将以一个简单的线性回归模型为例，讨论两种不同的训练方法来得到模型的最优解：直接使用封闭方程进行求根运算，得到模型在当前训练集上的最优参数（即在训练集上使损失函数达到最小值的模型参数）使用迭代优化方法：梯度下降（GD），在训练集上，它可...

概述log 模块用于在程序中输出日志，它的使用十分简单，类似于fmt中的Print，一个最简单的示例如下： 1234567package mainimport "log"func main() { log.Print("Hello World")} 上面的程序会在命令行打印一条日志: 1>>> 2018/05/16 16:48:06 Hello World LoggerLogger是写入日志的基本组件，log模块中存在一个标准Logger，可以直接通过log进行访问，所以在上一节的例子中可以直接使用log.Print进行日志进行输出。但是在实际使用中，不同类型的日志可能拥有需求，仅标准Logger不能满足日志记录的需求，通过创建不同的Logger可以将不同类型的日志分类输出。使用logger前需要首先通过New函数创建一个Logger对象，函数声明如下： 1func New(out io.Writer, prefix string, flag int) *Logger 函数接收三个参数分别是日...

annotate_transform

注释变换此示例显示如何使用不同的坐标系进行注释。有关注释功能的完整概述，另请参阅注释教程。 123456789101112131415161718192021222324252627282930313233import numpy as npimport matplotlib.pyplot as pltx = np.arange(0, 10, 0.005)y = np.exp(-x/2.) * np.sin(2*np.pi*x)fig, ax = plt.subplots()ax.plot(x, y)ax.set_xlim(0, 10)ax.set_ylim(-1, 1)xdata, ydata = 5, 0xdisplay, ydisplay = ax.transData.transform_point((xdata, ydata))bbox = dict(boxstyle="round", fc="0.8")arrowprops = dict( arrowstyle = "->", connect...

TensorFlow - IO 在 tf.data 之前，一般使用 QueueRunner，但 QueueRunner 基于 Python 的多线程及队列等，效率不够高，所以 Google发布了tf.data，其基于C++的多线程及队列，彻底提高了效率。所以不建议使用 QueueRunner 了，取而代之，使用 tf.data 模块吧：简单、高效。 preload直接将数据设置为常量，加载到TensorFlow的graph中。 12345678import tensorflow as tfx1 = tf.constant([2,3,4])x2 = tf.constant([4,0,1])y = tf.add(x1,x2)with tf.Session() as sess: print(sess.run(y)) feed_dict使用Python代码获取数据，通过给run()或者eval()函数输入feed_dict参数，传入数据，可以启动运算过程。 1234with tf.Session(): input = tf.placeholder(tf.float32) c...

08神经网络原理

非线性假设当特征很多时，如果包含各种高阶项，特征空间会爆炸。在非线性空间中，使用逻辑回归进行分类，会导致特征空间过多。神经网络相关术语 input layer输入层 output layer输出层 bias unit 偏置单元 sigmod、logistic activation function激活函数 $\theta$模型参数=模型权重模型展示神经网络本身是机器学习的一个假设函数。使用数学计算能够表示神经网络的计算过程。即计算给定输入后，计算神经网络的输出值。使用向量化的计算方法，计算神经网络的前向传播过程。实例使用神经网络表示逻辑运算。 sigmod算子。+-10，+-20 计算向量化普通计算向量化多组数据矩阵化使用向量，来表示计算过程。使用矩阵来表示多组数据的计算过程。在线性回归和逻辑回归当中，多组输入向量，乘，固定的参数向量，等于，输出向量。在神经网络中，一组输入向量，乘，多组参数向量，等于，输出向量。下标用来表示矩阵和向量中的元素位置。上标表示迭代的代数。编程任务：使用神经网络进行多元分类寻找图片的数据集...

数据加载中