02线性回归

发表于2020-09-29|更新于2020-10-11|机器学习

|总字数:410|阅读时长:1分钟|浏览量:

线性回归

房价问题

数据集构成
- 训练集
- 样本数量m
- 样本特征$x_i$
- 目标变量y

假设函数

假设函数
$$h(x)=\theta_0+\theta_1 x$$
模型参数$\theta_0,\theta_1$

代价函数

损失函数、代价函数（loss/cost function）:平方误差代价函数

$$
J(\theta_0,\theta_1)=\frac{1}{2m}\sum_1^m(h(x_i)-y_i)^2
$$

目标函数：
$$
minimize_{\theta_0,\theta_1} J(\theta_0,\theta_1)
$$

梯度下降

目标

$$
min_{\theta_1,\theta_2,\dots}J(\theta_1,\theta_2,\dots)
$$

给定$\theta$的初始值。不断修改$\theta$的值，使代价函数最小。统计学上使用全局的最小二乘法实现参数估计，计算机科学上使用局部迭代的梯度下降算法实现参数估计。
梯度下降算法的公式

$$
\theta_j = \theta_j - \alpha\frac{\partial}{\partial \theta_j}J(\theta_1,\theta_2,\dots)
$$

吴恩达给出了梯度下降函数的解释，当导数为正时，表示函数递增，此时自变量减去一个正值，自变量减小，函数值下降。当导数为负时，表示函数递减，此时自变量减去一个负值，自变量增加，函数值增加。

batch梯度下降

每一步都遍历了样本中所有的数据。

梯度下降算法与最小二乘法区别

给出假设函数（这是拟合的函数）
使用最小二乘算法进行参数估计。这个是统计学的方法，利用样本的统计学特征，一次性全局计算准确的最小损失函数。
使用梯度下降算法，进行参数估计。这是一个迭代的方法，利用每一条数据，更新参数。

文章作者: Estom

文章链接: https://estom.github.io/2020/09/28/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/%E5%90%B4%E6%81%A9%E8%BE%BE%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0/02%E7%BA%BF%E6%80%A7%E5%9B%9E%E5%BD%92/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Estom的博客！

使用函数实现

相关推荐

ellipse_collection

椭圆集合绘制椭圆的集合。虽然使用 EllipseCollection 或PathCollection 同样可行，但使用EllipseCollection 可以实现更短的代码。 123456789101112131415161718192021222324252627import matplotlib.pyplot as pltimport numpy as npfrom matplotlib.collections import EllipseCollectionx = np.arange(10)y = np.arange(15)X, Y = np.meshgrid(x, y)XY = np.column_stack((X.ravel(), Y.ravel()))ww = X / 10.0hh = Y / 15.0aa = X * 9fig, ax = plt.subplots()ec = EllipseCollection(ww, hh, aa, units='x', offsets=XY, transOffset...

46 分布式RPC框架-管道并行化

使用 RPC 的分布式管道并行化原文：https://pytorch.org/tutorials/intermediate/dist_pipeline_parallel_tutorial.html 作者：Shen Li 先决条件： PyTorch 分布式概述单机模型并行最佳实践分布式 RPC 框架入门 RRef 辅助函数： RRef.rpc_sync()， RRef.rpc_async()和 RRef.remote() 本教程使用 Resnet50 模型来演示如何使用torch.distributed.rpc API 实现分布式管道并行性。可以将其视为单机模型并行最佳实践中讨论的多 GPU 管道并行性的分布式对应物。注意本教程需要 PyTorch v1.6.0 或更高版本。注意本教程的完整源代码可以在pytorch/examples中找到。基础知识上一教程分布式 RPC 框架入门显示了如何使用torch.distributed.rpc为 RNN 模型实现分布式模型并行性。该教程使用一个 GPU 来托管EmbeddingTable，并且提供的代码可以正常工...

03 Pytorch 实例学习

通过示例学习 PyTorch 1 预热：NumPy 2 PyTorch：张量 3 Autograd 3.1 PyTorch：张量和 Autograd 3.2 PyTorch：定义新的 Autograd 函数 4 nn模块 4.1 PyTorch：nn 4.2 PyTorch：optim 4.3 PyTorch：自定义nn模块 4.4 PyTorch：控制流 + 权重共享通过示例学习 PyTorchPyTorch 的核心是提供两个主要功能： n 维张量，类似于 NumPy，但可以在 GPU 上运行用于构建和训练神经网络的自动微分我们将使用将三阶多项式拟合y = sin(x)的问题作为运行示例。该网络将具有四个参数，并且将通过使网络输出与实际输出之间的欧几里德距离最小化来进行梯度下降训练，以适应随机数据。注意您可以在本页浏览各个示例。 1 预热：NumPy在介绍 PyTorch 之前，我们将首先使用 numpy 实现网络。 Numpy 提供了一个 n 维数组对象，以及许多用于操纵这些数组的函数。 Numpy 是用于科学计算的通用框架。它对计算图，深度学习或梯...

X图添加线条到图形（没有轴）。 12345678910111213import matplotlib.pyplot as pltimport matplotlib.lines as linesfig = plt.figure()l1 = lines.Line2D([0, 1], [0, 1], transform=fig.transFigure, figure=fig)l2 = lines.Line2D([0, 1], [1, 0], transform=fig.transFigure, figure=fig)fig.lines.extend([l1, l2])plt.show() 参考此示例中显示了以下函数，方法，类和模块的使用： 1234import matplotlibmatplotlib.pyplot.figurematplotlib.linesmatplotlib.lines.Line2D 下载这个示例下载python源码: fig_x.py 下载Jupyter notebook: fig_x.ipynb

whats_new_99_spines

0.99版本新增Spines对象12345678910111213141516171819202122232425262728293031323334353637383940414243444546import matplotlib.pyplot as pltimport numpy as npdef adjust_spines(ax,spines): for loc, spine in ax.spines.items(): if loc in spines: spine.set_position(('outward',10)) # outward by 10 points else: spine.set_color('none') # don't draw spine # turn off ticks where there is no spine if 'left' in spines: ax.yaxis...

5.7. 内核近似校验者: @FontTian @numpy @Loopy翻译者: @程威这个子模块包含与某些 kernel 对应的特征映射的函数，这个会用于例如支持向量机的算法当中(see 支持向量机)。下面这些特征函数对输入执行非线性转换，可以用于线性分类或者其他算法。与 kernel trick 相比，近似的进行特征映射更适合在线学习，并能够有效减少学习大量数据的内存开销。使用标准核技巧的 svm 不能有效的适用到海量数据，但是使用近似内核映射的方法，对于线性 SVM 来说效果可能更好。而且，使用 SGDClassifier 进行近似的内核映射，使得对海量数据进行非线性学习也成为了可能。由于近似嵌入的方法没有太多经验性的验证，所以建议将结果和使用精确的内核方法的结果进行比较。也可参阅多项式回归：用基函数展开线性模型用于精确的多项式变换。 5.7.1. 内核近似的 Nystroem 方法Nystroem 中实现了 Nystroem 方法用于低等级的近似核。它是通过采样 kernel 已经评估好的数据。默认...

数据加载中