12支持向量机

发表于2020-10-11|更新于2021-03-19|机器学习

|总字数:796|阅读时长:2分钟|浏览量:

支持向量机

支持向量机的定义

逻辑回归的假设函数（sigmod）函数，将离散的分类，变成了连续的输出。建立与连续特征的函数关系。
支持向量机的假设函数，将sigmod非线性函数改为分段的线性函数。用来简化运算。

假设函数

支持向量机本身并没有给出假设函数。其本质上并不需要拟合出假设函数？不不不，支持向量机的假设函数
$$
h(\theta)=\theta^T * x
$$

代价函数

支持向量机的代价函数

$$
J(\theta) =C \sum_1^m(y^{(i)}cost_1(\theta^Tx)+(1-y^{(i)})cost_0(\theta^Tx))+\frac{1}{2}\sum_1^n\theta_j^2
\
min (J(\theta))
$$

支持向量机的原理

大间距分类器。支持向量机会使得两个类别之间保持更大的安全距离。

参数C能够决定假设函数对数据的敏感程度。

大间距分类器的数学原理

$\theta^T*x$可以看做两个向量的內积
这个值越大，说明x在$\theta$方向的投影p越大，这个值越小，说明x在$\theta$方向的投影越小（为赋值）。为了能找到最大投影差，一般会选择类别差距最大的$\theta$值，此时，决策边界，为$\theta$向量的垂直线。

核函数与支持向量机算法

主要介绍了核函数。高斯函数

目标：训练复杂的非线性判别边界。
主要包括两部分：参数向量和特征向量。
特征向量使用核函数来描述。

假设函数

$$
h(\theta)=\theta_0+\theta_1f_1+\theta_2f_2+\theta_3*f_3+\dots
$$

f用来代理数据集的某个特征，这个特征可能是多项式一个项，也可能是更复杂的函数。
f描述的特征可能是没有必要的，此时$\theta$可能是0

高斯核函数描述特征向量

选取三个点，作为特征的核。
然后以样本点为中心的高斯核函数作为新的特征。
定义相似度函数=高斯核函数（也可以等于其他的函数）
$$
f_i = similarity(x,l^{(i)}) \= \exp(-\frac{||x-l||^2}{2\sigma^2})
$$
选取样本点作为相似度函数的中心。

使用核函数的支持向量机算法

支持向量机算法应该也可以不使用核函数。

给定样本
选取样本中的部分点，作为核函数的核心
最小化代价函数

$$
J(\theta) =C \sum_1^m(y^{(i)}cost_1(\theta^Tf)+(1-y^{(i)})cost_0(\theta^Tf))+\frac{1}{2}\sum_1^n\theta_j^2
\
min (J(\theta))
$$

支持向量机的参数选择

使用SVM

使用SVM软件包解决SVM向量机的参数求解问题

选择合适的参数C
选择相似函数（内核函数）
- 线性核函数（没有核函数）$\theta^T*x$
- 高斯核函数（选择$\sigma$的值）$f_i= \exp(-\frac{||x-l||^2}{2\sigma^2})$(l是选择的特征点)
- 多项式核函数$(x^T*l+constan)^degree$
- string kernel，chi-square kernel，intersection kernel

逻辑回归与SVM选择

当n>m时，特征个数>训练样本数，使用逻辑回归或者线性内核的SVM

文章作者: Estom

文章链接: https://estom.github.io/2020/10/11/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/%E5%90%B4%E6%81%A9%E8%BE%BE%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0/12%E6%94%AF%E6%8C%81%E5%90%91%E9%87%8F%E6%9C%BA/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Estom的博客！

函数参数可能

相关推荐

第6节估计量的评优准则

估计量的评优准则数学在某些方面具有通用规律。比如导数与指数，本来两个毫不相关的东西，却存在着很默契的联系。 n阶求导可以降低幂函数的n阶指数。在泰勒展开式中，就通过n阶导数与n阶指数来从不同阶次逼近一个函数。而在概率统计这一部分，n阶矩与n阶指数n阶导数也有着关系。似乎一个统计量可以展开成n阶矩的表示方法，一阶中心距逼近，二阶中心距逼近，三阶中心距逼近等。 UMVUE 计算必考 1 均方误差准则定义1：均方误差$$MSE_\theta(T(x))=E_\theta[T(X)-q(\theta)]^2 \$$若$MSE<+\infin$$$MSE_\theta(T(x))=Var_\theta(T(x))+E^2_\theta[T(X)- q(\theta)]$$上式成立，因为方差加减一个常数，不影响方差的大小。定义2：一致占优对于$\forall\theta\in\Theta$$$MSE_\theta(T(x))\leq MSE_\theta(S(x))$$则成T(x)比S(x)好，S(X)是不被容许的。T(X)一致占优 2 无偏估计定...

2 处理线性模型

第二章处理线性模型作者：Trent Hauck 译者：muxuezi 协议：CC BY-NC-SA 4.0 本章包括以下主题：线性回归模型评估线性回归模型用岭回归弥补线性回归的不足优化岭回归参数 LASSO正则化 LARS正则化用线性方法处理分类问题——逻辑回归贝叶斯岭回归用梯度提升回归从误差中学习简介线性模型是统计学和机器学习的基础。很多方法都利用变量的线性组合描述数据之间的关系。通常都要花费很大精力做各种变换，目的就是为了让数据可以描述成一种线性组合形式。本章，我们将从最简单的数据直线拟合模型到分类模型，最后介绍贝叶斯岭回归。 2.1 线性回归模型现在，我们来做一些建模！我们从最简单的线性回归（Linear regression）开始。线性回归是最早的也是最基本的模型——把数据拟合成一条直线。 Getting readyboston数据集很适合用来演示线性回归。boston数据集包含了波士顿地区的房屋价格中位数。还有一些可能会影响房价的因素，比如犯罪率（crime rate）。首先，让我们加载数据： 12from sklearn ...

5_Gradient Descent

Gradient DescentReview前面预测宝可梦cp值的例子里，已经初步介绍了Gradient Descent的用法： In step 3, we have to solve the following optimization problem: $\theta^{*}=\arg \underset{\theta}{\min} L(\theta) \quad$ L : loss function$\theta:$ parameters(上标表示第几组参数，下标表示这组参数中的第几个参数) 假设$\theta$是参数的集合：Suppose that $\theta$ has two variables $\left{\theta_{1}, \theta_{2}\right}$ 随机选取一组起始的参数：Randomly start at $\theta^{0}=\left[\begin{array}{l}{\theta_{1}^{0}} \ {\theta_{2}^{0}}\end{array}\right] ...

nice改变程序执行的优先权等级补充说明nice命令用于以指定的进程调度优先级启动其他的程序。语法1nice(选项)(参数) 选项1-n：指定进程的优先级（整数）。参数指令及选项：需要运行的指令及其他选项。实例新建一个进程并设置优先级，将当前目录下的documents目录打包，但不希望tar占用太多CPU： 1nice -19 tar zcf pack.tar.gz documents 方法非常简单，即在原命令前加上nice -19。很多人可能有疑问了，最低优先级不是19么？那是因为这个“-19”中的“-”仅表示参数前缀；所以，如果希望将当前目录下的documents目录打包，并且赋予tar进程最高的优先级： 1nice --19 tar zcf pack.tar.gz documents

interpolation_methods

imshow或matshow的插值这个示例显示了imshow() 和matshow()的插值方法之间的区别。如果插值为无，则默认为图像。插值RC参数。如果插值是 “none” ，则不执行插值的Agg，ps和pdf后端。其他后端将默认为“nearest”。对于Agg、ps和pdf后端，当大图像缩小时，interpolation = 'none' 工作得很好，而当小图像被放大时，interpolation = 'interpolation = 'none' 则运行正常。 1234567891011121314151617181920212223import matplotlib.pyplot as pltimport numpy as npmethods = [None, 'none', 'nearest', 'bilinear', 'bicubic', 'spline16', 'spline36&#x...

2.9. 神经网络模型（无监督）校验者: @不将就 @Loopy @barrycg @N!no翻译者: @夜神月 2.9.1. 限制波尔兹曼机限制玻尔兹曼机（Restricted Boltzmann machines，简称 RBM）是基于概率模型的无监督非线性特征学习器。当用 RBM 或多层次结构的RBMs 提取的特征在馈入线性分类器（如线性支持向量机或感知机）时通常会获得良好的结果。该模型对输入的分布作出假设。目前，scikit-learn 只提供了 BernoulliRBM，它假定输入是二值（binary values）的，或者是 0 到 1 之间的值，每个值都编码特定特征被激活的概率。 RBM 尝试使用特定图形模型最大化数据的似然。它所使用的参数学习算法（随机最大似然）可以防止特征表示偏离输入数据。这使得它能捕获到有趣的特征，但使得该模型对于小数据集和密度估计不太有效。该方法在初始化具有独立 RBM 权值的深度神经网络时得到了广泛的应用。这种方法是无监督的预训练。示例： Restricted ...

数据加载中