机器学习：SVM（SVM 思想解决回归问题）-白红宇

机器学习：SVM（SVM 思想解决回归问题）

阅读量：2222 次

发布时间：2019-05-08

本文共 1417 字，大约阅读时间需要 4 分钟。

一、SVM 思想在解决回归问题上的体现

回归问题的本质：找到一条直线或者曲线，最大程度的拟合数据点；

怎么定义拟合，是不同回归算法的关键差异；

线性回归定义拟合方式：让所有数据点到直线的 MSE 的值最小；

SVM 算法定义拟合的方式：在距离 Margin 的区域内，尽量多的包含样本点；

SVM 的思路解决回归问题：

在 Margin 区域内的样本点越多，则 Margin 区域越能够较好的表达样本数据点，此时，取 Margin 区域内中间的那条直线作为最终的模型；用该模型预测相应的样本点的 y 值；

在具体训练 SVM 算法模型解决回归问题时，提前指定 Margin 的大小，算法引入的超参数：ε，表示 Margin 区域的两条直线到区域中间的直线的距离，如图：

SVM 解决回归问题的思路与解决分类问题的思路相反，解决分类问题时，希望 Margin 区域内没有样本点或者样本点尽可能的少；

LinearSVC、SVC、LinearSVR、SVR ：

LinearSVC：使用线性 SVM 的思路解决分类问题；

SVC：使用非线性 SVM 的思路解决分类问题；（多项式核、高斯核）

LinearSVR：使用线性 SVM 的思路解决回归问题；

SVR：使用非线性 SVM 的思路解决回归问题；（使用不同的核函数）

二、scikit-learn 中的 SVM 算法：LinearSVR、SVR 解决回归问题

LinearSVR、SVR 的使用方式与 LinearSVC、SVC 一样

import numpy as npimport matplotlib.pyplot as pltfrom sklearn import datasetsboston = datasets.load_boston()X = boston.datay = boston.targetfrom sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y, random_state=666)from sklearn.svm import LinearSVRfrom sklearn.svm import SVRfrom sklearn.preprocessing import StandardScalerfrom sklearn.pipeline import Pipelinedef StandardLinearSVR(epsilon=0.1):    return Pipeline([        ('std_scaler', StandardScaler()),        ('linearSVR', LinearSVR(epsilon=epsilon))        # 此处使用超参数 C 的默认值;        # 如果使用 SVR()，还需要调节参数 kernel；    ])svr = StandardLinearSVR()svr.fit(X_train, y_train)svr.score(X_test, y_test)# 准确率：0.6353520110647206

转载于:https://www.cnblogs.com/volcao/p/9471800.html

你可能感兴趣的文章

java-oracle中几十个实用的PL/SQL