美林数据
ABOUT US
美林数据技术股份有限公司(简称:美林数据,NEEQ:831546)是国内知名的数据治理和数据分析服务提供商。

美林新闻/NEWS

首页 美林数据 行业资讯

数据建模工具—数据处理算法讲解之局部多项式回归拟合

2022-10-27 18:55:25
局部多项式回归拟合是对两维散点图进行平滑的常用方法,它结合了传统线性回归的简洁性和非线性回归的灵活性。当要估计某个因变量时,先从其自变量附近取一个数据子集,然后对该子集进行线性回归或二次回归。回归时可采用最小二乘或者采用加权最小二乘法,最后利用得到的局部回归模型来估计因变量的值。用这种方法进行逐点运算得到整条拟合曲线。
算法思想
局部加权多项式回归拟合是一种非参数(non-parametric)型学习算法,局部多项式回归拟合就是,给待测点附近的每个点赋予一定的权重,也就是加上一个核函数权重矩阵W,最后最小化下面的目标函数:

局部多项式回归拟合算法整个步骤如下:
对于给定的训练样本,其中x_i为自变量,y_i为因变量,n为样本个数,m为样本的维数。
    构造自变量矩阵
    构造因变量矩阵
    构造权重函数矩阵
    基于最小二乘方法可以得到查询点的系数:

如此下去,i从1取到n,就可以计算出n个θ向量。
数据格式
数值型字段;
参数说明

机器学习平台 
参数 类型 描述
选择变量 列表框 指定需要进行局部多项式回归拟合的属性列,属性列的数据类型均为数值型,其中多个属性列作为自变量,一个属性列作为因变量
拟合样本数 文本框 拟合样本数是指局部拟合的样本的个数,范围为大于0的整数
权重方式 下拉框 提供线性加权、二次加权、三次加权、倒数加权、高斯加权、常数加权等权重方式

结果说明
 Tempo机器学习平台
属性列+“_fitted”为通过“局部多项式回归拟合”后的数据。
演示实例
Tempo机器学习平台构建如下流程:
Tempo机器学习平台
【文件输入】节点配置如下:
 Tempo机器学习平台
【局部多项式回归】节点配置如下:
 Tempo机器学习平台
流程运行结果如下:
 Tempo机器学习平台


服务热线
400-608-2558
咨询热线
029-88696198
美林数据
微信扫描二维码,立即在线咨询