美林数据
ABOUT US
美林数据技术股份有限公司(简称:美林数据,NEEQ:831546)是国内知名的数据治理和数据分析服务提供商。

美林新闻/NEWS

首页 美林数据 行业资讯

【数据挖掘算法分享】机器学习平台——回归算法之保序回归

2022-11-03 19:38:34
保序回归可以看作是附加有序限制的最小二乘问题,拟合的结果为分段的线性函数。训练集用该算法可以返回一个保序回归模型,可以被用于预测已知或者未知特征值的标签。目前只支持一维自变量。

算法思想
保序回归可以看作是附加有序限制的最小二乘问题,拟合的结果为分段的线性函数。给定有限的真实值 和观测值,保序回归算法通过最小化以下目标函数来拟合真实值:
 
其中为权重,
计算全序下的保序回归,最广泛使用的算法是由Ayer于1955年提出的PVAV算法,其基本步骤如下:
    如果y是有序的,则x^*=y;
    如果存在j使得,记,
    如果y ̃是保序的,即,则
如果y ̃不是保序的,则重复步骤2,直至得到保序回归x^*。
保序回归算法要求数据存在单调性,且仅能处理单一自变量的数据;由于需要对自变量进行排序操作,算法复杂度较高。

数据格式
必须设置类属性(输出),且类属性(输出)必须是连续型(数值);
非类属性(输入)是连续型(数值)且只能有一列输入属性;

参数说明

Tempo机器学习平台
参数 类型 描述
递增模式 单选按钮 自变量按递增排序
递增模式 单选按钮 自变量按递减排序

结果说明
 机器学习平台——回归算法之保序回归
“红点”代表分段的分隔点,“直线”代表拟合的分段线性函数。
 机器学习平台——回归算法之保序回归
最后一列属性“prediction”为回归预测列。
演示实例
利用Tempo机器学习平台构建如下流程:
 机器学习平台——回归算法之保序回归
【文件输入】节点配置如下:
 机器学习平台——回归算法之保序回归
【设置角色】节点配置如下:
 机器学习平台——回归算法之保序回归
【保序回归】节点配置如下:
 机器学习平台——回归算法之保序回归
流程运行结果如下:
机器学习平台——回归算法之保序回归机器学习平台——回归算法之保序回归 



服务热线
400-608-2558
咨询热线
029-88696198
美林数据
微信扫描二维码,立即在线咨询