特征选择方法综述

特征选择方法综述

鲁棒性:系统在异常和危险情况下的生存能力。
​ 维数灾难:随着特征数量的增加,样本密度变得稀疏。
​ 过拟合问题:特征维度过多,模型假设过于复杂,参数过多,训练数据过少,噪声过多,导致拟合的函数完美的预测训练集,但对新数据的测试集预测结果差。
​ 高斯分布三法则:高斯分布即正态分布。三σ原则即为数值分布在(μ—σ,μ+σ)中的概率为0.6526,数值分布在(μ—2σ,μ+2σ)中的概率为0.9544,数值分布在(μ—3σ,μ+3σ)中的概率为0.9974。
​ 超球面:超球体