logistic回归
核心:通过sigmoid函数或者softmax函数将线性模型拟合值映射到分类概率上,并通过最大似然或者最小化交叉熵函数来获得最优系数
优点:
1.模型简单,训练速度较快,分类的时候,计算量仅仅只和特征的数目相关
2.较好的可解释性,参数的正负、绝对值大小代表了对应特征对于预测类别的重要性
3.极好的可并行性,优化目标相对参数的凸函数有全局最优解
缺点:
1.不能用Logistic回归去解决非线性问题,因为Logistic的决策面试线性的
2.对多重共线性数据较为敏感
3.很难处理数据不平衡的问题
4.逻辑回归本身无法筛选特征,有时会用gbdt来筛选特征,然后再上逻辑回归