分类算法:
-
决策树
-
因子分解机
-
梯度提升决策树
-
LinearSVC 线性支持向量分类
-
逻辑回归
-
多层感知器
-
朴素贝叶斯
-
随机森林
-
支持向量机
回归算法:
-
加速失效时间模型
-
广义线性回归
-
线性回归
聚类算法
- K-Means
数据挖掘
- 协同过滤
1.1 交替最小二乘法
局部二分K-Means算法
高斯混合模型
隐含狄利克雷分布
FP-growth
PrefixSpan
方差分析
卡方检验
F检验
KS-检验
相似度检验
5.1 欧几里得距离相似度
5.2 汉明距离(Hamming distance)
5.3 杰卡德相似系数(Jaccard similarity coefficient)
5.4 标准化欧氏距离 (Standardized Euclidean distance )
5.5 余弦相似度
5.6 皮尔逊相关系数(Pearson product-moment correlation coefficient)
5.7 切比雪夫距离(Chebyshev Distance)
5.8 闵可夫斯基距离(Minkowski Distance)
明天过来补充下 特征工程~
PCA 主成分分析
LSH 局部敏感哈希
MinHashLSH 【杰卡德相似系数】
BucketedRandomProjectionLSH【欧几里得距离】
IDF 逆文本频率
DCT 离散余弦变换