文章
技术

【算法】2020年的学习总结

分类算法:

  1. 决策树

  2. 因子分解机

  3. 梯度提升决策树

  4. LinearSVC 线性支持向量分类

  5. 逻辑回归

  6. 多层感知器

  7. 朴素贝叶斯

  8. 随机森林

  9. 支持向量机

回归算法:

  1. 加速失效时间模型

  2. 广义线性回归

  3. 线性回归

聚类算法

  1. K-Means

数据挖掘

  1. 协同过滤

1.1 交替最小二乘法

菜单
  1. 张怀义  

    聚类补充

    局部二分K-Means算法

    高斯混合模型

    隐含狄利克雷分布

    特征工程


    数据挖掘

    1. FP-growth

    2. PrefixSpan

    统计算法

    1. 方差分析

    2. 卡方检验

    3. F检验

    4. KS-检验

    5. 相似度检验

    5.1 欧几里得距离相似度

    5.2 汉明距离(Hamming distance)

    5.3 杰卡德相似系数(Jaccard similarity coefficient)

    5.4 标准化欧氏距离 (Standardized Euclidean distance )

    5.5 余弦相似度

    5.6 皮尔逊相关系数(Pearson product-moment correlation coefficient)

    5.7 切比雪夫距离(Chebyshev Distance)

    5.8 闵可夫斯基距离(Minkowski Distance)

  2. 张怀义  

    明天过来补充下 特征工程~

  3. 张怀义  

    PCA 主成分分析

    LSH 局部敏感哈希

    1. MinHashLSH 【杰卡德相似系数】

    2. BucketedRandomProjectionLSH【欧几里得距离】

    IDF 逆文本频率

    DCT 离散余弦变换