术语:训练集 、测试集、特征值
评估:准确度、速度、强壮性、可规模性、可解释性
监督学习
-
分类(离散型变量)
决策树 Decision Tree 银行信用自动评估系统,隐形眼睛类型
临近取样 Nearest Neighbor 人脸识别,手写数字识别
支持向量机 Support Vector Machine 图片中的红眼检测、结肠癌早起分类、手写识别问题
神经网络算法 Neural Network 手写数字识别、图片分类
朴素贝叶斯 Bayes 从个人广告中获取区域倾向
(可选)AdaBoot元算法 难数据集上应用AdaBootst -
回归 ( 连续型变量)
- 线性回归 Linear Regression
预测乐高玩具套装的价格 - 非线性回归 Non-Linear Regression
逻辑回归 Logisitic回归 疝气病症预测病马的死亡
- 线性回归 Linear Regression
非监督学习
- 聚类 (无目的值、分成离散的组)
K-Mean Clustering 人脸分类
Apriori算法 发现国会投票中的模式
FP-Growth 在Twitter源中发现一些共 - 密度估计(数据与每个分组的相似程度)
Hierarchical Clustering 人脸噪音排除
半监督学习