机器学习总结（机器学习实践笔记）

有监督学习
有监督学习是机器学习中最常见的类型。它本质上是一种函数逼近。我们试图将数据点映射为一个模糊函数。通过优化，我们希望依据训练数据拟合出一个与未来数据取得最佳逼近效果的函数。该类方法之所以成为“有监督方法”，是因为它们需要接收一个训练集或学习集
无监督学习
无监督学习只分析数据，而不向某个Y映射。该类方法之所以称为“无监督方法”，是因为它们并不知道输出结果为何物，而是需要自己提供。
强化学习
强化学习与有监督学习相似，但会对每一步生成一个“回报”。例如，好比一只在迷宫中寻找奶酪的老鼠，它希望找到奶酪，但绝大多数时候它不会得到任何奖励，除非最终找到奶酪

1.1

1.2

例如，对于确定某人居住的社区这样的问题，KNN便是一个很好的选择，而朴素贝叶斯分类模型则丝毫派不上用场。

但朴素贝叶斯分类模型可以确定情绪或其他类型的概率。

对于寻求两类数据划分边界的问题，支持向量机算法则非常适合，而且不易受维数灾难的影响。因此，对于拥有大量特征的文本问题，支持向量机通常都是很好的选择。

神经网络可以求解从分类到自动驾驶这样范围很广的问题。

核岭回归则是向线性回归模型中添加了一种简单的技巧，并且能够找到曲线的均值。

隐马尔科夫模型能够追踪乐谱，标注词性，并适用于其它类似于系统的应用。

聚类算法适合于那些不含明确输出的数据分组问题。这类算法对数据分析非常有帮助，也可用于构建数据库或高效地保存数据。

过滤方法非常适用于克服维数灾难。为将所提取到的像素转换为特征，大量使用了该方法。

学习算法仅仅是一个开始。最重要的是，我们应当认识到，选择什么方法并不是最关键的，要尝试解决的问题才是最重要的。
这正是我们使用交叉验证、度量精度、查全率和准确率的原因。对每一个步骤进行检查和测试，保证了我们至少在接近更优的答案。

机器学习总结 （机器学习实践笔记）