机器学习使用实例数据或过去的经验训练计算机,以优化性能标准。当人们不能直接编写计算机程序解决给定的问题,而是需要借助于实例数据或经验时,就需要学习。一种需要学习的情况是人们没有专门技术,或者不能解释他们的专门技术。以语音识别,即将声学语音信号转换成ASCII文本为例。看上去我们可以毫无困难地做这件事... 查看全部[ 前言 ]
出版者的话 中文版序 译者序 前言 致谢 符号表 第1章 绪论1 1.1 什么是机器学习1 1.2 机器学习的应用实例2 1.2.1 学习关联性2 1.2.2 分类3 1.2.3 回归5 1.2.4 非监督学习6 1.2.5 增强学习7 1.3 注释8 1.4 相关资源9 1.5 习题10 1.6 ... 查看全部[ 目录 ]
自从有计算机以来,人们就希望计算机能够学习。然而,机器学习真正取得实质性进展,能够成功地解决一些实际问题,并最终成为一个学科分支还是近20余年的事。 对于许多问题,我们的前人和先行者已经知道如何求解。例如,欧几里德告诉我们可以用辗转相除法求两个整数的最大公约数;Dijkstra告诉我们如何有效地求两... 查看全部[ 译者序 ]
随着计算机技术的发展,我们现在已经拥有存储和处理海量数据以及通过计算机网络从远程站点访问数据的能力。目前大多数的数据存取设备都是数字设备,记录的数据也很可靠。以一家连锁超市为例,它拥有遍布全国各地的数百家分店,并且在为数百万顾客提供数千种商品的零售服务。销售点的终端设备记录每笔交易的详细资料,包括日... 查看全部[ 1.1 什么是机器学习 ]
在零售业,例如超市连锁店,机器学习的一个应用是购物篮分析(basket analysis)。它的任务是发现顾客所购商品之间的关联性:如果人们在购买商品X时也通常购买商品Y,而有一名顾客购买了商品X却没有购买商品Y,则他(或她)即是商品Y的潜在顾客。一旦我们发现这类顾客,我们就能针对他们实行打包销售策... 查看全部[ 1.2.1 学习关联性 ]
信贷是金融机构(例如银行)借出的一笔钱,需要连本带息偿还,通常是分期偿还。对银行来说,重要的是能够提前预测贷款风险。这种风险是客户不履行义务和不全额还款的可能性。既要确保银行获利,又要确保不会因提供超出客户财力的贷款而给客户带来不便。 4在信用评分(credit scoring)(Hand 1998... 查看全部[ 1.2.2 分类 ]
假设我们想要一个能够预测二手车价格的系统。该系统的输入是我们认为会影响到车价的属性信息:品牌、车龄、发动机性能、里程以及其他信息。输出是车的价格。这种输出为数值的问题是回归(regression)问题。 设x表示车的属性,y表示车的价格。调查一下以往的交易情况,我们能够收集训练数据,而机器学习程序用... 查看全部[ 1.2.3 回归 ]
在监督学习中,我们的目标是学习从输入到输出的映射关系,其中输出的正确值已经由指导者提供。然而,非监督学习中却没有这样的指导者,只有输入数据。我们的目标是发现输入数据中的规律。输入空间存在着某种结构,使得特定的模式比其他模式更常出现,而我们希望知道哪些经常发生,哪些不经常发生。在统计学中,这称为密度估... 查看全部[ 1.2.4 非监督学习 ]
在某些应用中,系统的输出是动作(action)的序列。在这种情况下,单个的动作并不重要,重要的是策略(policy),即达到目标的正确动作的序列。不存在中间状态中最好动作这种概念。如果一个动作是好的策略的组成部分,那么该动作就是好的。这种情况下,机器学习程序就应当能够评估策略的好坏程度,并从以往好的... 查看全部[ 1.2.5 增强学习 ]