支持向量机(SVM)是在统计学习理论的基础上发展起来的新一代学习算法,它在文本分类、手写识别、图像分类、生物信息学等领域中获行较好的应用。本书是第一本综合介绍支持向量机(SVM)的书籍,它从机器学习算法的基本问题开始,循序渐进地介绍相关的背景知识,包括线性分类器、核函数特征空间、推广性理论和优化理论,在此基础上很自然地引出了支持向量机的算法。本书末尾还详细讨论了一系列支持向量机的重要应用及其实现的技巧。本书的叙述清晰严谨,自包含性强,提供的大量相关文献引用以及网站链接可作为进一步学习的理想起始点。本书可作为计算机、自动化、机电工程、应用数学等专业的研究生教材,也可作为神经网络、机器学习、数据挖掘、人工智能等课程的参考教材,同时还是相关领域的教师和研究人员的参考书。
第1章 学习理论\r\n 1.1 监督学习\r\n 1.2 学习和泛化性\r\n 1.3 提高泛化性\r\n 1.4 学习的价值和缺点\r\n 1.5 用于学习的支持向量机\r\n 1.6 习题\r\n 1.7 补充读物和高级主题\r\n第2章 线性学习器\r\n 2.1 线性分类\r\n 2.2 线性回归\r\n 2.3 线性学习器的对偶表示\r\n 2.4 习题\r\n 2.5 补充读物和高级主题\r\n第3章 核函数特征空间\r\n 3.1 特征空间中的学习\r\n 3.2 到特征空间的隐式映树\r\n 3.3 构造核函数\r\n 3.4 特征空间中的计算\r\n 3.5 核与高斯过程\r\n 3.6 习题\r\n 3.7 补充读物和高级主题\r\n第4章 泛化性理论\r\n 4.1 可能近似正确学习模型\r\n 4.2 VC理论\r\n 4.3 泛化性的间隔界\r\n 4.4 其他泛化界和幸运度函数\r\n 4.5 回归的泛化性\r\n 4.6 学习的贝叶斯分析\r\n 4.7 习题\r\n 4.8 补充读物和高级主题\r\n第5章 最优化理论\r\n第6章 支持向量机\r\n第7章 实现技术\r\n第8章 支持向量机的应用\r\n附录A SMO算法的伪码\r\n附录B 背景数学
近年来,支持向量机(SVM)的理论已经取得重大进展,其算法实现策略以及实际应用也发展迅速。可以确信,该技术的研究已发展成为机器学习中一个独立的子领域,在理论和实践两方面都有着光明的前景。尽管如此,目前还很缺乏对这个主题较系统的介绍材料。SVM的理论体系涵盖的对象极为广泛,包括对偶表示、特征空间、学习理论、优化理论和算法等。
虽然关于这些主题仍在进行大量的研究工作,但其基础理论已经发展成熟,足以构建SVM的整个框架。本书从这些基础理论出发,尝试以SVM为主题进行深入浅出的介绍。
本书提供了严谨但易懂的阅读材料,可以作为学生或研究者进入机器学习这一新领域的指导读物。本书组织成教材形式,既可作为SVM课程的核心材料,也可作为神经网络、机器学习或模式识别等课程的附加读物。因为采取了教材形式,本书的内容尽可能做到自包含,以使非机器学习或者没有计算机背景的读者易于掌握。这样其他领域的读者就可以很轻松地应用SVM到自己的实际问题中去。作者还尝试通过严谨的推导来提供清晰的学习路线,因此书中提供了定理简要的证明过程以增强读者对概念的理解。对详细的证明过程感兴趣的读者可以参考原始文献。
每章后面附有习题,以及相关的参考文献或软件。由于在线资源可能会更新,所以有些引用会指向某一专门网站,其中相关的链接也会相应更新,从而保证读者找到相应的在线资源。
尽管有些引用是间接的,本书还是尽量标明所引用素材的作者。希望各位作者不会因为这些间接引用而感到不快。每章的结尾有补充读物和高级主题,其作用有二:一是将所有引用包含在这一节以使正文尽可能整洁,这里要再次请求所引用素材的作者宽恕这种延后的引用说明;二是希望为读者提供一个出发点以便能够进一步学习该章所讨论的主题。这些参考材料也包含在网站中,并保持更新。将引用说明移到正文之外的另一考虑是该领域已经到达一个成熟阶段,从而能使用前后一致的表述。但在这个方面有两个例外,一是某些定理通常可由其命名得知其作者,比如Mercer定理;另一例外是在第8章,其中描述了研究领域的一些特定实验。
本书写作中遵循的基本原则是对于不喜欢复杂的证明和概念的学生和研究者而言易于理解。相信通过直观且严谨的内容安排,SVM的出现会显得简单又自然。本书还尽量用简单的例子来介绍概念,之后才说明在复杂情形下的用法。本书是自包含的,附录中提供了基本线性代数和概率论之外的一些数学工具,从而更适合于跨学科的读者。
书中大部分材料在一个5小时的SVM和大间隔推广能力的讲座中展示过,该讲座是1999年在California大学Santa Cruz校区举办的。其中的大多数反馈意见也包含在书中。本书的部分章节是Nello在Califomia大学Santa Cruz校区访问时写的,感谢这里的东道主和优美的校园环境。写作过程中,Nello多次长时间访问London大学Royal Holloway校区。他很感谢Lynda及其家人的三次款待。Nello和John还想感谢技术管理员Alex Gammerman以及Royal Holloway的计算机系同仁,他们提供了宽松舒适的环境,使得作者安心写作。
许多人为本书的雏形和主干做出了贡献,包括间接的讨论和对手稿的直接评注。作者感谢Kristin Bennett,Colin Campbell,Nicol6 Cesa-Bianchi,David Haussler, Ralf Herbrich,Ulrich Kockelkom,John Platt,Tomaso Poggio,Bemhard Scholkopf,Alex Smola,Chris Watldns,Manfred Warmuth,Chris Williams和Bob Williamson。
作者还感谢DavidTranah和Cambridge大学出版社对本书出版过程中的大力支持和帮助。
Alessio Cristianini帮助建立了网站。Kostantinos Veropoulos在Bristol大学用他的软件包生成了第6章的图片。感谢John Platt提供了附录A中的SMO伪码。
Nello衷心感谢EPSRC的支持,感谢Colin Campbell主管的理解和协助。John感谢欧洲委员会对于NeuroCOLT2工作组EP27150的支持。
由于第一版中出现了少量错误,作者尽力保证在重印前修改这些错误。欢迎读者指出更多的问题,并通过本书的网站www.support-vector.net反馈给作者。