时间:2016-12-5来源:本站原创作者:佚名

万事开头难。第一本该介绍哪个,或者第一本该看哪个,实在是不好讲。即使是Amazon上的书评,老外也是理工科两极分化严重,每本都有很多人说适合入门用的,也有很多人说不适合的。但是个人认为,第一本一定要能用最清晰的语言,最简单的例子把尽量多的核心概念、术语讲在前面,最好还要有尽可能多的图,这样初学者才能“不怵”这么多概念名词。有了基本概念之后然后再后面反复涉及这些概念,不断深化理解。最后再能覆盖一定的广度和前沿。

因此:第一本书,我推荐《PatternClassification》。

引进的中文版和影印版,和原版都是第2版,但是英文原版后来多次印刷,改正了很多错误。

优点:

1.版本多,好找。不解释。

2.图多,也不解释。

3.一开始就用简单例子把模式识别的流程,和基本概念比如贝叶斯推断、极大似然等等基本概念,以及评价分类能力常用的接收机特性曲线(ReceiverOperatingCharacteristiccurveROC)等等概念提出来了,讲得比较清楚。即使一开始看不明白,但是你知道有这些玩意,以后会多留心。

4.涉及面比较广。虽然成书比较早了第二版是年,第一版居然是年。但是覆盖的算法和领域比较广泛,不只限于模式识别了,作为概览很不错了。

5.有深度。很多加*的章节之外,还有涉及哲学思想的评注章节,“发人深省”四个字并不为过,而且值得“反复回味”:比如“奥康的剃刀(Occam’srazor)”法则,“没有天生优越的分类器”法则,等等等,这个中译本的序言里也提到了。

6.入门的数学要求不高。这点对工科出身的人入门很重要。个人感觉学过概率和线代,入门就够了。当然,随机过程啊,矩阵论啊当然难免会涉及到,但是作者已经尽量淡化数学要求了。

问题和不足:

1.图注简略。图虽多,有时还是难免不懂。

2.有难度。公式不少,而且有时跳步,够工科生啃的。每个章节都有引申部分。传说有的学校前三章就能讲2个月以上的。

3.适合理解理论思路思想,但是想对照编程实践,有点难度。虽然有一些算法的伪代码,但是个人觉得还是太简略了。主要是对数据的描述太少。不过,好消息是——现在有配套的Matlab教程了!坏消息是——貌似国内没引进.(偶尔说话大喘气一下,哈哈)

感觉如果不是特别有钱,特别痴迷这个,还是算了。别的书有白提供程序的(再次大喘气)。

4.偏预测,轻数据挖掘;在预测里偏分类,轻回归。这倒不奇怪,人家书名写得明白。

但是,即使想做数据挖掘的,我还是推荐先看这个书。因为首先入门阶段,基本概念都是差不多的,而且后面讲到算法性能评价、选择标准等等思想确实值得领会。

这本主要用来领会思想思路,先不要执着于看懂每行公式,每张图。

第一本大概就这样。

后面就不分先后了。因为有的重理论,有的重应用,而且每个牛人都有自己擅长和生疏的领域,能在自己擅长的领域把各种算法串成脉络,讲清楚发展过程和区别联系已经很难得了。

推荐二《ArtificialIntelligence:AModernApproach》

这次先贴两本离题稍远点的,作为开阔知识来用的参考书。

《ArtificialIntelligence:AModernApproach》

中文和2种影印都是原书第2版,02年出的,两种影印我比较过内容没区别,但是清华的纸质稍好,但价格贵好多。中文和人邮的影印图书馆好找,但是市面上好像木有了。

现在原版是09年底刚出的第3版了。但看书评,好像变化不是特别大,有些有第2版的人觉得亏了。

优点:

1.涉及面特别广。从走棋的算法,到语义逻辑分析,到智能系统……并不局限于概率统计类的方法,无所不包。

2.很多AI方面的历史人物和典故。从莱布尼茨时代的机械计算机器,到图灵,到年代某人第一次写了个啥算法。怎么说呢,当故事书看也行了。

3.叙述比较清楚。

问题:

1.有点散。各个章节之间有时联系不是那么大,其实为了做到包罗万象,散是难免的。

2.Introduction而非Reference。所以指望看这个书完了去照着写算法,就别想了。

3.第2版里没涉及支持向量机(SupportVetorMachineSVM)。这个即使作为02年出的书也不应该了。不过现在SVM基本是大路货了,到处都是(SVM有点走当年神经网络最后烂大街,无人问津的趋势)。

4.太厚,快速翻阅即可。中文多页,英文多页。因为毕竟大家有各自专业背景,所以挑前几章+自己相关领域的章节,浏览即可,其他当故事书看,就当做专业英语的阅读资料吧。

总之,适合没接触过的这方面的人入门用。但是个人感觉一个是有点散,一个是概念太多,没有突出概率统计。感觉很容易迷路似的,所以第一本没推荐这个。但N多学校都用这个做教材,不是没道理的。

推荐三《NonlinearTimeSeries:NonparametricandParametricMethods》

这本是两个中国牛人写的。范剑青、姚奇伟.

这本虽然专讲时间序列,但是觉得自动化之类工科出身的人往机器学习数据挖掘方面转的话,这样一本由数学家写的数学味浓一些的书还是很有必要的。特别是中国人写的,所以在大牛在国内的时候,还有机会当面请教。

优点:

1.背景知识适合自动化、通信这些专业的。一般电子类的都会学点现代数字信号处理比如Wiener最佳滤波,Kalman滤波之类,已经了解ARMA模型了,这样看这个书可以了解这些方法的发展和引申。虽然不见得以后真的去做金融之类,但是用自己熟悉的背景知识去入门,总比两眼一抹黑钻进去强。其实“在工言工”,看成是在讲高级滤波算法的话,能不能用在控制系统里呢?反正俺那本已经被搞控制的同学借去鸟。

2.图表例子多,程序提供下载。虽然是S-plus/R写的,可能工科的没接触过R,但是很容易上手。

3.数学味,不解释。

问题:

1.领域比较专门。主要适合经济数据,金融数据这些。当然书里也举了生态学上的例子。

2.比较难懂。一个是数学味,一个是很少分析算法细节,公式推导都比较简略,要配合参考文献和程序。

但是之所以推荐这本,倒不是说里面讲到的那些方法。而是想:

1.介绍两位中国牛人,有机会见到可以请教。

2.通过这书里的例子,了解点R语言。开源的数学软件,是数学家用的,上面有很多最新的ML算法。假如你早已熟悉了工程味的MATLAB,现在可以体味一下R简化的都是哪些地方?在思路和实践上,都要习惯不断切换工科和理科两种方式。试试理科的工具,也就能多找找感觉。

3.要适应数学家的表达。毕竟这个领域的算法都是人家提出来的,看论文基本就是在膜拜统计学家了。通过这个也体会一下同样是ARMA模型,理科是怎么思考的。不要再满足于当初学信号处理的时候,好像学了个Levinson-Durbin,Kalman递推公式就万事大吉。

推荐四《PatternRecognitionandMachineLearning》

最后3本,打算先介绍2本贝叶斯方法为主的。下一次再用我最喜欢、也看得最仔细的《theElementsofStatisticalLearning》(EoSL)压轴。

作者个人网站:ChristopherM.Bishop上面有题解。这本国内好像没引进。但是人大经济学论坛和CSDN上有PDF下载,淘宝上好像也有卖打印版的。

优点:

1.







































白癜风治疗医院哪家最好
沈阳治白癜风最好的医院

转载请注明原文网址:http://www.helimiaopu.com/cxtx/2535.html

------分隔线----------------------------