首页 > 社会热点 > >正文

机器学习实战

来源:哔哩哔哩2023-07-08 19:50:45


【资料图】

链接:/s/1329fljbAtaiGCg4Ej7YKog?pwd=8rve 

提取码:8rve

介绍并实现机器学习的主流算法  面向日常任务的高效实战内容  《机器学习实战》没有从理论角度来揭示机器学习算法背后的数学原理,而是通过“原理简述+问题实例+实际代码+运行效果”来介绍每一个算法。学习计算机的人都知道,计算机是一门实践学科,没有真正实现运行,很难真正理解算法的精髓。这本书的好处就是边学边用,非常适合于急需迈进机器学习领域的人员学习。实际上,即使对于那些对机器学习有所了解的人来说,通过代码实现也能进一步加深对机器学习算法的理解。  《机器学习实战》的代码采用Python语言编写。Python代码简单优雅、易于上手,科学计算软件包众多,已经成为不少大学和研究机构进行计算机教学和科学计算的语言。相信Python编写的机器学习代码也能让读者尽快领略到这门学科的精妙之处。

内容简介

机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或模式,成为各行业求生存、谋发展的决定性手段,这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。  《机器学习实战》主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树(CART)算法等。第三部分则重点介绍无监督学习及其一些主要算法:k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的一些附属工具。  《机器学习实战》通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化。通过各种实例,读者可从中学会机器学习的核心算法,并能将其运用于一些策略性任务中,如分类、预测、推荐。另外,还可用它们来实现一些更高级的功能,如汇总和简化等。

作者简介

Peter Harrington,拥有电气工程学士和硕士学位,他曾经在美国加州和中国的英特尔公司工作7年。Peter拥有5项美国专利,在三种学术期刊上发表过文章。他现在是Zillabyte公司的首席科学家,在加入该公司之前,他曾担任2年的机器学习软件顾问。Peter在业余时间还参加编程竞赛和建造3D打印机。

精彩书评

“易学易懂,用处很大。”  ——Alexandre Alves,Oracle CEP的架构师  “精心织构的代码完美地诠释出机器学习的核心要义。”  ——Patrick Toohey,Mettler-Toledo Hi-Speed软件工程师  “实例很棒!可用于任何领域!”  ——John Griffin,Hibernate Search in Action一书的合作者  “叙述循序渐进,巧妙地阐述了算法之间的差异。”  ——Stephen McKamey,Isomer Innovations技术实践总监

目录

第一部分 分类第1章 机器学习基础    何谓机器学习    传感器和海量数据    机器学习非常重要    关键术语    机器学习的主要任务    如何选择合适的算法    开发机器学习应用程序的步骤    Python语言的优势    可执行伪代码    Python比较流行    Python语言的特色    Python语言的缺点    NumPy函数库基础    本章小结  第2章 k-近邻算法     k-近邻算法概述    准备:使用Python导入数据    从文本文件中解析数据    如何测试分类器    示例:使用k-近邻算法改进约会网站的配对效果    准备数据:从文本文件中解析数据    分析数据:使用Matplotlib创建散点图    准备数据:归一化数值    测试算法:作为完整程序验证分类器    使用算法:构建完整可用系统    示例:手写识别系统    准备数据:将图像转换为测试向量    测试算法:使用k-近邻算法识别手写数字    本章小结  第3章 决策树     决策树的构造    信息增益    划分数据集    递归构建决策树    在Python中使用Matplotlib注解绘制树形图    Matplotlib注解    构造注解树    测试和存储分类器    测试算法:使用决策树执行分类    使用算法:决策树的存储    示例:使用决策树预测隐形眼镜类型    本章小结  第4章 基于概率论的分类方法:朴素贝叶斯     基于贝叶斯决策理论的分类方法    条件概率    使用条件概率来分类    使用朴素贝叶斯进行文档分类    使用Python进行文本分类    准备数据:从文本中构建词向量    训练算法:从词向量计算概率    测试算法:根据现实情况修改分类器    准备数据:文档词袋模型    示例:使用朴素贝叶斯过滤垃圾邮件    准备数据:切分文本    测试算法:使用朴素贝叶斯进行交叉验证    示例:使用朴素贝叶斯分类器从个人广告中获取区域倾向    收集数据:导入RSS源    分析数据:显示地域相关的用词    本章小结  第5章 Logistic回归     基于Logistic回归和Sigmoid函数的分类    基于最优化方法的最佳回归系数确定    梯度上升法    训练算法:使用梯度上升找到最佳参数    分析数据:画出决策边界    训练算法:随机梯度上升    示例:从疝气病症预测病马的死亡率    准备数据:处理数据中的缺失值    测试算法:用Logistic回归进行分类    本章小结  第6章 支持向量机    基于最大间隔分隔数据    寻找最大间隔    分类器求解的优化问题    SVM应用的一般框架    SMO高效优化算法    Platt的SMO算法    应用简化版SMO算法处理小规模数据集    利用完整Platt SMO算法加速优化    在复杂数据上应用核函数    利用核函数将数据映射到高维空间    径向基核函数    在测试中使用核函数    示例:手写识别问题回顾    本章小结  第7章 利用AdaBoost元算法提高分类性能     基于数据集多重抽样的分类器    bagging:基于数据随机重抽样的分类器构建方法    boosting    训练算法:基于错误提升分类器的性能    基于单层决策树构建弱分类器    完整AdaBoost算法的实现    测试算法:基于AdaBoost的分类    示例:在一个难数据集上应用AdaBoost    非均衡分类问题    其他分类性能度量指标:正确率、召回率及ROC曲线    基于代价函数的分类器决策控制    处理非均衡问题的数据抽样方法    本章小结  第二部分 利用回归预测数值型数据第8章 预测数值型数据:回归     用线性回归找到最佳拟合直线    局部加权线性回归    示例:预测鲍鱼的年龄    缩减系数来“理解”数据    岭回归    lasso    前向逐步回归    权衡偏差与方差    示例:预测乐高玩具套装的价格    收集数据:使用Google购物的API    训练算法:建立模型    本章小结  第9章 树回归    复杂数据的局部性建模    连续和离散型特征的树的构建    将CART算法用于回归    构建树    运行代码    树剪枝    预剪枝    后剪枝    模型树    示例:树回归与标准回归的比较    使用Python的Tkinter库创建GUI    用Tkinter创建GUI    集成Matplotlib和Tkinter    本章小结  第三部分 无监督学习第10章 利用K-均值聚类算法对未标注数据分组    K-均值聚类算法    使用后处理来提高聚类性能    二分K-均值算法    示例:对地图上的点进行聚类    Yahoo! PlaceFinder API    对地理坐标进行聚类    本章小结  第11章 使用Apriori算法进行关联分析    关联分析    Apriori原理    使用Apriori算法来发现频繁集    生成候选项集    组织完整的Apriori算法    从频繁项集中挖掘关联规则    示例:发现国会投票中的模式    收集数据:构建美国国会投票记录的事务数据集    测试算法:基于美国国会投票记录挖掘关联规则    示例:发现毒蘑菇的相似特征    本章小结  第12章 使用FP-growth算法来高效发现频繁项集    FP树:用于编码数据集的有效方式    构建FP树    创建FP树的数据结构    构建FP树    从一棵FP树中挖掘频繁项集    抽取条件模式基    创建条件FP树    示例:在Twitter源中发现一些共现词    示例:从新闻网站点击流中挖掘    本章小结  第四部分 其他工具第13章 利用PCA来简化数据    降维技术    PCA    移动坐标轴    在NumPy中实现PCA    示例:利用PCA对半导体制造数据降维    本章小结  第14章 利用SVD简化数据    SVD的应用    隐性语义索引    推荐系统    矩阵分解    利用Python实现SVD    基于协同过滤的推荐引擎    相似度计算    基于物品的相似度还是基于用户的相似度?    推荐引擎的评价    示例:餐馆菜肴推荐引擎    推荐未尝过的菜肴    利用SVD提高推荐的效果    构建推荐引擎面临的挑战    基于SVD的图像压缩    本章小结  第15章 大数据与MapReduce    MapReduce:分布式计算的框架    Hadoop流    分布式计算均值和方差的mapper    分布式计算均值和方差的reducer    在Amazon网络服务上运行Hadoop程序    AWS上的可用服务    开启Amazon网络服务之旅    在EMR上运行Hadoop作业    MapReduce上的机器学习    在Python中使用mrjob来自动化MapReduce    mrjob与EMR的无缝集成    mrjob的一个MapReduce脚本剖析    示例:分布式SVM的Pegasos算法    Pegasos算法    训练算法:用mrjob实现MapReduce版本的SVM    你真的需要MapReduce吗?    本章小结  附录A  Python入门  附录B  线性代数  附录C  概率论复习  附录D  资源  索引  版权声明

查看全部↓

标签:

下一篇: 最后一页
上一篇: (待审)咸安公安分局开展夏夜治安巡查宣防集中统一行动