机器学习实战
【资料图】
链接:/s/1329fljbAtaiGCg4Ej7YKog?pwd=8rve
提取码:8rve
介绍并实现机器学习的主流算法 面向日常任务的高效实战内容 《机器学习实战》没有从理论角度来揭示机器学习算法背后的数学原理,而是通过“原理简述+问题实例+实际代码+运行效果”来介绍每一个算法。学习计算机的人都知道,计算机是一门实践学科,没有真正实现运行,很难真正理解算法的精髓。这本书的好处就是边学边用,非常适合于急需迈进机器学习领域的人员学习。实际上,即使对于那些对机器学习有所了解的人来说,通过代码实现也能进一步加深对机器学习算法的理解。 《机器学习实战》的代码采用Python语言编写。Python代码简单优雅、易于上手,科学计算软件包众多,已经成为不少大学和研究机构进行计算机教学和科学计算的语言。相信Python编写的机器学习代码也能让读者尽快领略到这门学科的精妙之处。
内容简介
机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或模式,成为各行业求生存、谋发展的决定性手段,这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。 《机器学习实战》主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树(CART)算法等。第三部分则重点介绍无监督学习及其一些主要算法:k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的一些附属工具。 《机器学习实战》通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化。通过各种实例,读者可从中学会机器学习的核心算法,并能将其运用于一些策略性任务中,如分类、预测、推荐。另外,还可用它们来实现一些更高级的功能,如汇总和简化等。
作者简介
Peter Harrington,拥有电气工程学士和硕士学位,他曾经在美国加州和中国的英特尔公司工作7年。Peter拥有5项美国专利,在三种学术期刊上发表过文章。他现在是Zillabyte公司的首席科学家,在加入该公司之前,他曾担任2年的机器学习软件顾问。Peter在业余时间还参加编程竞赛和建造3D打印机。
精彩书评
“易学易懂,用处很大。” ——Alexandre Alves,Oracle CEP的架构师 “精心织构的代码完美地诠释出机器学习的核心要义。” ——Patrick Toohey,Mettler-Toledo Hi-Speed软件工程师 “实例很棒!可用于任何领域!” ——John Griffin,Hibernate Search in Action一书的合作者 “叙述循序渐进,巧妙地阐述了算法之间的差异。” ——Stephen McKamey,Isomer Innovations技术实践总监
目录
第一部分 分类第1章 机器学习基础 何谓机器学习 传感器和海量数据 机器学习非常重要 关键术语 机器学习的主要任务 如何选择合适的算法 开发机器学习应用程序的步骤 Python语言的优势 可执行伪代码 Python比较流行 Python语言的特色 Python语言的缺点 NumPy函数库基础 本章小结 第2章 k-近邻算法 k-近邻算法概述 准备:使用Python导入数据 从文本文件中解析数据 如何测试分类器 示例:使用k-近邻算法改进约会网站的配对效果 准备数据:从文本文件中解析数据 分析数据:使用Matplotlib创建散点图 准备数据:归一化数值 测试算法:作为完整程序验证分类器 使用算法:构建完整可用系统 示例:手写识别系统 准备数据:将图像转换为测试向量 测试算法:使用k-近邻算法识别手写数字 本章小结 第3章 决策树 决策树的构造 信息增益 划分数据集 递归构建决策树 在Python中使用Matplotlib注解绘制树形图 Matplotlib注解 构造注解树 测试和存储分类器 测试算法:使用决策树执行分类 使用算法:决策树的存储 示例:使用决策树预测隐形眼镜类型 本章小结 第4章 基于概率论的分类方法:朴素贝叶斯 基于贝叶斯决策理论的分类方法 条件概率 使用条件概率来分类 使用朴素贝叶斯进行文档分类 使用Python进行文本分类 准备数据:从文本中构建词向量 训练算法:从词向量计算概率 测试算法:根据现实情况修改分类器 准备数据:文档词袋模型 示例:使用朴素贝叶斯过滤垃圾邮件 准备数据:切分文本 测试算法:使用朴素贝叶斯进行交叉验证 示例:使用朴素贝叶斯分类器从个人广告中获取区域倾向 收集数据:导入RSS源 分析数据:显示地域相关的用词 本章小结 第5章 Logistic回归 基于Logistic回归和Sigmoid函数的分类 基于最优化方法的最佳回归系数确定 梯度上升法 训练算法:使用梯度上升找到最佳参数 分析数据:画出决策边界 训练算法:随机梯度上升 示例:从疝气病症预测病马的死亡率 准备数据:处理数据中的缺失值 测试算法:用Logistic回归进行分类 本章小结 第6章 支持向量机 基于最大间隔分隔数据 寻找最大间隔 分类器求解的优化问题 SVM应用的一般框架 SMO高效优化算法 Platt的SMO算法 应用简化版SMO算法处理小规模数据集 利用完整Platt SMO算法加速优化 在复杂数据上应用核函数 利用核函数将数据映射到高维空间 径向基核函数 在测试中使用核函数 示例:手写识别问题回顾 本章小结 第7章 利用AdaBoost元算法提高分类性能 基于数据集多重抽样的分类器 bagging:基于数据随机重抽样的分类器构建方法 boosting 训练算法:基于错误提升分类器的性能 基于单层决策树构建弱分类器 完整AdaBoost算法的实现 测试算法:基于AdaBoost的分类 示例:在一个难数据集上应用AdaBoost 非均衡分类问题 其他分类性能度量指标:正确率、召回率及ROC曲线 基于代价函数的分类器决策控制 处理非均衡问题的数据抽样方法 本章小结 第二部分 利用回归预测数值型数据第8章 预测数值型数据:回归 用线性回归找到最佳拟合直线 局部加权线性回归 示例:预测鲍鱼的年龄 缩减系数来“理解”数据 岭回归 lasso 前向逐步回归 权衡偏差与方差 示例:预测乐高玩具套装的价格 收集数据:使用Google购物的API 训练算法:建立模型 本章小结 第9章 树回归 复杂数据的局部性建模 连续和离散型特征的树的构建 将CART算法用于回归 构建树 运行代码 树剪枝 预剪枝 后剪枝 模型树 示例:树回归与标准回归的比较 使用Python的Tkinter库创建GUI 用Tkinter创建GUI 集成Matplotlib和Tkinter 本章小结 第三部分 无监督学习第10章 利用K-均值聚类算法对未标注数据分组 K-均值聚类算法 使用后处理来提高聚类性能 二分K-均值算法 示例:对地图上的点进行聚类 Yahoo! PlaceFinder API 对地理坐标进行聚类 本章小结 第11章 使用Apriori算法进行关联分析 关联分析 Apriori原理 使用Apriori算法来发现频繁集 生成候选项集 组织完整的Apriori算法 从频繁项集中挖掘关联规则 示例:发现国会投票中的模式 收集数据:构建美国国会投票记录的事务数据集 测试算法:基于美国国会投票记录挖掘关联规则 示例:发现毒蘑菇的相似特征 本章小结 第12章 使用FP-growth算法来高效发现频繁项集 FP树:用于编码数据集的有效方式 构建FP树 创建FP树的数据结构 构建FP树 从一棵FP树中挖掘频繁项集 抽取条件模式基 创建条件FP树 示例:在Twitter源中发现一些共现词 示例:从新闻网站点击流中挖掘 本章小结 第四部分 其他工具第13章 利用PCA来简化数据 降维技术 PCA 移动坐标轴 在NumPy中实现PCA 示例:利用PCA对半导体制造数据降维 本章小结 第14章 利用SVD简化数据 SVD的应用 隐性语义索引 推荐系统 矩阵分解 利用Python实现SVD 基于协同过滤的推荐引擎 相似度计算 基于物品的相似度还是基于用户的相似度? 推荐引擎的评价 示例:餐馆菜肴推荐引擎 推荐未尝过的菜肴 利用SVD提高推荐的效果 构建推荐引擎面临的挑战 基于SVD的图像压缩 本章小结 第15章 大数据与MapReduce MapReduce:分布式计算的框架 Hadoop流 分布式计算均值和方差的mapper 分布式计算均值和方差的reducer 在Amazon网络服务上运行Hadoop程序 AWS上的可用服务 开启Amazon网络服务之旅 在EMR上运行Hadoop作业 MapReduce上的机器学习 在Python中使用mrjob来自动化MapReduce mrjob与EMR的无缝集成 mrjob的一个MapReduce脚本剖析 示例:分布式SVM的Pegasos算法 Pegasos算法 训练算法:用mrjob实现MapReduce版本的SVM 你真的需要MapReduce吗? 本章小结 附录A Python入门 附录B 线性代数 附录C 概率论复习 附录D 资源 索引 版权声明
查看全部↓
标签:
进入了发展快车道 冷链行业市场规模正在快速膨胀
2022-03-21
行业正站在风口 数字化时代在为传统的自行车产业赋能
2022-03-21
以做强实体经济支撑为重点 成都单个项目年度计划投资同比提升
2022-03-21
拥有多个国际赛事的直播版权 广州游戏电竞企业业绩向好
2022-03-21
投诉量激增 直播带货存在这么多问题的主要原因是什么?
2022-03-21
工作专班深入到各企业 春寒料峭挡不住松原市施工热情
2022-03-21
引导企业向提供“产品+服务”转变 湖南加快智能农机服务化转型
2022-03-21
创新平台建设和科技成果转化 德州加大力度重奖创新
2022-03-21
潜在风险进一步放大 商品房现房销售已是大势所趋
2022-03-21
有序复工复产 1—2月份工业经济发展新动能持续增强
2022-03-21
行业正站在风口 数字化时代在为传统的自行车产业赋能
以做强实体经济支撑为重点 成都单个项目年度计划投资同比提升
拥有多个国际赛事的直播版权 广州游戏电竞企业业绩向好
投诉量激增 直播带货存在这么多问题的主要原因是什么?
工作专班深入到各企业 春寒料峭挡不住松原市施工热情
引导企业向提供“产品+服务”转变 湖南加快智能农机服务化转型
创新平台建设和科技成果转化 德州加大力度重奖创新
潜在风险进一步放大 商品房现房销售已是大势所趋
有序复工复产 1—2月份工业经济发展新动能持续增强
多层次高频调度 1至2月河北省工业运行先行指标稳中有增
以车路协同为基础 智能交通推动城市交通绿色高质量发展
人才短板成为制约产业链高质量发展的关键节点
通过技术手段整合调配供给资源 家政行业不断提质扩容
强化产业链深层次合作 加强重大装备国产化“一条龙”模式构建
如何进一步提升纳税人缴费人的减税降费获得感?
探索建设大数据及网络安全示范试点城市有哪些积极意义?
对制造业中小微企业实施缓缴税费政策有哪些积极意义?
进一步增强自我保护意识 消费者需注意辨别谨慎消费
将“走出去”变“请进来” 西安贸易产业转移承接作用不断得到增强
厦门应如何融入“数字中国”的重大战略发展大局?
江苏省如何不断满足老人日益增长的养老服务需求?
建设一体化的职业健康信息管理平台 天津职业人群保障加强
潜力持续释放 1—2月乡村消费品市场恢复略好于城镇
直接对接社会化服务 楼宇调解室将整体提升青岛劳动争议水平
成功化解纠纷11.47万件 银保监会服务质量日趋提高
春雷响百虫出 惊蛰文化在其他方面有了进一步发展
青绿山水画在古代山水画发展史上有着怎样的影响与地位?
开播即爆款 “文化类节目收视率低”这一固有印象被推翻
涵盖了109件真迹作品 凯斯·哈林展览将持续至6月13日
- 带有一点自信的自嘲 “隔路”是另一种味道的“凡尔赛”
- 与文渊阁前后呼应 “何以中国”特展隆重致敬文化大成
- 严重者可造成暂时性失明 享受冰雪运动要注意眼睛的健康防护
- 种类繁多让人眼花缭乱 选购牛奶时需要重点关注什么?
- 网课让孩子感到不安焦虑怎么办?八问八答回应广大家长关切
- 循环系统很容易受到刺激 “倒春寒”期间老人该如何做?
- 青少年患者睡眠问题日趋增加 9条建议为孩子助眠
- 我国肥胖人群正逐年递增 不良饮食习惯是重要诱因
- 如何减少噪声对听力的损伤?这份耳部和听力保健小贴士请收好
- 强化住房限购措施 西安限购限售范围进一步扩大
- 多种方式增加供给 进一步降低新市民和青年人的居住成本
- 预计9月下旬海口可实现安居房申请网上办理
- 政策调控力度持续升级 8月百城二手房市场均价止涨转跌
- 8月中国新房找房热度依然保持平稳 环比微涨0.2%
- 进一步加强商品房销售价格备案管理 今年全国楼市调控刷新历史纪录
- 西安第二批集中供地中28宗为现场拍卖方式出让
- 细分化需求得到释放 房屋居住的属性越发凸显
- 佛山顺德龙江近日挂牌商住地起拍价约19.88亿元
- 青岛市4宗地竞品质抽签结果出炉 地溢价均约15%
- 坚持政策支持、多方参与 浙江版保障性租赁住房明确新增比例目标
- 简化审批流程 武汉将实现房源申请配租全程网上办
- 哈尔滨新增本土确诊病例3例 活动轨迹公布
- 哈尔滨市公布3例新增本土新冠肺炎确诊病例活动轨迹
- 山东深耕文化资源 推动旅游业高质量发展
- 今年新增952件(套)!南京大屠杀再添新证
- 四川非遗传承人张雄志:巧手捏面塑 指尖传非遗
- 10月以来我国寒潮为何如此频繁?中国气象局回应
- 56位残疾人士登上黄山 互利互勉共建生活希望
- 安徽潜山两车相撞 已致8人死亡3人受伤
- 上海洋山海关首次在出口货运渠道查获夹带卷烟
- 山西忻州古城:一城风华延续千年历史文脉
- 呼伦贝尔新巴尔虎右旗公布1例无症状感染者行动轨迹
- 新增“53+1” 内蒙古累计本土确诊病例增至185例
- 昆明公安打击破坏生物多样性犯罪 抓获130名涉案嫌疑人
- 山西朔州“11·11”较大透水事故调查报告发布 对38人问责处理
- “海关国门小卫士”竞争上岗 淘汰率接近一半
- 深圳摧毁特大品牌化妆品走私网
- 28人被问责!山西石港煤业“3·25”事故调查报告公布
- 湖南韶山以河长制带动全民治水 让每一处水面“长治久清”
- 上海市奉贤区人大常委会原党组书记袁晓林被“双开”
- 民进会员谈反映社情民意信息工作:心怀大我 敢讲实情
- 80岁“留守”奶奶短视频诉孤独 千万网友心疼:我们陪您唠嗑
- 40年来为子弟兵送出1.3万余双布鞋和鞋垫的“布鞋奶奶”走了
- 当男幼师是什么体验?他们说:有委屈尴尬 但大部分是幸福
- 庐阳警方通报幼童坠亡事件:嫌疑人已被刑拘
- 内蒙古新增本土确诊病例53例、本土无症状感染者1例
- 哈尔滨市启动部分地区第一轮全员核酸检测
- 四川通江发生两车相撞事故 致3人死亡
- 11月谣言在“身边”,别信这些无稽之谈
- 追剧为何上瘾?你追的不是剧,而是及时满足的快感