Python预测分析实战 = Hands-on predictive analytics with Python 🔍
(美)阿尔瓦罗·富恩特斯(Alvaro Fuentes)著
人民邮电出版社, Di 1 ban, Beijing, 2022
英语 [en] · 中文 [zh] · PDF · 12.8MB · 2022 · 📘 非小说类图书 · 🚀/lgli/lgrs · Save
描述
Step-by-step Guide To Build High Performing Predictive Applications Key Features Use The Python Data Analytics Ecosystem To Implement End-to-end Predictive Analytics Projects Explore Advanced Predictive Modeling Algorithms With An Emphasis On Theory With Intuitive Explanations Learn To Deploy A Predictive Model's Results As An Interactive Application Book Description Predictive Analytics Is An Applied Field That Employs A Variety Of Quantitative Methods Using Data To Make Predictions. It Involves Much More Than Just Throwing Data Onto A Computer To Build A Model. This Book Provides Practical Coverage To Help You Understand The Most Important Concepts Of Predictive Analytics. Using Practical, Step-by-step Examples, We Build Predictive Analytics Solutions While Using Cutting-edge Python Tools And Packages. The Book's Step-by-step Approach Starts By Defining The Problem And Moves On To Identifying Relevant Data. We Will Also Be Performing Data Preparation, Exploring And Visualizing Relationships, Building Models, Tuning, Evaluating, And Deploying Model. Each Stage Has Relevant Practical Examples And Efficient Python Code. You Will Work With Models Such As Knn, Random Forests, And Neural Networks Using The Most Important Libraries In Python's Data Science Stack: Numpy, Pandas, Matplotlib, Seaborn, Keras, Dash, And So On. In Addition To Hands-on Code Examples, You Will Find Intuitive Explanations Of The Inner Workings Of The Main Techniques And Algorithms Used In Predictive Analytics. By The End Of This Book, You Will Be All Set To Build High-performance Predictive Analytics Solutions Using Python Programming. What You Will Learn Get To Grips With The Main Concepts And Principles Of Predictive Analytics Learn About The Stages Involved In Producing Complete Predictive Analytics Solutions Understand How To Define A Problem, Propose A Solution, And Prepare A Dataset Use Visualizations To Explore Relationships And Gain Insights Into The Dataset Learn To Build Regression And Classification Models Using Scikit-learn Use Keras To Build Powerful Neural Network Models That Produce Accurate Predictions Learn To Serve A Model's Predictions As A Web Application Who This Book Is For This Book Is For Data Analysts, Data Scientists, Data Engineers, And Python Developers Who Want To Learn About Predictive Modeling And Would Like To Implement Predictive Analytics Solutions Using Python's Data Stack. People From Other Backgrounds Who Would Like To Enter This Exciting Field Will Greatly Benefit From Reading This Book. All You Need Is To Be Proficient In Python Programming And Have A Basic Understanding Of Statistics And College-level Algebra.
备用文件名
lgrsnf/9787115565709_111285.pdf
备选标题
Hands-On Predictive Analytics with Python : Master the Complete Predictive Analytics Process, From Problem Definition to Model Deployment
备选作者
富恩特斯 (Fuentes, Alvaro)
备用出版商
The People's Posts and Telecommunications Publishing House
备用出版商
Packt Publishing, Limited
备用版本
United Kingdom and Ireland, United Kingdom
备用版本
Packt Publishing, Birmingham, UK, 2018
备用版本
China, People's Republic, China
备用版本
Birmingham, UK ; Mumbai, 2018
备用版本
1st edition, 2018
备用描述
扉页
内容提要
前言
审阅者简介
译者简介
作者简介
目录
第 1 章 预测分析过程
1.1技术要求
1.2什么是预测分析
1.3回顾预测分析的重要概念
1.4预测分析过程
1.4.1理解问题和定义问题
1.4.2收集数据和准备数据
1.4.3使用EDA挖掘数据信息
1.4.4构建模型
1.4.5评价模型
1.4.6沟通以及/或者部署
1.4.7 CRISP-DM和其他方法
1.5 Python数据科学栈概述
1.5.1 Anaconda
1.5.2 Jupyter Notebook
1.5.3 NumPy
1.5.4 SciPy
1.5.5 pandas
1.5.6 Matplotlib
1.5.7 Seaborn
1.5.8 scikit-learn
1.5.9 TensorFlow和Keras
1.5.10 Dash
1.6小结
扩展阅读
第 2 章 理解问题和准备数据
2.1技术要求
2.2理解业务问题并提出解决方案
2.2.1背景决定一切
2.2.2定义预测内容
2.2.3明确项目需要的数据
2.2.4考虑数据访问
2.2.5提出解决方案
2.3实践项目——钻石的价格
2.3.1钻石的价格—理解问题和定义问题
2.3.2更多背景知识
2.3.3钻石的价格—提出解决方案
2.3.4钻石的价格—收集数据和准备数据
2.4实践项目——信用卡违约
2.4.1信用卡违约—理解问题和定义问题
2.4.2信用卡违约—提出解决方案
2.4.3信用卡违约—收集数据和准备数据
2.5小结
扩展阅读
第 3 章 理解数据集——探索性数据分析
3.1技术要求
3.2什么是EDA
3.3一元EDA
3.3.1数值特征的一元EDA
3.3.2分类特征的一元EDA
3.4二元EDA
3.4.1两个数值特征
3.4.2两个分类特征
3.4.3一个数值特征和一个分类特征
3.5图形化的多元EDA
3.6小结
扩展阅读
第 4 章 基于机器学习的数值预测
4.1技术要求
4.2机器学习简介
4.2.1监督学习中的任务
4.2.2创建第一个机器学习模型
4.2.3机器学习的目标—泛化
4.2.4过拟合
4.2.5评价函数和最优化
4.3建模之前的实际考虑
4.3.1 scikit-learn简介
4.3.2进一步的特征变换
4.4多元线性回归
4.5 LASSO回归
4.6kNN
4.7训练与测试误差
4.8小结
扩展阅读
第 5 章 基于机器学习的分类预测
5.1技术要求
5.2分类任务
5.3信用卡违约数据集
5.4逻辑回归
5.4.1一个简单的逻辑回归模型
5.4.2完整的逻辑回归模型
5.5分类树
5.5.1分类树的工作原理
5.5.2分类树的优点和缺点
5.5.3训练更大的分类树
5.6随机森林
5.7训练误差对测试误差
5.8多元分类
5.9朴素贝叶斯分类器
5.9.1条件概率
5.9.2贝叶斯定理
5.9.3回到分类问题
5.9.4高斯朴素贝叶斯
5.10小结
扩展阅读
第6章 面向预测分析的神经网络简介
6.1技术要求
6.2引入神经网络模型
6.2.1深度学习
6.2.2 MLP的结构—神经网络模型的组成部分
6.2.3 MLP的学习原理
6.3 TensorFlow和Keras简介
6.3.1 TensorFlow
6.3.2 Keras—以人为本的深度学习
6.4基于神经网络的回归
6.4.1构建预测钻石价格的MLP
6.4.2训练MLP
6.4.3基于神经网络的预测
6.5基于神经网络的分类
6.5.1构建预测信用卡违约的MLP
6.5.2评价预测
6.6训练神经网络模型的“黑暗艺术”
6.6.1决策太多,时间太少
6.6.2神经网络的正则化
6.6.3训练神经网络模型的实用技巧
6.7小结
扩展阅读
第 7 章 模型评价
7.1技术要求
7.2回归模型的评价
7.2.1评价回归模型的指标
7.2.2评价回归模型的可视化方法
7.3评价分类模型
7.3.1混淆矩阵及相关指标
7.3.2评价分类模型的可视化方法
7.4k折交叉验证
7.5小结
扩展阅读
第 8 章 调整模型和提高性能
8.1技术要求
8.2超参数调整
8.2.1优化单个超参数
8.2.2优化多个超参数
8.3提高性能
8.3.1改进钻石价格预测
8.3.2是技术问题,更是业务问题
8.4小结
第 9 章 基于 Dash的模型实现
9.1技术要求
9.2模型沟通和/或部署阶段
9.2.1使用技术报告
9.2.2说明现有应用程序的功能
9.2.3分析应用程序
9.3 Dash简介
9.3.1什么是Dash
9.3.2 Plotly
9.3.3安装
9.3.4应用程序布局
9.3.5构建基本的静态App
9.3.6构建基本的交互式App
9.4将预测模型实现为网络应用程序
9.4.1生成预测模型对象
9.4.2构建网络应用程序
9.5小结
扩展阅读
内容提要
前言
审阅者简介
译者简介
作者简介
目录
第 1 章 预测分析过程
1.1技术要求
1.2什么是预测分析
1.3回顾预测分析的重要概念
1.4预测分析过程
1.4.1理解问题和定义问题
1.4.2收集数据和准备数据
1.4.3使用EDA挖掘数据信息
1.4.4构建模型
1.4.5评价模型
1.4.6沟通以及/或者部署
1.4.7 CRISP-DM和其他方法
1.5 Python数据科学栈概述
1.5.1 Anaconda
1.5.2 Jupyter Notebook
1.5.3 NumPy
1.5.4 SciPy
1.5.5 pandas
1.5.6 Matplotlib
1.5.7 Seaborn
1.5.8 scikit-learn
1.5.9 TensorFlow和Keras
1.5.10 Dash
1.6小结
扩展阅读
第 2 章 理解问题和准备数据
2.1技术要求
2.2理解业务问题并提出解决方案
2.2.1背景决定一切
2.2.2定义预测内容
2.2.3明确项目需要的数据
2.2.4考虑数据访问
2.2.5提出解决方案
2.3实践项目——钻石的价格
2.3.1钻石的价格—理解问题和定义问题
2.3.2更多背景知识
2.3.3钻石的价格—提出解决方案
2.3.4钻石的价格—收集数据和准备数据
2.4实践项目——信用卡违约
2.4.1信用卡违约—理解问题和定义问题
2.4.2信用卡违约—提出解决方案
2.4.3信用卡违约—收集数据和准备数据
2.5小结
扩展阅读
第 3 章 理解数据集——探索性数据分析
3.1技术要求
3.2什么是EDA
3.3一元EDA
3.3.1数值特征的一元EDA
3.3.2分类特征的一元EDA
3.4二元EDA
3.4.1两个数值特征
3.4.2两个分类特征
3.4.3一个数值特征和一个分类特征
3.5图形化的多元EDA
3.6小结
扩展阅读
第 4 章 基于机器学习的数值预测
4.1技术要求
4.2机器学习简介
4.2.1监督学习中的任务
4.2.2创建第一个机器学习模型
4.2.3机器学习的目标—泛化
4.2.4过拟合
4.2.5评价函数和最优化
4.3建模之前的实际考虑
4.3.1 scikit-learn简介
4.3.2进一步的特征变换
4.4多元线性回归
4.5 LASSO回归
4.6kNN
4.7训练与测试误差
4.8小结
扩展阅读
第 5 章 基于机器学习的分类预测
5.1技术要求
5.2分类任务
5.3信用卡违约数据集
5.4逻辑回归
5.4.1一个简单的逻辑回归模型
5.4.2完整的逻辑回归模型
5.5分类树
5.5.1分类树的工作原理
5.5.2分类树的优点和缺点
5.5.3训练更大的分类树
5.6随机森林
5.7训练误差对测试误差
5.8多元分类
5.9朴素贝叶斯分类器
5.9.1条件概率
5.9.2贝叶斯定理
5.9.3回到分类问题
5.9.4高斯朴素贝叶斯
5.10小结
扩展阅读
第6章 面向预测分析的神经网络简介
6.1技术要求
6.2引入神经网络模型
6.2.1深度学习
6.2.2 MLP的结构—神经网络模型的组成部分
6.2.3 MLP的学习原理
6.3 TensorFlow和Keras简介
6.3.1 TensorFlow
6.3.2 Keras—以人为本的深度学习
6.4基于神经网络的回归
6.4.1构建预测钻石价格的MLP
6.4.2训练MLP
6.4.3基于神经网络的预测
6.5基于神经网络的分类
6.5.1构建预测信用卡违约的MLP
6.5.2评价预测
6.6训练神经网络模型的“黑暗艺术”
6.6.1决策太多,时间太少
6.6.2神经网络的正则化
6.6.3训练神经网络模型的实用技巧
6.7小结
扩展阅读
第 7 章 模型评价
7.1技术要求
7.2回归模型的评价
7.2.1评价回归模型的指标
7.2.2评价回归模型的可视化方法
7.3评价分类模型
7.3.1混淆矩阵及相关指标
7.3.2评价分类模型的可视化方法
7.4k折交叉验证
7.5小结
扩展阅读
第 8 章 调整模型和提高性能
8.1技术要求
8.2超参数调整
8.2.1优化单个超参数
8.2.2优化多个超参数
8.3提高性能
8.3.1改进钻石价格预测
8.3.2是技术问题,更是业务问题
8.4小结
第 9 章 基于 Dash的模型实现
9.1技术要求
9.2模型沟通和/或部署阶段
9.2.1使用技术报告
9.2.2说明现有应用程序的功能
9.2.3分析应用程序
9.3 Dash简介
9.3.1什么是Dash
9.3.2 Plotly
9.3.3安装
9.3.4应用程序布局
9.3.5构建基本的静态App
9.3.6构建基本的交互式App
9.4将预测模型实现为网络应用程序
9.4.1生成预测模型对象
9.4.2构建网络应用程序
9.5小结
扩展阅读
备用描述
This book will teach you all the processes you need to build a predictive analytics solution: understanding the problem, preparing datasets, exploring relationships, model building, tuning, evaluation, and deployment. You'll earn to use Python and its data analytics ecosystem to implement the main techniques used in real-world projects.
备用描述
本书先介绍预测分析的重要概念和原则,然后给出一系列的代码示例和算法讲解,引导读者了解完整的预测分析流程,进而能用Python工具构建高性能的预测分析解决方案.全书所涵盖的内容包括预测分析过程,理解问题和准备数据,理解数据集----探索性数据分析,基于机器学习的数值预测,基于机器学习的类别预测,调整模型和提高性能,基于Dash的模型实现等
开源日期
2024-06-20
We strongly recommend that you support the author by buying or donating on their personal website, or borrowing in your local library.
🚀 快速下载
成为会员以支持书籍、论文等的长期保存。为了感谢您对我们的支持,您将获得高速下载权益。❤️
如果您在本月捐款,您将获得双倍的快速下载次数。
🐢 低速下载
由可信的合作方提供。 更多信息请参见常见问题解答。 (可能需要验证浏览器——无限次下载!)
- 低速服务器(合作方提供) #1 (稍快但需要排队)
- 低速服务器(合作方提供) #2 (稍快但需要排队)
- 低速服务器(合作方提供) #3 (稍快但需要排队)
- 低速服务器(合作方提供) #4 (稍快但需要排队)
- 低速服务器(合作方提供) #5 (无需排队,但可能非常慢)
- 低速服务器(合作方提供) #6 (无需排队,但可能非常慢)
- 低速服务器(合作方提供) #7 (无需排队,但可能非常慢)
- 低速服务器(合作方提供) #8 (无需排队,但可能非常慢)
- 低速服务器(合作方提供) #9 (无需排队,但可能非常慢)
- 下载后: 在我们的查看器中打开
所有选项下载的文件都相同,应该可以安全使用。即使这样,从互联网下载文件时始终要小心。例如,确保您的设备更新及时。
外部下载
-
对于大文件,我们建议使用下载管理器以防止中断。
推荐的下载管理器:JDownloader -
您将需要一个电子书或 PDF 阅读器来打开文件,具体取决于文件格式。
推荐的电子书阅读器:Anna的档案在线查看器、ReadEra和Calibre -
使用在线工具进行格式转换。
推荐的转换工具:CloudConvert和PrintFriendly -
您可以将 PDF 和 EPUB 文件发送到您的 Kindle 或 Kobo 电子阅读器。
推荐的工具:亚马逊的“发送到 Kindle”和djazz 的“发送到 Kobo/Kindle” -
支持作者和图书馆
✍️ 如果您喜欢这个并且能够负担得起,请考虑购买原版,或直接支持作者。
📚 如果您当地的图书馆有这本书,请考虑在那里免费借阅。
下面的文字仅以英文继续。
总下载量:
“文件的MD5”是根据文件内容计算出的哈希值,并且基于该内容具有相当的唯一性。我们这里索引的所有影子图书馆都主要使用MD5来标识文件。
一个文件可能会出现在多个影子图书馆中。有关我们编译的各种数据集的信息,请参见数据集页面。
有关此文件的详细信息,请查看其JSON 文件。 Live/debug JSON version. Live/debug page.