Python 3爬虫、数据清洗与可视化实战 电子书 下载 txt pdf mobi

Python 3爬虫、数据清洗与可视化实战电子书下载地址
内容简介:
《Python 3爬虫、数据清洗与可视化实战》是一本通过实战教初学者学习采集数据、清洗和组织数据进行分析及可视化的Python 读物。《Python 3爬虫、数据清洗与可视化实战》案例均经过实战检验,笔者在实践过程中深感采集数据、清洗和组织数据的重要性,作为一名数据行业的“码农”,数据就是沃土,没有数据,我们将无田可耕。
《Python 3爬虫、数据清洗与可视化实战》共分11 章,6 个核心主题:其一是Python 基础入门,包括环境配置、基本操作、数据类型、语句和函数;其二是Python 爬虫的构建,包括网页结构解析、爬虫流程设计、代码优化、效率优化、容错处理、反防爬虫、表单交互和模拟页面点击;其三是Python 数据库应用,包括MongoDB、MySQL 在Python中的连接与应用;其四是数据清洗和组织,包括NumPy 数组知识、pandas 数据的读写、分组变形、缺失值异常值处理、时序数据处理和正则表达式的使用;其五是综合应用案例,帮助读者贯穿爬虫、数据清洗与组织的过程;最后是数据可视化,包括Matplotlib 和Pyecharts 两个库的使用,涉及饼图、柱形图、线图、
词云图、地图等图形,帮助读者进入可视化的殿堂。
《Python 3爬虫、数据清洗与可视化实战》以实战为主,适合Python 初学者及高等院校的相关专业学生,也适合Python 培训机构作为实验教材使用。
书籍目录:
第1 章 Python 基础 1
1.1 安装Python 环境 1
1.1.1 Python 3.6.2 安装与配置 1
1.1.2 使用IDE 工具——PyCharm 4
1.1.3 使用IDE 工具——Anaconda 4
1.2 Python 操作入门 6
1.2.1 编写第一个Python 代码 6
1.2.2 Python 基本操作 9
1.2.3 变量 10
1.3 Python 数据类型 10
1.3.1 数字 10
1.3.2 字符串 11
1.3.3 列表 13
1.3.4 元组 14
1.3.5 集合 15
1.3.6 字典 15
1.4 Python 语句与函数 16
1.4.1 条件语句 16
1.4.2 循环语句 16
1.4.3 函数 17
第2 章 写一个简单的爬虫 18
2.1 关于爬虫的合法性 18
2.2 了解网页 20
2.2.1 认识网页结构 21
2.2.2 写一个简单的HTML 21
2.3 使用requests 库请求网站 23
2.3.1 安装requests 库 23
2.3.2 爬虫的基本原理 25
2.3.3 使用GET 方式抓取数据 26
2.3.4 使用POST 方式抓取数据 27
2.4 使用Beautiful Soup 解析网页 30
2.5 清洗和组织数据 34
2.6 爬虫攻防战 35
第3 章 用API 爬取天气预报数据 38
3.1 注册免费API 和阅读技术文档 38
3.2 获取API 数据 40
3.3 存储数据到MongoDB 45
3.3.1 下载并安装MongoDB 45
3.3.2 在PyCharm 中安装Mongo Plugin 46
3.3.3 将数据存入MongoDB 49
3.4 MongoDB 数据库查询 52
第4 章 大型爬虫案例:抓取某电商网站的商品数据 55
4.1 观察页面特征和解析数据 55
4.2 工作流程分析 64
4.3 构建类目树 65
4.4 获取产品列表 68
4.5 代码优化 70
4.6 爬虫效率优化 74
4.7 容错处理 77
第5 章 Scrapy 爬虫 78
5.1 Scrapy 简介 78
5.2 Scrapy 安装 79
5.3 案例:用Scrapy 抓取股票行情 80
第6 章 Selenium爬虫 88
6.1 Selenium 简介 88
6.2 案例:用Selenium 抓取电商网站数据 90
第7 章 数据库连接和查询 100
7.1 使用PyMySQL 100
7.1.1 连接数据库 100
7.1.2 案例:某电商网站女装行业TOP100 销量数据 102
7.2 使用SQLAlchemy 104
7.2.1 SQLAlchemy 基本介绍 104
7.2.2 SQLAlchemy 基本语法 105
7.3 MongoDB 107
7.3.1 MongoDB 基本语法 107
7.3.2 案例:在某电商网站搜索“连衣裙”的商品数据 107
第8 章 NumPy 109
8.1 NumPy 简介 109
8.2 一维数组 110
8.2.1 数组与列表的异同 110
8.2.2 数组的创建 111
8.3 多维数组 111
8.3.1 多维数组的高效性能 112
8.3.2 多维数组的索引与切片 113
8.3.3 多维数组的属性 113
8.4 数组的运算 115
第9 章 pandas 数据清洗 117
9.1 数据读写、选择、整理和描述 117
9.1.1 从CSV 中读取数据 119
9.1.2 向CSV 写入数据 120
9.1.3 数据选择 120
9.1.4 数据整理 122
9.1.5 数据描述 123
9.2 数据分组、分割、合并和变形 124
9.2.1 数据分组 124
9.2.2 数据分割 127
9.2.3 数据合并 128
9.2.4 数据变形 134
9.2.5 案例:旅游数据的分析与变形 136
9.3 缺失值、异常值和重复值处理 140
9.3.1 缺失值处理 140
9.3.2 检测和过滤异常值 144
9.3.3 移除重复数据 147
9.3.4 案例:旅游数据的值检查与处理 149
9.4 时序数据处理 152
9.4.1 日期/时间数据转换 152
9.4.2 时序数据基础操作 153
9.4.3 案例:天气数据分析与处理 155
9.5 数据类型转换 158
9.6 正则表达式 160
9.6.1 元字符与限定符 161
9.6.2 案例:用正则表达式提取网页文本信息 162
第10 章 综合应用实例 164
10.1 按性价比给用户推荐旅游产品 164
10.1.1 数据采集 165
10.1.2 数据清洗、建模 169
10.2 通过热力图分析为用户提供出行建议 172
10.2.1 某旅游网站热门景点爬虫代码(qunaer_sights.py) 175
10.2.2 提取CSV 文件中经纬度和销量信息 178
10.2.3 创建景点门票销量热力地图HTML 文件 179
第11 章 数据可视化 182
11.1 matplotlib 183
11.1.1 画出各省份平均价格、各省份平均成交量柱状图 183
11.1.2 画出各省份平均成交量折线图、柱状图、箱形图和饼图 184
11.1.3 画出价格与成交量的散点图 185
11.2 pyecharts 186
11.2.1 Echarts 简介 186
11.2.2 pyecharts 简介 187
11.2.3 初识pyecharts,玫瑰相送 187
11.2.4 pyecharts 基本语法 188
11.2.5 基于商业分析的pyecharts 图表绘制 190
11.2.6 使用pyecharts 绘制其他图表 199
11.2.7 pyecharts 和Jupyter 203
作者介绍:
零一
沐垚科技创始人,电商自媒体,资深数据分析师,8年电商从业经验,擅长Excel、Power BI、R、Python等工具,主要研究数据化运营、商业智能和人工智能在电商领域的应用,专注数据+电商的新零售服务。 出版《电商数据分析淘宝实战》《美丽的电商运营日记》《Excel BI 之道:从零开始学Power工具应用》《淘宝、天猫电商数据分析与挖掘实战》 联系方式:公众号:start_data 个人号:haicheng1008 邮箱:lingyi@muyaotech.com
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
书籍介绍
《Python 3爬虫、数据清洗与可视化实战》是一本通过实战教初学者学习采集数据、清洗和组织数据进行分析及可视化的Python 读物。《Python 3爬虫、数据清洗与可视化实战》案例均经过实战检验,笔者在实践过程中深感采集数据、清洗和组织数据的重要性,作为一名数据行业的“码农”,数据就是沃土,没有数据,我们将无田可耕。
《Python 3爬虫、数据清洗与可视化实战》共分11 章,6 个核心主题:其一是Python 基础入门,包括环境配置、基本操作、数据类型、语句和函数;其二是Python 爬虫的构建,包括网页结构解析、爬虫流程设计、代码优化、效率优化、容错处理、反防爬虫、表单交互和模拟页面点击;其三是Python 数据库应用,包括MongoDB、MySQL 在Python中的连接与应用;其四是数据清洗和组织,包括NumPy 数组知识、pandas 数据的读写、分组变形、缺失值异常值处理、时序数据处理和正则表达式的使用;其五是综合应用案例,帮助读者贯穿爬虫、数据清洗与组织的过程;最后是数据可视化,包括Matplotlib 和Pyecharts 两个库的使用,涉及饼图、柱形图、线图、
词云图、地图等图形,帮助读者进入可视化的殿堂。
《Python 3爬虫、数据清洗与可视化实战》以实战为主,适合Python 初学者及高等院校的相关专业学生,也适合Python 培训机构作为实验教材使用。
精彩短评:
-
作者: RoveSoul 发布时间:2020-02-27 01:41:31
方方面面都涉及了一点,但都不那么深入,知道两个东西,ip代理,之前我只知道请求头。
-
作者: 昊天 发布时间:2019-10-27 13:19:23
这本书没有太多参考价值!
-
作者: LZzOo 发布时间:2020-08-11 14:27:02
内容涵盖比较全面,但都是入门,深入应用不多。
-
作者: 方小同 发布时间:2018-11-16 15:25:43
作者示例bug太多,没有事后debug就出版也是醉了
-
作者: oneWalker_Kun 发布时间:2021-01-05 16:00:11
书的目录还好,内容比较杂而且排版规律很差。
样例bug满书飞,一天看完知道些爬虫工具,但是我觉得这本书仍然停留在博客水平(还是质量很一般的),不建议购买。
深度书评:
-
不是很好
作者:你不走我真走了 发布时间:2018-07-31 11:48:09
-
Python高级爬虫实战-加密、破解、JS逆向、海量数据存储等
作者:手动添加 发布时间:2021-10-18 14:06:55
Python高级爬虫实战-加密、破解、JS逆向、海量数据存储等
网盘地址:
https://pan.baidu.com/s/15fCdHT9TLZ2DYLgXb7wCZg
提取码: jqa2
备用地址(腾讯微云):
https://share.weiyun.com/Q8484CDs
密码:69vnzi
课程——Python高级爬虫实战-加密、破解、JS逆向、海量数据存储等,完整版11章,2021年10月完结!
对爬虫工程师来说,突破反爬是一项重要但并不容易掌握的工作能力,因为反爬涉及的技术领域广泛,知识庞杂,网上也缺乏体系教程。不过别担心,本课中,爬虫技术专家带你深度了解Web端反爬策略,并教你用多手段、多方法破解反爬技术,向高级爬虫工程师晋级,挑战高薪。
网站评分
-
书籍多样性:5分
-
书籍信息完全性:8分
-
网站更新速度:3分
-
使用便利性:3分
-
书籍清晰度:7分
-
书籍格式兼容性:7分
-
是否包含广告:5分
-
加载速度:6分
-
安全性:6分
-
稳定性:8分
-
搜索功能:9分
-
下载便捷性:5分
下载点评
- 书籍完整(473+)
- 收费(670+)
- 体验好(309+)
- 五星好评(460+)
- 赚了(605+)
- 实惠(533+)
- 图书多(376+)
- 体验满分(494+)
下载评价
-
网友 隗***杉:
( 2024-12-06 15:51:20 )
挺好的,还好看!支持!快下载吧!
-
网友 融***华:
( 2024-12-05 02:21:39 )
下载速度还可以
-
网友 宫***凡:
( 2024-12-17 19:06:42 )
一般般,只能说收费的比免费的强不少。
-
网友 戈***玉:
( 2024-12-17 12:03:38 )
特别棒
-
网友 家***丝:
( 2024-12-17 08:44:26 )
好6666666
-
网友 温***欣:
( 2024-12-14 03:20:41 )
可以可以可以
-
网友 寇***音:
( 2024-12-14 05:18:54 )
好,真的挺使用的!
-
网友 后***之:
( 2024-12-12 23:32:09 )
强烈推荐!无论下载速度还是书籍内容都没话说 真的很良心!
-
网友 印***文:
( 2024-12-07 08:13:58 )
我很喜欢这种风格样式。
-
网友 郗***兰:
( 2024-11-26 18:20:11 )
网站体验不错
-
网友 利***巧:
( 2024-11-30 00:04:15 )
差评。这个是收费的
-
网友 居***南:
( 2024-12-01 13:19:13 )
请问,能在线转换格式吗?
-
网友 龚***湄:
( 2024-12-02 23:54:49 )
差评,居然要收费!!!
-
网友 敖***菡:
( 2024-11-21 03:54:15 )
是个好网站,很便捷
-
网友 益***琴:
( 2024-12-06 10:22:02 )
好书都要花钱,如果要学习,建议买实体书;如果只是娱乐,看看这个网站,对你来说,是很好的选择。
喜欢"Python 3爬虫、数据清洗与可视化实战"的人也看了
-
MA-7项目:Valode and Pistre Architectes的创新设计与社区影响
-
楹联新话(三种共2册)(精)/传统文化修养丛书 pdf epub mobi txt azw3 2024 电子版 下载
-
实用胶粘技术 李子东 等编著 电子书 下载 txt pdf mobi
-
色彩静物画的艺术魅力:从历史到未来的发展
-
电子商务概论(第二版)(普通高等院校“十三五”规划教材) pdf epub mobi txt azw3 2024 电子版 下载
-
宏章出版·2014最新版中国银行业从业人员资格认证考试辅导教材:个人理财 电子书 下载 txt pdf mobi
-
中国企业集团财务公司的崛起与创新:机遇、挑战及未来展望
-
艺术疗法概论 pdf epub mobi txt azw3 2024 电子版 下载
-
现货台版 抱朴子外篇今注今译 陈飞龙注译 台湾商务 原版书籍 正版包邮 繁体中文 进口书 电子书 下载 txt pdf mobi
-
未来科技如何重塑人类生活:机遇与挑战并存
- 保卫马克思 pdf epub mobi txt azw3 2024 电子版 下载
- 外汇交易圣经 电子书 下载 txt pdf mobi
- 青少年篮球精英梯队成长之路:从选拔到成功的全面解析
- 外滩解码(城市考察发现笔记) pdf epub mobi txt azw3 2024 电子版 下载
- 中国炼焦煤的资源与利用 电子书 下载 txt pdf mobi
- 神秘古宅的秘密:新线索引领的冒险之旅
- 变态心理学 pdf epub mobi txt azw3 2024 电子版 下载
- 全真模拟预测试卷 电子书 下载 txt pdf mobi
- 全面解析:中央音乐学院唢呐考级技巧与艺术表现指南
- 大武士瑞奇 pdf epub mobi txt azw3 2024 电子版 下载
- 乡愁的滋味 东方出版社 pdf epub mobi txt azw3 2024 电子版 下载
- 世界的脉搏:编织世界运河共同命运的人(精)/萧加/责编:谢焕/浙江大学出版社 电子书 下载 txt pdf mobi
- 社区戒毒人员心智化干预:理论基础、策略与实践效果评估
- 杨伟光的央视岁月 pdf epub mobi txt azw3 2024 电子版 下载
- 光村古村 电子书 下载 txt pdf mobi
- 探索无垠宇宙:从大爆炸到人类文明的极简历史
- 胸心外科手术彩色图解 【正版图书】 电子书 下载 txt pdf mobi
- 519页 马克思主义哲学智慧 平装 孙正聿 著 资本论的哲学智慧 西方政治经济学哲学要意 马克思主义基本原理概论 基础理论JSLM 9787514343014 电子书 下载 txt pdf mobi
- 社会工作综合能力(初级)权威押题试卷 全国社会工作者职业水平考试教材研究中心组,漆光鸿 编 电子书 下载 txt pdf mobi
- 金融市场学:全面解析与发展趋势
书籍真实打分
故事情节:5分
人物塑造:6分
主题深度:4分
文字风格:4分
语言运用:6分
文笔流畅:8分
思想传递:5分
知识深度:8分
知识广度:5分
实用性:5分
章节划分:5分
结构布局:7分
新颖与独特:3分
情感共鸣:7分
引人入胜:5分
现实相关:6分
沉浸感:7分
事实准确性:4分
文化贡献:9分