GitHub - shenxiangzhuang/PythonDataAnalysis: The data and code that used in my book.

《Python数据分析入门————从数据获取到可视化》

概览

这里是本书中使用的所有源代码，数据等文件。关于本书的一些最新的进展的也会第一时间在这里公布。希望本书能对大家有所帮助。

问题提交

如果大家有问题和建议，可以直接在本项目提交issue（推荐），也可以发邮件给我(datahonor@gmail.com) 我会定期查看并尽快回复。 (也有读者到出版社提交勘误的，也是可以的，不过只建议在那里提交typo相关的，涉及到代码还是建议在Github提issue，方便一些)。

勘误

已更正：

页码	错误	改正
201	上方第一个阴影框（训练集数据）“种类”列最后两行将“bumpy”全改为“orange”	第二次印刷时更正
202	第三行，“是橙子还是水果”改为“是橙子还是苹果”	第二次印刷时更正
99	代码框最后两行交换位置（因为多线程会把`urls`清空）	第六次印刷时更正
115	正文第三行“运行输出如下。”下面的输出有误，下面的数据需要我们自己手动创建	第六次印刷时更正
245	代码框，最上面应加上`import random as rnd`	第六次印刷时更正
247,248	两个LP问题的目标函数漏掉，改正参考博客。	第六次印刷时更正
71-73	豆瓣模拟登录报错	第六次印刷时更正

待更正：

页码	错误	改正

意见征集

个人认为，一本书在出版后绝对不是结束的标志，而是新一轮的开始。本书写作的初衷在于，当时国内很多的书并没有将数据爬取，数据处理，分析以及可视化放到一起来写，我认为这是一件值得去尝试的事情，所以才有了这本书。

在本书出版一年多来，根据各方的反馈也在不断进行着完善。于此同时也意识到书中存在的问题，比较核心的就在于知识的深度与广度之间的矛盾，本书是着眼于广度的，所以深度就有所欠缺。后面会考虑对内容进行删减，在顾及广度的同时突出重点（统计学方法，机器学习方法等算法）。

此外，如果有机会写第二版，会将文章核心内容以Jupyter notebook的形式呈现，以更好地说明问题。

如上所言，是有一些反馈，但是不太多。希望各位作为读者,在阅读完本书后能够写一些建议给我，我也能更好地明确下面修改的方向。

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
.idea		.idea
Ch0Grammar		Ch0Grammar
Ch1Spider		Ch1Spider
Ch2Data		Ch2Data
Ch3Analysis-Visualization		Ch3Analysis-Visualization
Ch4Data-Life		Ch4Data-Life
Report		Report
pics		pics
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

.idea

.idea

Ch0Grammar

Ch0Grammar

Ch1Spider

Ch1Spider

Ch2Data

Ch2Data

Ch3Analysis-Visualization

Ch3Analysis-Visualization

Ch4Data-Life

Ch4Data-Life

Report

Report

pics

pics

.gitignore

.gitignore

README.md

README.md

Repository files navigation

《Python数据分析入门————从数据获取到可视化》

概览

问题提交

勘误

意见征集

About

Releases

Packages

Languages

shenxiangzhuang/PythonDataAnalysis

Folders and files

Latest commit

History

Repository files navigation

《Python数据分析入门————从数据获取到可视化》

概览

问题提交

勘误

意见征集

About

Topics

Resources

Stars

Watchers

Forks

Languages