Skip to content

shenxiangzhuang/PythonDataAnalysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

《Python数据分析入门————从数据获取到可视化》

概览

这里是本书中使用的所有源代码,数据等文件。关于本书的一些最新的进展的也会第一时间在这里公布。希望本书能对大家有所帮助。

问题提交

如果大家有问题和建议,可以直接在本项目提交issue(推荐),也可以发邮件给我(datahonor@gmail.com) 我会定期查看并尽快回复。 (也有读者到出版社 提交勘误的,也是可以的,不过只建议在那里提交typo相关的, 涉及到代码还是建议在Github提issue,方便一些)。

勘误

已更正:

页码 错误 改正
201 上方第一个阴影框(训练集数据)“种类”列最后两行将“bumpy”全改为“orange” 第二次印刷时更正
202 第三行,“是橙子还是水果”改为“是橙子还是苹果” 第二次印刷时更正
99 代码框最后两行交换位置(因为多线程会把urls清空) 第六次印刷时更正
115 正文第三行“运行输出如下。”下面的输出有误,下面的数据需要我们自己手动创建 第六次印刷时更正
245 代码框,最上面应加上import random as rnd 第六次印刷时更正
247,248 两个LP问题的目标函数漏掉,改正参考博客 第六次印刷时更正
71-73 豆瓣模拟登录报错 第六次印刷时更正

待更正:

页码 错误 改正

意见征集

个人认为,一本书在出版后绝对不是结束的标志,而是新一轮的开始。本书写作的初衷在于,当时国内很多的书并没有将数据爬取,数据处理,分析以及可视化放到一起来写,我认为这是一件值得去尝试的事情,所以才有了这本书。

在本书出版一年多来,根据各方的反馈也在不断进行着完善。于此同时也意识到书中存在的问题,比较核心的就在于知识的深度与广度之间的矛盾,本书是着眼于广度的,所以深度就有所欠缺。后面会考虑对内容进行删减,在顾及广度的同时突出重点(统计学方法,机器学习方法等算法)。

此外,如果有机会写第二版,会将文章核心内容以Jupyter notebook的形式呈现,以更好地说明问题。

如上所言,是有一些反馈,但是不太多。希望各位作为读者,在阅读完本书后能够写一些建议给我,我也能更好地明确下面修改的方向。

About

The data and code that used in my book.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published