0基础入门Python数据分析 /
Tiger
在北美攻读计算物理博士后回国投身商业,曾在独角兽公司从事核心数据分析职位,负责过反作弊架构的算法和生死商战决策背后的数据支持,现为围绕大数据方向创业中。
  • 课程目录
  • 课程介绍
  • 试听课

  • 第一讲:在游泳中学会游泳-Python热身

  • 第二讲:Python数据可视化

  • 第三讲:核心概念-数据分析中的统计量

  • 第四讲:统计分布和让电脑听懂人话

  • 第五讲:神奇的区间估计

  • 第六讲:数据分析的利器-假设检验

  • 第七讲:大数据分析的流程和总结

大数据无处不在。

从你拿起手机的那一刻,从你联网的那一刻,从你使用各类外卖、出行、购物、游戏等APP开始,数据已无处不在。没有人能够幸免。

大数据到底有多大?一组名为“互联网上一天”的数据告诉我们——

  • 一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;
  • 发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);
  • 发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);
  • 卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……

大数据时代,海量数据已经成为标配。

那么如何从海量数据中获得别人看不见的信息,利用数据来武装营销工作、优化产品、支撑决策,数据分析就变的尤为重要,因此各种各样的数据分析课应运而生。然而大部分数据分析课最大的问题在于,为了分析而分析,很多人实际上并不知道自己在分析什么,为了什么而分析。

数据分析,不论是用什么样的工具,使用什么样的方法,不论是Excel,还是Python,还是MySQL,都是工具,目的只有一个—— 解决一个问题,或者给一个决策提供依据。 所以学习数据分析的第一步,是明确分析的目标。

解密大数据团队出品的数据分析课,核心是分析思维和方法,因此选取最易上手的分析工具Python,通过丰富的案例来揭示商业数据分析范式,为解决问题及提供决策依据。

关于商业数据分析实战入门课程

本课程由解密大数据团队讲师录制,经过两轮实践改版磨砺而出,知识内容及案例均经过千锤百炼,去粗取精,本次课程由吴博士负责答疑及辅导。

讲师介绍

讲解本次课的吴老师是美国南加州大学统计学博士,目前在美东一家财富100强的金融机构担任资深数据科学家,主要负责在数据中挖掘投资价值,为数据提供者提出优化战略,为内部商业合作伙伴提供咨询。

擅长把商业问题转化为定量分析问题,从统计分析以及机器学习中找到答案,熟悉的分析工具:R,Python,SAS,Spark,以及SQL。吴博士做过很多成功的数据分析案例:

  1. 房贷违约风险分析 结果:成功预测了未来27个月银行贷款资产在不同经济走势下的违约金总额,帮助银行储备足够的资金以对可能的应极端恶化的经济状况。  
  2. 基金赎回金额预测 结果:成功预测了多只共同基金在未来三个月赎回金额。  
  3. 数据驱动下的大额资产挽留 目标:对单个理财专家赎回风险进行预测并根据预测风险进行相应的干预以降低赎回金额以及评估资产挽留活动的有效性。2017年前三个季度帮助客户减少了大约3亿美元的赎回金额。

图片

图片

图片

课程大纲

试听课:年薪百万的数据大神免费分享大数据之道

  • 为什么Python非学不可?
  • 为什么统计也得学?
  • 合格数据科学家应有的资历?
  • 如何享受智能时代红利?揭秘转行数据科学的独家心法!

第一讲:在游泳中学会游泳-Python热身

  • 如何像写作一样优雅地写代码?
  • Python生态中有哪些数据分析利器?
  • 怎么导入数据到Python?
  • 如何全面观察数据?
  • 如何操作数据框?
  • Python实战案例:股票数据的导入和操作

第二讲:Python数据可视化

  • 离散统计变量,如何绘制条形图、饼图?
  • 连续统计变量,如何绘制直方图、箱图?
  • 如何绘制反应两个统计变量关系的散点图?
  • 统计变量太多时,怎么绘制矩阵图?
  • Python实战案例:世界银行数据的可视化定制

第三讲:核心概念-数据分析中的统计量

  • 如何体现数据的集中趋势?
  • 如何描述数据的离散程度?
  • 如何衡量两个变量的相关性?
  • Python实战案例:HR数据的统计分析

第四讲:统计分布和让电脑听懂人话

  • 那些神奇的随机数如何用Python生成?
  • 统计分布中的几个重要概念(PMF/PDF/CDF)
  • 投硬币满足什么统计分布?
  • 美丽冻人的钟形曲线是什么?
  • 人工智能最底层的机制:如何让电脑来听懂人话,模拟现实生活?
  • Python实战案例:投硬币问题和风险投资成功率的模拟

第五讲:神奇的区间估计

  • 什么是统计的样本?什么是统计的总体?
  • 中心极限定理到底在说什么?
  • 如何用样本数据估算总体的参数区间?
  • 置信度是什么?
  • Python案例:用统计分析来估算住房面积

第六讲:数据分析的利器-假设检验

  • 假设检验的逻辑是什么?
  • 假设检验的步骤都有哪些?
  • 如何让Python进行假设检验?
  • 假设检验的两类错误分别是什么?
  • Python实战案例:工厂空气质量检测和自动打包机器效率检验

第七讲:大数据分析的流程和总结

  • 如何将Python+统计用于大数据分析?
  • 大数据分析的典型步骤都有哪些?
  • 小白如何实现完整的数据分析?
  • Python实战案例:达尔文雀的数据分析

课程适合对象

想从事数据分析行业的人群

想要Get一门数据分析新技能的人群

想要掌握Python语言的人群