谁说菜鸟不会数据分析-入门篇-第一章-数据分析那些事

谁说菜鸟不会数据分析-入门篇-第一章-数据分析那些事

  1. 何谓数据分析

    • 数据分析是指用适当的统计分析方法,对收集来的大量数据进行分析,将他们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。
    • 数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
    • 数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律。
  2. 数据分析的划分

    • 描述性数据分析 :初级数据分析
      • 对比分析法、平均分析法、交叉分析法
    • 探索性数据分析 : 侧重于在数据之中发现新的特性
      • 相关分析、因子分析、回归分析
    • 验证性数据分析 : 侧重于验证已有假设的真伪证明
  3. 数据分析的作用

    • 现状分析 : 过去发生了什么
    • 原因分析 : 某一现状为什么发生
    • 预测分析 : 将来会发生什么
  4. 数据分析六部曲

    • 明确分析目的和思路
      * 明确分析目的
              * 为什么要开展数据分析
              * 通过数据分析要解决什么问题,只有明确数据分析的目标,数据分析才不会偏离方向,否则得出的数据分析结果不仅没有知道意义,甚至可能将决策者引入歧途
      * 确定分析思路
              * 体系化:先分析什么,后分析什么,是的各个分析点之间有逻辑联系。确认从哪方面入手,分析的内容和指标是否完整,合理。体系化就是为了让分析框架具有说服力
              * 分析框架体系化 以营销、管理等理论为指导,结合实际业务情况,搭建分析框架,才能确保分析维度的完整性,分析结果的有效性及正确性。
      
    • 数据收集
      * 数据库
      * 公开出版物
      * 互联网
      * 市场调查
      
    • 数据处理
      * 数据处理是指对收集到的数据进行加工整理,形成适合数据分析的样式,从大量的、杂乱无章、难以理解的数据中,抽取并推导出对解决问题有价值、有意义的数据
      * 数据处理主要包括 数据清洗、数据转化、数据提取、数据计算
      
    • 数据分析
      * 数据分析是指用适当额分析方法以及工具,对处理过的数据进行分析,提取有价值的信息,形成有效的结论
      
    • 数据展现
      * 使用图形来展现,更加有效,直观地传递出分析师索要表达的观点。能用图就不用表格,能用表格说明问题,就不用文字
      
    • 报告撰写
      * 数据分析报告是对整个数据分析过程的一个总结和呈现。通过报告,把数据分析的起因、过程、结果及建议完整地展现出来,供决策者参考。
      * 一份好的数据分析报告,需要一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。
      * 数据分析报告需要有明确的结论、没有明确结论分析称不上分析,同时也失去了报告的意义。
      * 好的解决报告,一定要有建议或解决方案。
      * 数据分析师,需要掌握数据分析的方法,而且还要了解和熟悉业务,这样才能根据发现的业务问题,提出具有可行性的建议或解决方案。
      
  5. 数据分析的三大误区

    • 分析目的不明确,为分析而分析
      * 数据分析不应为分析而分析,而是应该围绕你的分析目的(了解现状、找出业务变动原因、预测发展等)而进行分析
      * 对自己的目的有清晰的认识,才知道要怎样实现这个目的,需要通过哪些图表展示,才会知道这些图表是否能反应问题,自然而然地进行相应的问题分析。
      
    • 缺乏业务知识,分析结果偏离实际
      * 缺乏从事营销、管理方面的工作经验,对业务的理解相对较浅,对数据的分析偏重于数据分析方法的使用
      * 忽视了业务逻辑上的关联性,得不到全面、综合性的结论
      * 在企业中所作的数据分析不是纯数据分析,而是需要多从业务方面进行分析,不应该停留在数据表面,要考虑数据背后的事实与真相,使分析结果更加切合实际,为决策提供有力的支撑,否则就是纸上谈兵
      * 数据分析师的任务不是单纯做数学题,数据分析师还必须懂营销,懂管理,更要懂策略
      
    • 一味追求使用高级分析方法,热衷研究模型
      * 高级的数据分析方法不一定是最好的,能够简单有效解决问题的方法才是最好的。
      * 仅有分析模型远远不够,围绕业务发现问题并解决问题才是数据分析的最终目的,不论高级的分析方法还是简单的分析方法,只要能够解决业务问题,就是好方法。
      
  6. 数据分析师的职业要求

    • 懂业务
      * 数据分析工作前提就是懂业务,熟悉行业知识、公司业务及流程,有自己独到见解,脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,没有太大的实用价值
      * 懂业务也是数据敏感的体现
      
    • 懂管理
      * 针对数据分析结论提出有指导意义的分析建议,没有管理理论的支撑就难以确保分析建议的有效性
      
    • 懂分析
      * 掌握数据分析的基本原理与一些有效的数据分析方法,并能灵活运用到实践工作中,以便有效地开展数据分析。
      * 只要能解决问题的方法,就是好方法
      
    • 懂工具
      * 掌握常用的数据分析工具,根据研究的问题选择合适的工具,只要能解决问题的工具就是好工具
      
    • 懂设计
      * 运用图表有效表达数据分析师的分析观点,使分析结果一目了然
      
  7. 几个常用指标和术语

    • 平均数:算数平均数
      * 就是一组数据的算数平均值,即全部数据累加后除以数据个数。
      * 将总体内各单位的数量差异抽象化,代表总体的一般水平,掩盖了总体内各单位的差异
      
    • 绝对数 与 相对数
      * 绝对数:反应客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标。也可以表现为在一定时间地点条件下,数量增减变化的绝对数。
      * 相对数:是指由两个有联系的指标对比计算而得到的数值,用以反映客观现象之间数量联系程度的综合指标,一般以倍数、成数、百分数等表示,它反映了客观现象之间数量联系的程度。 相对数 = 比较数值/基础数值;
      
    • 百分点 与 百分比
      * 百分比是相对数中的一种,它表示一个数是另一个数的百分之几,也称百分率或百分数。
      * 百分点是指不同时期以百分数的形式表示的相对指标的变动幅度,一个百分点=1%。
      
    • 频数 与 频率
      * 频数是指一组数据中个别数据重复出现的次数。
      * 频率是每组类别次数与总次数的比值,代表某类别在总体中出现的频繁程度,一般采用百分数表示,所有组的频率加总等于100%。
      
    • 比例 和 比率
      * 比例:是指总体中各部分的数值占全部数值的比重,通常反应总体的构成和结构
      * 比率:是指不同类别数值的对比,反应的是一个整体中各部分之间的关系。 部分与部分之间的比值
      
    • 倍数 与 番数
      * 倍数:是一个数除以另一个数所得到的商。倍数一般表示数量的增长或上升幅度。
      * 番数:原来数量的2的N次方倍。
      
    • 同比 与 环比
      * 同比:是指与历史同期进行比较得到的数值,反应的是事物发展的相对情况
      * 环比:是指与前一个统计期进行比较得到的数值,该指标主要反应的是事物逐期发展的情况