数据分析实战45讲-14,15-数据可视化

数据视图的表达的形式

  1. 分布
  2. 时间相关
  3. 局部/整体
  4. 偏差
  5. 相关性
  6. 排名
  7. 量级
  8. 地图
  9. 流动

在设计之前,需要思考,用户是谁,想给他们呈现什么,需要突出数据怎样的特点,以及采用哪种视图来进行呈现。
一个视图可能会有多种表达目的,采用哪种视图,取决于你想要数据可视化呈现什么样的目的。

数据可视化工具

  1. 商业智能分析软件
    • Tableau: : 国外收费商业软件,适合BI工程师,数据分析师。
    • PowerIB : 微软出品,搭配Excel使用,呈现内容
    • FindBI : 中国帆软出品,针对国内更加优化,倾向于企业级应用的BI
    • 微图
  2. 可视化大屏
    • DataV: 阿里云-可视化工具,收费
    • FineReport
  3. 前端可视化组件
    • Echarts 百度开源
    • D3.js
    • Three.js
    • AntV 蚂蚁金服
  4. 编程语言类
    • Matplotlib
    • Seaborn

Python可视化技术

可视化视图都有哪些

  1. 比较:比较数据间个类别的关系,或这是他们随着时间的变化趋势
  2. 联系:查看两个或两个以上变量之间的关系,比如散点图
  3. 构成:每隔部分占整体的半分比,或这是随着时间的百分比变化,比如饼图
  4. 分布:关注单个变量,或者多个变量的分布情况,比如直方图

按照比变量的个数,可以把可视化视图划分为单变量分析和多变量分析。
单变量分析指的是一次只关注一个变量。
多变量分析指同一个数据的两个参数,从而分析出两个变量之间是否存在某种联系

散点图 ( scatter plot )

散点图将两个变量的值显示在二维坐标中,适合展示两个变量之间的关系。

折线图

折线图可以用来表示数据随着时间变化的趋势

直方图

直方图,把横坐标等分成一定数量的小区间,叫”箱子“,然后再每个箱子内用矩形条展示该箱子中的箱子数。

条形图

条形图可以帮助我们查看类别的特征。在条形图中,长条形的长度表示类别的频数,宽度表示类别。

箱线图

由5个数值点组成:最大值,最小值,中位数,和上下四分位数。 可以分析出数据的差异性、离散程度和异常值等。

饼图

显示每个部分大小与综合的比例

热力图

是一种矩阵表示方法,其中矩阵中的元素用颜色来表示,不同颜色代表不同的值。通过颜色就能直观地知道某个位置上数值的大小。

蜘蛛图

是一种显示一对多关系的方法。在蜘蛛图中,一个变量相对于另一个变量的显著性是清晰可见的。

二元变量分布

二元变量分布可以查看两个变量之间的关系。