二、探索型数据可视化

探索型数据可视化分为两类:一是假设检验,二是从数据中寻找规律、趋势和异常。前者的目标很明确,后者则相对发散。数据体量越大、复杂度越高、未知因素越多,探索工作的开放性就越高。 (一)假设检验 在这类数据可视化探索中,我们设想的情况是否属实?如何用不同方式传达这一信息?在进行求证时,数据范围相对可控,所使用图表类型较为常规;当然,若想以新颖方式呈现信息,也可尝试较少见的图表。求证型图表一般不用于正式场合,因此需要找到正式展示所需的图表,或快速尝试不同的模板,找到最好的数据视觉化方案。 (二)开放性探索 更多时候,针对数据的开放性探索是数据科学家和商业智能分析师需要研究的领域,而新出现的工具如 Power BI 等工具可以让所有人都参与进来。由于缺少明确目标,开放探索型图表包含的数据范围较广,个别情况下可能会容纳多组数据,或建立自动更新数据的动态系统,也可用于统计建模。