数据科学工程实践:用户行为分析与建模、A/B实验、SQLFlow
上QQ阅读APP看书,第一时间看更新

第一部分
观测数据的分析技术

观测数据的分析方法又称为非实验性分析或对比分析,确切地说是非随机化对比分析,是在自然状态下对研究对象的特征进行观察、记录,并对结果进行描述和对比。观测数据分析多用于现实生活中,影响某个变量的潜在可能因素过多或不确定而不能逐一进行实验分析或者因为一些特殊原因不能进行实验分析的场景,目的是找出可能造成结果指标例如业务单量增长或者下降的相关因素。

设计分析框架是观测数据分析的核心步骤,与实验分析不同,在很多观测数据分析中,结果可能存在于分析设计之前,设计分析框架包括如下步骤。

  • 了解分析的背景。
  • 明确分析目标。
  • 确定分析方法。
  • 确定收集哪些数据以及如何收集和处理数据。
  • 识别和控制可能混杂和偏倚的方法。
  • 限制因未测量的协变量而导致结果不确定性的方法。

本书第一部分将阐述不同观测数据分析场景所对应的分析框架、原理及实际操作。