描述性分析是数据分析的重要步骤。进行描述性统计分析前,首先应理解搜集数据、分析数据,以及识别一些常见数据来源的必要性;然后,应该了解实践中常见的数据类型,数据汇总的方法;最后,再确定单变量的数值描述方法,以及两个或两个以上的数据分析方法。
1. 数据:定义和目标
首先,我们应该确定一些定义。
数据:用来展示和解释所搜集、分析和提炼和事实和数字;
变量:可以取不同值的标志或指标。如:行业、股价、市值;
决策变量:变量的取值直接受决策人的控制;
随机变量/不确定性变量:变量的取值不受决策人直接控制的因素的影响,可能会出现不确定性波动;
观察/观测:一组变量对应的一组值;
描述性分析,即通过对搜集的数据进行分析,以获得对变异及其商务环境影响很好的认识。
2. 数据的类型
(1)总体数据和样本数据:许多情况下,从总体(感兴趣的元素的集合)中搜索数据是不可行的。此时,可以从总体的子集(样本)中搜集数据。搜索那些能够代表总体的样本数据很重要,只有这样才能把那些样本数据推广到总体情况的认识。
(2)数量数据和属性数据:数量数据指能够进行加减乘除等数值和算术运算的数据,如:公司的市值;属性数据指那些不能进行算术运算的数据,对这些数据进行描述性分析,只能进行计数或计算每一个类别观察值的比例,如:公司所属的行业。
(3)截面数据和时间序列数据:截面数据是指在同一时间或几乎相同的时间搜集来一些个体的数据;时间序列数据:指几个时期的数据。时间序列数据图能够帮助分析人员了解过去发生了什么,识别随着时间变化而发生变化的趋势,并且可以对未来进行预测。