43 经济统计学早期思想发展简史 44 多元统计分析方法思想发展思想史 45 现代概率论思想发展简史 46 数理统计学早期思想发展简史 47 现代数理经济学发展简史 48 概率论早期思想发展简史 49 数理经济学早期思想发展简史 50 灰色理论在社会经济中的应用 51 现代经济统计学思想发展简史 52 现代数理统计学思想发展简史 53 社会统计学早期思想发展简史 54 现代社会统计学思想发展简史 55 中国汽车保有量定量研究 56 中国股市波动性定量研究 57 中国股票市场风险研究 58 中国收入差距研究 59 论统筹城乡与城乡差距 60 重庆市城乡差距定量研究 61 重庆汽车消费需求的动态分析与预测 62 灰色系统预测方法在我国私人汽车拥有量预测中的应用 63 旅游业对重庆市社会经济贡献的定量分析 64 房价上涨的成因及对策研究
1. 因子分析模型
因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。
因子分析的基本思想:
把每个研究变量分解为几个影响因素变量,将每个原始变量分解成两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子
因子分析模型描述如下:
(1)X = (x1,x2,…,xp)¢是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等(只要将变量标准化即可实现)。
(2)F = (F1,F2,…,Fm)¢ (m<p)是不可测的向量,其均值向量E(F)=0,协方差矩阵Cov(F) =I,即向量的各分量是相互独立的。
(3)e = (e1,e2,…,ep)¢与F相互独立,且E(e)=0, e的协方差阵∑是对角阵,即各分量e之间是相互独立的,则模型:
x1 = a11F1+ a12F2 +…+a1mFm + e1
x2 = a21F1+a22F2 +…+a2mFm + e2
………
xp = ap1F1+ ap2F2 +…+apmFm + ep
称为因子分析模型,由于该模型是针对变量进行的,各因子又是正交的,所以也称为R型正交因子模型。
其矩阵形式为: x =AF + e .
其中:
x=,A=,F=,e=
这里,
(1)m £ p;
(2)Cov(F,e)=0,即F和e是不相关的;
(3)D(F) = Im ,即F1,F2,…,Fm不相关且方差均为1;
D(e)=,即e1,e2,…,ep不相关,且方差不同。
我们把F称为X的公共因子或潜因子,矩阵A称为因子载荷矩阵,e 称为X的特殊因子。
A = (aij),aij为因子载荷。数学上可以证明,因子载荷aij就是第i变量与第j因子的相关系数,反映了第i变量在第j因子上的重要性。
2. 模型的统计意义
模型中F1,F2,…,Fm叫做主因子或公共因子,它们是在各个原观测变量的表达式中都共同出现的因子,是相互独立的不可观测的理论变量。公共因子的含义,必须结合具体问题的实际意义而定。e1,e2,…,ep叫做特殊因子,是向量x的分量xi(i=1,2,…,p)所特有的因子,各特殊因子之间以及特殊因子与所有公共因子之间都是相互独立的。模型中载荷矩阵A中的元素(aij)是为因子载荷。因子载荷aij是xi与Fj的协方差,也是xi与Fj的相关系数,它表示xi依赖Fj的程度。可将aij看作第i个变量在第j公共因子上的权,aij的绝对值越大(|aij|£1),表明xi与Fj的相依程度越大,或称公共因子Fj对于xi的载荷量越大。为了得到因子分析结果的经济解释,因子载荷矩阵A中有两个统计量十分重要,即变量共同度和公共因子的方差贡献。
因子载荷矩阵A中第i行元素之平方和记为hi2,称为变量xi的共同度。它是全部公共因子对xi的方差所做出的贡献,反映了全部公共因子对变量xi的影响。hi2大表明x的第i个分量xi对于F的每一分量F1,F2,…,Fm的共同依赖程度大。
将因子载荷矩阵A的第j列( j =1,2,…,m)的各元素的平方和记为gj2,称为公共因子Fj对x的方差贡献。gj2就表示第j个公共因子Fj对于x的每一分量xi(i= 1,2,…,p)所提供方差的总和,它是衡量公共因子相对重要性的指标。gj2越大,表明公共因子Fj对x的贡献越大,或者说对x的影响和作用就越大。如果将因子载荷矩阵A的所有gj2 ( j =1,2,…,m)都计算出来,使其按照大小排序,就可以依此提炼出最有影响力的公共因子。
3. 因子旋转
建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以便对实际问题进行分析。如果求出主因子解后,各个主因子的典型代表变量不很突出,还需要进行因子旋转,通过适当的旋转得到比较满意的主因子。
旋转的方法有很多,正交旋转(orthogonal rotation)和斜交旋转(oblique rotation)是因子旋转的两类方法。最常用的方法是最大方差正交旋转法(Varimax)。进行因子旋转,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化,使大的载荷更大,小的载荷更小。因子旋转过程中,如果因子对应轴相互正交,则称为正交旋转;如果因子对应轴相互间不是正交的,则称为斜交旋转。常用的斜交旋转方法有Promax法等。
4.因子得分
因子分析模型建立后,还有一个重要的作用是应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价。例如地区经济发展的因子分析模型建立后,我们希望知道每个地区经济发展的情况,把区域经济划分归类,哪些地区发展较快,哪些中等发达,哪些较慢等。这时需要将公共因子用变量的线性组合来表示,也即由地区经济的各项指标值来估计它的因子得分。
设公共因子F由变量x表示的线性组合为:
Fj = uj1 xj1+ uj2 xj2+…+ujpxjp j=1,2,…,m
该式称为因子得分函数,由它来计算每个样品的公共因子得分。若取m=2,则将每个样品的p个变量代入上式即可算出每个样品的因子得分F1和F2,并将其在平面上做因子得分散点图,进而对样品进行分类或对原始数据进行更深入的研究。
但因子得分函数中方程的个数m小于变量的个数p,所以并不能精确计算出因子得分,只能对因子得分进行估计。估计因子得分的方法较多,常用的有回归估计法,Bartlett估计法,Thomson估计法。
(1)回归估计法
F = X b = X (X ¢X)-1A¢ = XR-1A¢ (这里R为相关阵,且R = X ¢X )。
(2)Bartlett估计法
Bartlett估计因子得分可由最小二乘法或极大似然法导出。
F = [(W-1/2A)¢ W-1/2A]-1(W-1/2A)¢ W-1/2X = (A¢W-1A)-1A¢W-1X
(3)Thomson估计法
在回归估计法中,实际上是忽略特殊因子的作用,取R = X ¢X,若考虑特殊因子的作用,此时R = X ¢X+W,于是有:
F = XR-1A¢ = X (X ¢X+W)-1A¢
这就是Thomson估计的因子得分,使用矩阵求逆算法(参考线性代数文献)可以将其转换为:
F = XR-1A¢ = X (I+A¢W-1A)-1W-1A¢
5. 因子分析的步骤
因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。
(i)因子分析常常有以下四个基本步骤:
(1)确认待分析的原变量是否适合作因子分析。
(2)构造因子变量。
(3)利用旋转方法使因子变量更具有可解释性。
(4)计算因子变量得分。
(ii)因子分析的计算过程:
(1)将原始数据标准化,以消除变量间在数量级和量纲上的不同。
(2)求标准化数据的相关矩阵;
(3)求相关矩阵的特征值和特征向量;
(4)计算方差贡献率与累积方差贡献率;
(5)确定因子:
设F1,F2,…, Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;
(6)因子旋转:
若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。
(7)用原指标的线性组合来求各因子得分:
采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分。
(8)综合得分
以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。
F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )
此处wi为旋转前或旋转后因子的方差贡献率。
(9)得分排序:利用综合得分可以得到得分名次。
在采用多元统计分析技术进行数据处理、建立宏观或微观系统模型时,需要研究以下几个方面的问题:
· 简化系统结构,探讨系统内核。可采用主成分分析、因子分析、对应分析等方法,在众多因素中找出各个变量最佳的子集合,从子集合所包含的信息描述多变量的系统结果及各个因子对系统的影响。“从树木看森林”,抓住主要矛盾,把握主要矛盾的主要方面,舍弃次要因素,以简化系统的结构,认识系统的内核。
· 构造预测模型,进行预报控制。在自然和社会科学领域的科研与生产中,探索多变量系统运动的客观规律及其与外部环境的关系,进行预测预报,以实现对系统的最优控制,是应用多元统计分析技术的主要目的。在多元分析中,用于预报控制的模型有两大类。一类是预测预报模型,通常采用多元线性回归或逐步回归分析、判别分析、双重筛选逐步回归分析等建模技术。另一类是描述性模型,通常采用聚类分析的建模技术。
· 进行数值分类,构造分类模式。在多变量系统的分析中,往往需要将系统性质相似的事物或现象归为一类。以便找出它们之间的联系和内在规律性。过去许多研究多是按单因素进行定性处理,以致处理结果反映不出系统的总的特征。进行数值分类,构造分类模式一般采用聚类分析和判别分析技术。
如何选择适当的方法来解决实际问题,需要对问题进行综合考虑。对一个问题可以综合运用多种统计方法进行分析。例如一个预报模型的建立,可先根据有关生物学、生态学原理,确定理论模型和试验设计;根据试验结果,收集试验资料;对资料进行初步提炼;然后应用统计分析方法(如相关分析、逐步回归分析、主成分分析等)研究各个变量之间的相关性,选择最佳的变量子集合;在此基础上构造预报模型,最后对模型进行诊断和优化处理,并应用于生产实际。
Rotated Component Matrix,就是经转轴后的因子负荷矩阵,
当你设置了因子转轴后,便会产生这结果。
转轴的是要得到清晰的负荷形式,以便研究者进行因子解释及命名。
SPSS的Factor Analysis对话框中,有个Rotation钮,点击便会弹出Rotation对话框,
其中有5种因子旋转方法可选择:
1.最大变异法(Varimax):使负荷量的变异数在因子内最大,亦即,使每个因子上具有最高载荷的变量数最少。
2.四次方最大值法(Quartimax):使负荷量的变异数在变项内最大,亦即,使每个变量中需要解释的因子数最少。
3.相等最大值法(Equamax):综合前两者,使负荷量的变异数在因素内与变项内同时最大。
4.直接斜交转轴法(Direct Oblimin):使因素负荷量的差积(cross-products)最小化。
5.Promax 转轴法:将直交转轴(varimax)的结果再进行有相关的斜交转轴。因子负荷量取2,4,6次方以产生接近0但不为0的值,藉以找出因子间的相关,但仍保有最简化因素的特性。
上述前三者属於「直交(正交)转轴法」(Orthogonal Rotations),在直交转轴法中,因子与因子之间没有相关,因子轴之间的夹角等於90 度。后两者属於「斜交转轴」(oblique rotations),表示因子与因子之间彼此有某种程度的相关,因素轴之间的夹角不是90度。
直交转轴法的优点是因子之间提供的讯息不会重叠,受访者在某一个因子的分數与在其他因子的分數,彼此独立互不相关;缺点是研究迫使因素之间不相关,但这种情况在实际的情境中往往并不常存在。至於使用何种转轴方式,须视乎研究题材、研究目的及相关理论,由研究者自行设定。
在根据结果解释因子时,除了要看因子负荷矩阵中,因子对哪些变量呈高负荷,对哪些变量呈低负荷,还须留意之前所用的转轴法代表的意义。
2,主成分分析(principal component analysis)
将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。又称主分量分析。在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。但是,在用统计分析方法研究这个多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。主成分分析首先是由K.皮尔森对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。
(1)主成分分析的原理及基本思想。
原理:设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理降维的一种方法。
基本思想:主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。
(2)步骤
Fp=a1mZX1+a2mZX2+……+apmZXp
其中a1i, a2i, ……,api(i=1,……,m)为X的协方差阵∑的特征值多对应的特征向量,ZX1, ZX2, ……, ZXp是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响[注:本文指的数据标准化是指Z标准化]。
A=(aij)p×m=(a1,a2,…am,),Rai=λiai,R为相关系数矩阵,λi、ai是相应的特征值和单位特征向量,λ1≥λ2≥…≥λp≥0 。
进行主成分分析主要步骤如下:
1. 指标数据标准化(SPSS软件自动执行);
2. 指标之间的相关性判定;
3. 确定主成分个数m;
4. 主成分Fi表达式;
5. 主成分Fi命名;
选用以上两种方法时的注意事项如下:
1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。
2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。
3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。
4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。
5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。
总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。
在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)。
(1)了解如何通过SPSS因子分析得出主成分分析结果。首先,选择SPSS中Analyze-Data Reduction-Factor…,在Extraction…对话框中选择主成分方法提取因子,选择好因子提取个数标准后点确定完成因子分析。打开输出结果窗口后找到Total Variance Explained表和Component Matrix表。将Component Matrix表中第一列数据分别除以Total Variance Explained表中第一特征根值的开方得到第一主成分表达式系数,用类似方法得到其它主成分表达式。打开数据窗口,点击菜单项的Analyze-Descriptive Statistics-Descriptives…,在打开的新窗口下方构选Save standardized values as variables,选定左边要分析的变量。点击Options,只构选Means,点确定后既得待分析变量的标准化新变量。
选择菜单项Transform-Compute…,在Target Variable中输入:Z1(主成分变量名,可以自己定义),在Numeric Expression中输入例如:0.412(刚才主成分表达式中的系数)*Z人口数(标准化过的新变量名)+0.212*Z第一产业产值+…,点确定即得到主成分得分。通过对主成分得分的排序即可进行各个个案的综合评价。很显然,这里的过程分为四个步骤:
Ⅰ.选主成分方法提取因子进行因子分析。
Ⅱ.计算主成分表达式系数。
Ⅲ.标准化数据。
Ⅳ.计算主成分得分。
我们的程序也将依该思路展开开发。
(2)对为何要将Component Matrix表数据除以特征根开方的解释
我们学过主成分分析和因子分析后不难发现,原来因子分析时的因子载荷矩阵就是主成分分析特征向量矩阵乘以对应特征根开方值的对角阵。而Component Matrix表输出的恰是因子载荷矩阵,所以求主成分特征向量自然是上面描述的逆运算。
成功启动程序后选定分析变量和主成分提取方法即可在数据窗口输出得分和在OUTPUT窗口输出主成分表达式。
3,聚类分析(Cluster Analysis)
聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类的分析技术 。
在市场研究领域,聚类分析主要应用方面是帮助我们寻找目标消费群体,运用这项研究技术,我们可以划分出产品的细分市场,并且可以描述出各细分市场的人群特征,以便于客户可以有针对性的对目标消费群体施加影响,合理地开展工作。
4.判别分析(Discriminatory Analysis)
判别分析(Discriminatory Analysis)的任务是根据已掌握的1批分类明确的样品,建立较好的判别函数,使产生错判的事例最少,进而对给定的1个新样品,判断它来自哪个总体。根据资料的性质,分为定性资料的判别分析和定量资料的判别分析;采用不同的判别准则,又有费歇、贝叶斯、距离等判别方法。
费歇(FISHER)判别思想是投影,使多维问题简化为一维问题来处理。选择一个适当的投影轴,使所有的样品点都投影到这个轴上得到一个投影值。对这个投影轴的方向的要求是:使每一类内的投影值所形成的类内离差尽可能小,而不同类间的投影值所形成的类间离差尽可能大。贝叶斯(BAYES)判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统计推断。所谓先验概率,就是用概率来描述人们事先对所研究的对象的认识的程度;所谓后验概率,就是根据具体资料、先验概率、特定的判别规则所计算出来的概率。它是对先验概率修正后的结果。
距离判别思想是根据各样品与各母体之间的距离远近作出判别。即根据资料建立关于各母体的距离判别函数式,将各样品数据逐一代入计算,得出各样品与各母体之间的距离值,判样品属于距离值最小的那个母体。
5.对应分析(Correspondence Analysis)
对应分析是一种用来研究变量与变量之间联系紧密程度的研究技术。
运用这种研究技术,我们可以获取有关消费者对产品品牌定位方面的图形,从而帮助您及时调整营销策略,以便使产品品牌在消费者中能树立起正确的形象。
这种研究技术还可以用于检验广告或市场推广活动的效果,我们可以通过对比广告播出前或市场推广活动前与广告播出后或市场推广活动后消费者对产品的不同认知图来看出广告或市场推广活动是否成功的向消费者传达了需要传达的信息。
首先,我要说明这里的指导并非 常规意义的指导,我这里说的指导是到底应该如何写论文(应该还是很抽象,不过看完就知道了)。
迄今为止,我大约也帮忙做了能有上千份的学生论文数据分析部分,包括一部分的整篇论文写作。因为我是做市场研究与数据分析的,擅长的主要工具是spss,不敢说百分百精通spss,但是应付个八九十应该是足够了,很自然的平时就利用下班和业余时间帮学生做一些论文数据分析以及论文写作指导。
很多论文的核心部分都包括数据分析,而统计学也应该是所有学科应该学习的一门重要课程,但是恰恰相反,很多学科只是把统计学和数据分析作为一项选修甚至不重要的课程对待,这样导致学生在最后做论文时完全不懂。
而在这种情况下,很多学生因为对数据分析的一窍不通,导致论文从开始的设计到后续的数据收集、整理等都会出现问题,最终导致分析出问题。
因此,在对数据分析一窍不通的情况下,应该如何从头构建论文及写作呢?很多论文虽然数据分析部分是核心,但是不管哪种论文的写作,都脱离不了论文的框架。因此,具体的过程应该如下:
首先是选题,当然很多时候是导师直接给选题,这个没有太多讨论。
其次是选题确定后,马上要做的不是想我应该怎么去写作,或者在哪抱怨“哎~~郁闷,完全不知道怎么写嘛”。而是先通过文献查找,看前人在这个选题方面已经做了哪些研究,都是如何做的。通过查找文献找到跟选题有关的资料,然后对这些资料进行整理,整理不需要计较参考文献的结论和数据细节等,而是要把每篇文献的研究目的、采用的研究方法、采用的分析方法整理出来。当然参考文献中的分析方法你可能还完全不懂,但是没关系,你先把这些参考文献中使用的分析方法全部罗列出来,如线性回归、方差分析、均值t检验、logistic回归等,把这些文献中常用的统计方法罗列出来,你需要弄清楚对应关系,即每种分析方法是用来支持和实现什么样的研究目的,以及能够得出什么样的结论,认真阅读文献就能实现这一步。
第三.通过上一步,你应该朦胧的知道你选题相关的参考文献中常用的统计方法名称,以及这些统计方法能够帮助实现哪些目的,或者得出什么结论,同时也不会对自己的选题那么恐惧和迷茫了,因为可能你的选题已经有前人做过了,你的论文只是“复制”一遍而已了,我说的复制是重复一遍前人的研究。在这种情况下,可以构思下自己的选题,这一步属于纯理论层面的,你需要将自己的思路具体化,比如要实现什么目的,很自然的需要什么数据分析方法也就能确定了。当然很多论文会预先设计一系列待验证的假设,也是在这一步完成,因为你找到的文献中可能会存在矛盾的结论,可能会存在一些你认为的研究缺陷(文献看多了,自然自己就会有想法出来了),提出自己的一系列假设,能够很清楚的指导后面的数据收集和分析。
第四.选题、假设还有研究方法这些经过前面几步都能确定了,接下来就是要考虑具体研究和收集数据的环节了。这个环节最重要的也是首要的是弄清楚你的数据应该是什么类型的,通过哪种方法来获取。其实也容易了,因为前面你已经确定了统计分析方法,而每种方法有它特定的数据类型要求,比如是分类数据(如性别、民族、年级等)、比如连续性数据(如年龄、身高、体重、温度、长度、距离等)。分类数据简单通俗点的理解就是这些数字本身是没有意义的,是人为赋予它一定的含义,这些数据之间不存在连续性,且加减乘除没有意义,而连续性数据是数据本身有意义,且能够进行一些加减乘除运算。确定了所需要的数据类型,就大致能够知道在数据收集时,应该注意的问题。比如一份问卷调查,其中应该如何设计问题也就大致清楚了,通常问卷设计时就要考虑两种数据类型的问题,因为不同的选项设计会导致不同的数据类型。如你设计一个问题的答案选项是“有/没有”、“是/否”这种是属于分类数据,如果你的答案选项是李克特量表式“非常满意----非常不满意”这种,在处理时可以按照分类数据,只能统计出一些百分比,也可能将其按照连续数据如12345打分形式,这样可以求均值,可以做很多其他多元统计分析。因此这一步确定数据类型很关键,如果数据类型弄错的话,则收集的数据完全无用。
第五.具体收集数据过程,不细说了,收集回来之后 就是数据的录入。记住一定要录入原始的数据,而不是经过加减整理汇总后的数据。数据录入格式也是有要求的,一般大致同样的情况下,都是一行代表一个个案或者一份问卷的数据,而一列对应表示的是问卷中的一个问题,即变量。因此数据录入完成后,应该是有多少样本数据,就有多少行,数据中包含多少个指标,那就有多少列。
第六.这一步才是你应该开始头疼的数据分析不会了怎么办。因为到这里才开始是数据的具体分析过程了。不会怎么办,前面已经知道了分析方法,这种情况,只有找本教材,然后找对应的方法介绍学习即可,或者实在不行找人指导,找人帮忙等等。
最后。分析完成后,开始整篇论文的写作。
PS:还要强调一点,现在的高校导师都存在一些问题,因为我接触了那么多学生,他们的认为观点就是“我的统计检验结果不显著怎么办,那不就是说我的研究没有意义么?我的假设都是错的?”“我的结论跟前人的结果不一致啊,看来我的又错了”,这两种观点明显是错的:
一、数据的来源对象发生了变化,谁规定的结论必须跟前人一致;
二、请问爱迪生发明灯泡的前999次失败是没有意义么?科学研究本来就是一个证伪的过程,一次次证伪来接近真相。
三、如果你的假设一定是正确的,那不需要数据验证,你可以去帮助警察破案了,因为你认为你的假设一定是对的,那破案多简单的,假设一下就好了。但是很显然,很多导师并没有把这些正确的观点传达给学生。
统计学专业毕业生的就业情况分析论文
随着社会经济发展以及高校扩招,大学生就业竞争日益激烈,大学生就业成为一个社会关注的问题。成都信息工程大学统计学院毕业生在求职过程中,虽然具有良好的就业基础和条件,但在求职过程中因为各种原因而与工作失之交臂的情况也时有发生。怎样有效地根据社会和市场的变化制定和实施人才培养方案,怎样采取切实有效的手段提高教育、教学质量,怎样联通和挖掘各种渠道最大限度提高学生动实践创新能力,都是需要解决的问题
资料显示,2014年我国大学毕业生人数达到727万人,比被称为“史上最难就业季”2013年再增加28万人,创下历史新高,而2015年这个人数更是达到749万人,再创历史新高,再加上往届没有就业以及准备换工作的大学生,想要就业的大学生数量之多难以想象,大学生的就业形势十分严峻,各方面的就业压力都非常巨大。因此大学毕业生能否顺利就业,已经成为社会普遍关注、值得探讨的问题。
统计学专业学生主要就业渠道是统计系统和金融系统的相关行业和企事业单位,就业领域广泛,就业质量良好。但是统计学院与西财、川大等四川高校相比,还有明显差距,所以深入研究我院人才培养方式的特色和不足,搞清楚学生就业方方面面的情况显得尤为必要。
本文通过对106名学生和150名用人单位人员的问卷调查,以及就业登记第一手资料,整理归纳了统计学专业就业方面的各种情况。
1、大部分在校学生认为,社会实践或者工作经验是最大的就业优势,有62名被调查学生将社会实践或者工作经验排在第一位,占58.5%。
2、150名用人单位人员调查中,社会实践或者工作经验得分最高,为1270;其次为学习成绩好,得分1155。用人单位普遍认为统计学专业大学生最应该具备社会实践或者工作经验。
3、用人单位对应届统计专业毕业生能力重要程度排序为:“统计调查的组织实施能力”最重要,占比39%;其次为“统计调查的数据整理与分析能力”,占比36%;统计调查的设计能力排名第三,占比25%。
4、用人单位对工作10年的统计人员素质排序则发生了明显变化,统计调查设计能力上升到第一位,统计调查的组织实施能力则下降到第三位。
5、从统计学专业设置的主要课程来看,用人单位认为最需要开设的是《多元统计分析及SPSS实现》,得分高达814;其次是《经济学原理》和《统计学原理》,得分分别为538、504;得分最低的是《社会经济调查与分析》,为459。
由于大学生读书时基本集中在各大城市,应届毕业生在毕业时宁可成为大城市中的“蚁族”或“漂族”,也不愿意去二三线城市或者县城乡镇等基层单位就业。中小企业与民营企业虽然需要大量的应届毕业生,但是工资福利待遇相对而言较低、发展空间相对较小,加上部分企业单位用工不符合国家政策,因此对应届毕业生的吸引力有限;基层医疗、教育、农林技等部门虽然急需人才,但因为编制限制等诸多原因,吸引应届毕业生的能力有限。具体说来就业难主要有以下几方面原因:
(1)我国现阶段中小企业数量规模较小,提供的就业岗位不能满足应届毕业生的就业需求;
(2)人才的培训缺乏专业化,造成专业人才素质未达标,造成部分岗位缺乏专业人士;
(3)部分企业的招聘信息公布范围不够广,使得招聘信息传播存在局限性,最终导致难以找到合适的员工,造成职位长期空闲;
(4)大学应届毕业生人数的增长速度远远高于我国经济的增长速度。同时因为我国各地区之间以及城乡之间存在较大差异,虽然政府多次宣传提出支援西部,大学生西部志愿者等政策,但是大学生很少愿意在经济欠发达地区就业尤其西部地区为主,并且在较长的一段时间里,大学生就业区间不平衡的状况仍旧很难改变。
由此提出两方面的建议:
第一、学生方面:1、大学生应该转变观念,以实现顺利就业。大学生不应该把未来职业的目光定在传统的'“集中”的区域、行业、单位,而应该根据自己的个性、能力、作出个性化的职业选择拓宽求职的视野,尽量做到乐在其中,以求能以更好的心态进入自己的职业生涯。将“短期求职”改变为“较长期求职”,在求职过程中,应届毕业生不应该太过理想化,一个人或许要经过2至3次甚至更多次的选择,才能找到适合自己的工作,因此我们对第一份工作不必要过于挑剔,而应该注意求职中的真实感受。2、大学生在就业过程中应该培养和发扬乐观向上积极进取的品质;良好的团队合作精神;敢于挑战,具有勇于战胜困难的决心;强烈的责任心;规范的行为意识;一定的社会实践经历。3、大学生应该在毕业前应该注意自身修养的提高,在学习之余,同时也应该注意社会实践活动的调高。同时也需要养成良好的心态,能在就业过程中做到胜不骄败不馁,才能在就业过程中实现自我价值。
第二、学校方面:
1、职业生涯规划教育要落到实处,并根据实际情况及时调整。我院在职业规划当中,应该较早引导学生制定一个职业规划,告诉学生未来就业的趋势以及就业状况,但是又不能像定了一个框框,从而对学生造成束缚,形成一种误导,避免毕业生一心只想到银行、当公务员,而相对忽视其他公司单位。事实上,就业情况复杂多变,专业的就业方向也复杂多变,应该帮助学生更多的根据自己的兴趣、自己的能力,甚至自己的价值取向来择业,而不应该仅仅根据以前的就业经验与就业形势来决定自己的就业,而应该根据外部环境以及自己的取向来不断调整就业方向。
2、学校所开的专业课程应能满足学生目标职业的需求。通过调查得知,用人单位虽然对我院开设的专业课程认同度虽然较高,但是就学生而言,对于本专业的课程设置却认同度则相对较低,就我们学院而言,我觉得在原有专业选修课的基础上,可以适度减少专业必修课而适量增加部分专业选修课,使学生能根据自己的目标职业规划选择相对的专业选修课程,同时也能使学生根据自己的兴趣来上课,能增加上课的积极性。同时学校应该与部分企业联系,实现校企合作,为学生提供更多的实习机会,让学生有更多的社会实践机会,以此开阔学生的视野,增强社会适应能力,在就业过程中具有较高的竞争力。另外,我院应让老师去企业观摩,了解企业对专业人才需求的技能,以此为根据来设置我院的专业课程。同时应通过校企合作组建实习基地、毕业生推荐实习等途径进行就业指导,为在校学生拓宽实习实训渠道,练得一手过硬的动手能力。
3、学校应该增强学生的就业适应能力。学院除了开设传统的就业指导课程以外,我觉得还可以组织模拟应聘,鼓励学生参加模拟招聘比赛等方式来增强学生的面试综合应对能力。这样既可以增加学生的面试经验与反应能力,也可以磨练学生的胆量,提高学生的视野,现在的学生越来越喜欢具有双向交流特点的就业指导方式,诸如往届就业好的毕业生传授交流就业心德、求职案例分析、企业的领导专题讲座,与学生互动交流企业需求的人才类型、模拟招聘、短期就业实习、面对面咨询等新型就业指导方法都是不错的选择。同时我们学院应普及和提高我院学生的职业生涯规划意识。实践证明,在大学生从被动就业转向主动择业过程中,职业生涯规划起到了实质性的引导和帮助作用。
4、学校应对重点的学生给予更多关注,能及时对学生的就业心理进行辅导。配置就业指导老师和心里理指导老师,建立与之配套的学校-院系-班级的心理指导体系,并选配有良好沟通能力与专业技能,具有责任心的老师来担任各学院的就业心理指导老师,以保证学生在就业过程中出现心理偏差时能有专人及时进行指导,带领学生走出阴霾。