做实证研究样本至少选一些代表性的从统计上说,至少30才可以,才算大样本。但是还是要看变量数,原则上说样本数至少比变量数多一个,这些是样本的最低要求。对于研究生毕业论文,对数据样本的选择可以根据研究课题进行调整,通常分析的的问题越复杂需要的数据量就会越大小包法律实证分析系统,帮助研究者进行数据收集、数据清洗、数据验证,可以创建如线性回归方式的高级模型,可以不断调整数据使实证显著。
会导致过拟合。论文的样本量太少会导致过拟合,过拟合就是为了得到一致假设而使假设变得过度复杂称为过拟合。想像某种学习算法产生了一个过拟合的分类器,这个分类器能够百分之百的正确分类样本数据(即再拿样本中的文档来给它,它绝对不会分错),但也就为了能够对样本完全正确的分类,使得它的构造如此精细复杂,规则如此严格,以至于任何与样本数据稍有不同的文档它全都认为不属于这个类别。
没有问题,。,。,。可以
170 浏览 2 回答
150 浏览 3 回答
234 浏览 3 回答
109 浏览 3 回答
274 浏览 3 回答
286 浏览 3 回答
302 浏览 5 回答
299 浏览 2 回答
327 浏览 3 回答
121 浏览 3 回答
103 浏览 3 回答
144 浏览 2 回答
125 浏览 2 回答
213 浏览 4 回答
148 浏览 5 回答
173 浏览 4 回答
259 浏览 5 回答
302 浏览 2 回答
193 浏览 3 回答
230 浏览 9 回答
122 浏览 3 回答
244 浏览 8 回答
173 浏览 2 回答
295 浏览 4 回答
304 浏览 2 回答