会导致过拟合。论文的样本量太少会导致过拟合,过拟合就是为了得到一致假设而使假设变得过度复杂称为过拟合。想像某种学习算法产生了一个过拟合的分类器,这个分类器能够百分之百的正确分类样本数据(即再拿样本中的文档来给它,它绝对不会分错),但也就为了能够对样本完全正确的分类,使得它的构造如此精细复杂,规则如此严格,以至于任何与样本数据稍有不同的文档它全都认为不属于这个类别。
凉拌呗。两个办法:一是增加样本数,现在都四月下旬了,不知道你还来不来得及;二是硬着头皮往下写,这个做法风险比较大,评审时非常容易被质疑,运气不好就通不过了。
250 浏览 2 回答
131 浏览 3 回答
329 浏览 3 回答
296 浏览 2 回答
207 浏览 4 回答
180 浏览 4 回答
230 浏览 3 回答
336 浏览 4 回答
301 浏览 4 回答
339 浏览 5 回答
355 浏览 3 回答
188 浏览 2 回答
150 浏览 4 回答
341 浏览 8 回答
235 浏览 2 回答
154 浏览 3 回答
351 浏览 3 回答
304 浏览 3 回答
168 浏览 2 回答
288 浏览 3 回答
310 浏览 3 回答
101 浏览 2 回答
244 浏览 2 回答
316 浏览 4 回答
98 浏览 2 回答