需要。现如今国外经济学的一些 TOP 期刊(如 AER, QJE, JPE, AEJ 系列等)基本上都会要求作者提供论文的原始数据和代码,并且还会将作者上传的数据和代码也会公开出来,通过这样的方式不仅能约束学术不端行为,也能保护作者的知识产权。固然说,这种将数据代码公开给学者使用,可以帮助学术圈的进步,但是这也给投稿的作者们带来了难题,尤其是很多时候他们使用的数据是保密的或者签订了协议并不能公开此数据。 对此,我们就需要采取一些措施来处理我们的原始数据,如构造一个合成数据集,让这个合成数据集满足所有的隐私保护约束,同时还能保留原始数据的一些重要的结构,让广大学者可以通过使用这个合成数据集能够大致复现论文的主要结论。