数据科学,英文为Data Science,简称DS,从广义上来说,数据科学顾名思义,和数据有关的科学研究都是数据科学。维基百科对 DS 的解释是这样的:“ In general terms , Data Science is the extraction of knowledge from data , which is a continuation of the field data mining and predictive analytics , also known as knowledge discovery and data mining ”具体来说,数据科学是指通过挖掘数据、处理数据、分析数据,从而获取数据中潜在的信息和技术。数据科学家的工作:借助统计编程,设计、开发和运用算法来支持商业决策制定工具,管理海量数据, 创建可视化以帮助理解。数据科学是关于数据的科学,为研究探索数据界奥秘的理论、方法和技术。数据科学在20世纪60年代已被提出,只是当时并未获得学术界的注意和认可,1974年彼得诺尔出版了《计算机方法的简明调查》中将数据科学定义为:“处理数据的科学,一旦数据与其代表事物的关系被建立起来,将为其他领域与科学提供借鉴”。1996年在日本召开的“数据科学、分类和相关方法”,已经将数据科学作为会议的主题词。2001年美国统计学教授威廉克利夫兰发表了《数据科学:拓展统计学的技术领域的行动计划》,因此有人认为是克利夫兰首次将数据科学作为一个单独的学科,并把数据科学定义为统计学领域扩展到以数据作为现金计算对象相结合的部分,奠定了数据科学的理论基础。