数据科学(Data Science)是比较偏理论的学科,对大部分人来说都是比较枯燥的,但这种基础科学是社会不可缺少的,本科专业如信息科学比较接近,希望我们多出几个高斯王子吧。数据科学是一门交叉的学科,涉及到很多的领域包括统计学、数学、计算机、人工智能、机器学习、数据库、模式识别、可视化技术等多学科的知识。随着科技的发展,每天每时每刻都有大量数据被产生和存储下来。如何才能把这些数据变成有用的信息价值被人类所利用,就会通过一系列的收集、统计、整理、分析、挖掘等方法和技术来实现整个过程。数据学(Dataology)和数据科学(Data Science)(以下称数据学)是关于数据的科学或者研究数据的科学,定义为:研究探索Cyberspace中数据界(datanature)奥秘的理论、方法和技术,研究的对象是数据界中的数据。与自然科学和社会科学不同,数据学和数据科学的研究对象是Cyberspace的数据,是新的科学。数据学和数据科学主要有两个内涵:一个是研究数据本身,研究数据的各种类型、状态、属性及变化形式和变化规律;另一个是为自然科学和社会科学研究提供一种新的方法,称为科学研究的数据方法,其目的在于揭示自然界和人类行为现象和规律。