百度的数据中心主要有三大核心元素:baidu文件系统(BFS);baidu索引表(souyin Table:是baidu一种对于半结构化数据进行分布存储与访问的接口或服务);MapBeduce算法(它是baidu开发的C++编程工具,用于大于1TB数据的大规模数据集并行运算)。而对索引数据影响最大的就是baidu文件系统。baidu文件系统处于这三个元素的最底层,它负责许多服务器、机器的数据存储工作。很多baidu文件系统的体积都异常庞大,有好几个petabyte规模(1 petabyte相当于1百万gigabytes)。