数据湖(Data Lake)是一个集中式存储库,一个以原生格式存储各种大规模原始数据集的数据库,它允许以任何规模存储所有结构化和非结构化数据。数据湖的概念最初是由大数据厂商提出的。从表面上看,数据被加载到基于HDFS的廉价存储硬件上,这些硬件可以扩展。
在商业智能和数据仓库尚未被淘汰的今天,大数据分析和大数据湖正在向更多类型的实时智能服务发展,这些服务可以支持实时决策。
使用数据湖可以在更短的时间内利用更多来源的更多数据,使用户能够以不同的方式协同处理和分析数据,从而做出更好更快的决策。