Pentaho 开发商近日开源了部分数据集成软件,并将整个 Kettle 数据集成平台移植到 Apache 2.0 许可证下,以便从目前蓬勃发展的 Hadoop 和 NoSQL 业务中得到更多的份额,从而奠定其在大数据市场的地位。

Pentaho 是目前世界上最流行的开源商务智能(Business Intelligence,BI)解决方案。它是一个基于 Java 平台的 BI 套件,包括一个 Web Server 平台和几个工具软件:报表、分析、图表、数据集成、数据挖掘等工具,可以说包括了商业智能的方方面面。Pentaho BI 提供了社区套件和企业套件两个版本,社区版完全免费。
Kettle 是 Pentaho 的一个重要组成部分,是一个 ETL(Extraction-Transformation-Loading,数据提取、转换和加载)工具,允许用户管理来自不同数据库的数据,通过提供一个图形化的环境来描述你想做什么,而不是你想怎么做。
据 Pentaho 称,此次 Kettle 项目中被开源的软件的大数据功能包括“可以对以下 Hadoop 和 NoSQL 数据库中的数据进行输入、输出、处理和报告操作:Cassandra、Hadoop HDFS、Hadoop MapReduce、Hadapt、HBase, Hive、HPCC Systems 和 MongoDB”。与这些功能相比,传统的关系型数据库和相关工具的大数据集处理能力明显不足。
Pentaho 称,此次基于 Apache 许可证开源数据集成产品,将会显著提升开发者、分析师和数据科学家的效率,并促使他们成功。
Pentaho 大数据社区主页:http://wiki.pentaho.com/display/BAD/Pentaho+Big+Data+Community+Home
Via Zdnet
» 下一篇:Meundies今天正式上线:每月支付一定的费用,Meundies会给你寄去你所钟爱的内裤(2012-02-10 13:54)
