投递人 itwriter 发布于 2012-02-10 13:49 评论(0) 有354人阅读  原文链接  [收藏]  « »

  Pentaho 开发商近日开源了部分数据集成软件,并将整个 Kettle 数据集成平台移植到 Apache 2.0 许可证下,以便从目前蓬勃发展的 Hadoop 和 NoSQL 业务中得到更多的份额,从而奠定其在大数据市场的地位。

  Pentaho 是目前世界上最流行的开源商务智能(Business Intelligence,BI)解决方案。它是一个基于 Java 平台的 BI 套件,包括一个 Web Server 平台和几个工具软件:报表、分析、图表、数据集成、数据挖掘等工具,可以说包括了商业智能的方方面面。Pentaho BI 提供了社区套件和企业套件两个版本,社区版完全免费。

  Kettle 是 Pentaho 的一个重要组成部分,是一个 ETL(Extraction-Transformation-Loading,数据提取、转换和加载)工具,允许用户管理来自不同数据库的数据,通过提供一个图形化的环境来描述你想做什么,而不是你想怎么做。

  据 Pentaho 称,此次 Kettle 项目中被开源的软件的大数据功能包括“可以对以下 Hadoop 和 NoSQL 数据库中的数据进行输入、输出、处理和报告操作:Cassandra、Hadoop HDFS、Hadoop MapReduce、Hadapt、HBase, Hive、HPCC Systems 和 MongoDB”。与这些功能相比,传统的关系型数据库和相关工具的大数据集处理能力明显不足。

  Pentaho 称,此次基于 Apache 许可证开源数据集成产品,将会显著提升开发者、分析师和数据科学家的效率,并促使他们成功。

  Pentaho 大数据社区主页:http://wiki.pentaho.com/display/BAD/Pentaho+Big+Data+Community+Home

  Via Zdnet

0
0
来自: www.iteye.com
博问,解决您的技术难题 分享到: 新浪微博 腾讯微博 搜狐微博
相关标签: Pentaho
还没有人对此新闻发表评论,第一个发表评论。