好得很程序员自学网

<tfoot draggable='sEl'></tfoot>

Greenplum数据库

Greenplum数据库

Greenplum

 

目录

公司简介 Greenplum在中国独立运营 目标和宗旨 Greenplum软件的性能优势

展开

 

编辑本段 公司简介    Greenplum 是一家总部位于 美国加利福尼亚州 ,为全球大型企业用户提供新型企业级数据仓库(EDW)、企业级数据云(EDC)和商务智能(BI)提供解决方案和咨询服务的公司,在全球已有: 纳斯达克 , 纽约证券交易所 , Skype . FOX, T-Mobile ; 中国 已有: 中信实业银行 , 东方航空公司 , 阿里巴巴 , 华泰保险 , 中国远 洋 ( Cosco ), 李宁公司 等大型企业用户选择 Greenplum 的产品。

 

  

greenplum

[1]

  MPP 系统!

 

   Greenplum 的架构采用了 MPP (大规模并行处理)。在 MPP 系统中,每个 SMP 节点也可以运行自己的 操作系统 、数据库等。换言之,每个节点内的 CPU 不能访问另一个节点的内存。节点之间的信息交互是通过节点互联网络实现的,这个过程一般称为 数据重分配 ( Data Redistribution ) 。与传统的SMP架构明显不同,通常情况下,MPP系统因为要在不同处理单元之间传送信息,所以它的效率要比SMP要差一点,但是这也不是绝对的,因为 MPP系统不共享资源,因此对它而言,资源比SMP要多,当需要处理的事务达到一定规模时,MPP的效率要比SMP好。这就是看通信时间占用计算时间的比例而定,如果通信时间比较多,那MPP系统就不占优势了,相反,如果通信时间比较少,那MPP系统可以充分发挥资源的优势,达到高效率。当前使用的 OLTP程序中,用户访问一个中心数据库,如果采用SMP系统结构,它的效率要比采用MPP结构要快得多。而MPP系统在决策支持和数据挖掘方面显示了优势,可以这样说,如果操作相互之间没有什么关系,处理单元之间需要进行的通信比较少,那采用MPP系统就要好,相反就不合适了。

 

  名字来源呢

 

   Greenplum 的大中华区 总裁 Stanley Chen 告诉我们:“ Greenplum 这个名字是一个7岁小女孩无意中脱口而出的。”起初几个创始人在斟酌公司名字的时候都很没头绪,于是他们去问了朋友的孩子,一个年仅7岁的可爱小姑娘告诉他们叫“ Apple ”,但是爸爸告诉他,这个名字已经被别人用了,还有其他的么?很快孩子变随口说了“ Greenplum ”,于是“ Greenplum ”公司的名字就这样诞生了。

 

编辑本段 Greenplum在中国独立运营    Greenplum 于 2008年12月 进入 中国市场 ,经过一年多的开拓, 2010年1月1日 Greenplum 正式宣布在中国独立运营,并任命 Stanley Chew 先生为 Greenplum 大中华区 总裁 职务, Stanley Chew 先生在IT行业从业25年以上,曾在Oracle公司工作16年担任亚太区副总裁。 Stanley Chew 总裁将管理和运营 Greenplum 在大中华区的业务, Greenplum 公司将为大中华区的企业级用户提供世界领先的数据仓库解决方案和服务。 Greenplum 在中国迅速而高效的适应能力已经彰显了其卓越的实力,宣布在中国的独立运营展示了 Greenplum 对中国市场的信心,也体现了 Greenplum 描绘中国市场宏伟蓝图的决心,也预示着新一代超级数据引擎 Greenplum 在中国市场的无限前景。

 

编辑本段 目标和宗旨   公司 专注 于 OLAP系统数据引擎开发 ,有世界级的研发团队进行高性能计算和 数据库系统 的前沿开发工作, 宗旨 是向客户提供高性能的超级数据引擎,并将强大的并行计算能力融入到大规模数据仓库分析领域中。公司具有发展趋势超前的视野和洞察力,为全球很多最大规模的数据仓库提供推动力;公司最先将SQL和 Map Reduce 的功能整合到统一的数据处理框架中。

 

   Greenplum 中国公司拥有一支具备丰富行业经验的销售和技术团队,具备金融、电信、政府、互联网等等行业的数据仓库项目行业经验,专注于推动 Greenplum 在数据仓库分析领域的应用,为客户实现投资回报、价值增长。

 

编辑本段 Greenplum软件的性能优势

支持海量数据存储和处理   当今是个数据不断膨胀的时代,数据量从过去的MB->GB->TB增长到现在的PB级数据规模,传统的OLTP数据库在TB级别以上数据管理中已经是捉襟见肘,采取MPP架构的数据库系统才能对海量数据进行管理。

 

   Greenplum 支持50PB(1PB=1000TB)级海量数据的存储和处理, Greenplum 将来自不同源系统的、不同部门、不同平台的数据集成到数据库中集中存放,并且存放详尽历史的数据轨迹,业务用户不用再面对一个又一个信息孤岛,也不再困惑于不同版本数据导致的偏差,同时对于IT人员也降低管理维护工作的复杂度。

高并发支持   随着商业智能在企业内的快速发展,BI 用户对信息分析平台的访问频率和查询复杂度也快速提升,因此要求相应的数据库系统对高并发查询进行支持。 Greenplum 利用强大并行处理能力提供并发支持。

 

   Greenplum 提供资源管理功能 (workload managemnt )来管理 数据库 资源,利用资源队列管理可实现按用户组的进行资源分配,如 Session 同时激活数、最大资源值等。通过资源管理功能,可以按用户级别进行资源分配和管理用户SQL查询优先级别,同时也能防止低质量SQL(如没有条件的多表join等)对 系统资源 的消耗。

支持线性扩展    Greenplum 采用MPP并行处理架构,在MPP架构中增加节点就可以线性提高系统的存储容量和处理能力。 Greenplum 在扩展节点时操作简单,在很短时间内就能完成数据的重新分布。

 

   Greenplum 线性扩展支持为数据分析系统将来的拓展给予了技术上的保障,用户可根据实施需要进行容量和性能的扩展。

高性价比    Greenplum 数据库软件系统节点基于业界各种开放式硬件平台,如SUN/HP/DELL等厂商的PC Server等,在普通的x86 Server上就能达到很高的性能,因此性价比很高,相比于其他封闭式数据仓库专用系统, Greenplum 每TB的投资是前者的1/5甚至更低。同样, Greenplum 产品的维护成本相比同类厂商也低许多。

支持Just In Time BI   我们面对的是一个瞬息变化的市场,谁能首先感知到市场的需求和变化,就能在竞争中先行一步,获得主动权,在竞争中 立于不败之地 。

 

   Greenplum 通过准实时、实时的数据加载方式,实现数据仓库的实时更新,进而实现动态数据仓库(ADW)。基于动态数据仓库,业务用户能对当前业务数据进行BI实时分析-“Just In Time BI”,能够让企业敏锐感知市场的变化,加快决策支持反应速度。

高可用性支持    Greenplum 是高可用的系统,在已有案例中最多使用了96台机器的集群MPP环境。除了硬件级的Raid技术外, Greenplum 还提供数据库层 Mirror 机制保护,即每个节点数据在另外的节点中同步 镜像 ,单个节点的错误不影响整个系统的使用。

 

  对于主节点, Greenplum 提供 Master/Stand by 机制进行主节点容错,当主节点发生错误时,可以切换到Stand by节点继续服务。

系统易用性    Greenplum 产品是基于流行的 PosgreSQL 之上开发,几乎所有的 PostgreSQL 客户端 工具及 PostgreSQL 应用都能运行在 Greenplum 平台上,在 Internet 上有着丰富的PostgreSQL资源供用户参考。

 

  最新进展

 

  Greenplum 被EMC公司收购,将其整合到EMC 云计算战略中。

 

 

 

参考资料 1

greenplum   

作者: Leo_wl

    

出处: http://www.cnblogs.com/Leo_wl/

    

本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

版权信息

查看更多关于Greenplum数据库的详细内容...

  阅读:50次