随着云计算、大数据和人工智能等信息技术的快速发展,各行业数字化水平逐步提高,企业业务环境和计算场景日益复杂,数据间的关联关系也正在变得更加交错。
图结构数据凭借对关联关系的强刻画能力,迅速脱颖而出。图计算主要分别为图数据库和图计算系统,那它们分别的发展历程是如何的呢?
20世纪60年代
图数据库最早可追溯到 20 世纪 60 年代面向树状结构的数据库,如 IBM 的 IMS;20世纪 70-80 年代出现面向属性图的模型和技术,如 LDM(逻辑数据模型),ERDiagram 等。
2007年
数据库市场中仍以关系型数据库为主,但非关系型的 NoSQL 数据库已开始发展。2007 年,第一款商用图数据库 Neo4j 公司成立,开始采用原生图存储模式,为单机部署模式。
2010年
大规模分布式架构、多模态支持、图查询语言设计等图数据库研究方向开始受到关注;市场中以海外厂商及其产品为主,除了最早的 Neo4j 外,还出现了 OrientDB、ArangoDB 等。
2015年到现在
行业入局者迅速增加,海外传统数据库和公有云厂商开始切入图数据库市场,如Oracle、AWS 等。中国公有云厂商如蚂蚁、腾讯等开始进入,同时也出现了如创邻科技、欧若数网等图数据库初创企业。
21世纪初
早期图计算问题规模相对较小,尚未有专门针对大型图计算的系统出现。
这一阶段主要的解决方案包括 1)单机图算法库 , 如 Boost 的 BGL 、 StandfordGraphBase 等 ; 2 ) 通用分布式计算平台 , 如MapReduce 等;3)并行图计算库,如 PBGL;4)针对具体问题定制架构等。但这些解决方案在数据规模、性能、易用性、容错性等方面尚有许多不足之处。
2010年
Google 于 2010 年提出 Pregel,一个针对图算法特点设计的分布式图计算系统,遵循 BSP 运算模型;之后 CMU Select 实验室 GraphLab 项目组提出了GAS 运算模型。Pregel 和 GraphLab 对后续其他图计算系统的设计产生了深远的影响。这一阶段市场参与者以海外巨头及高校实验室等为主。
2015年
随着数据量级迅速增长,应用市场逐渐打开,对图计算系统扩展性和效率需求不断提高。中国图计算领域学术界和产业界研究开始逐渐发力,发布自己的 图 计 算 系 统 和 平 台 ,比如如 清 华 大 学 的 Gemini(OSDI 2016)、蚂蚁的 TuGraph、腾讯的 Plato、阿里的 GRAPE 等。
随着 5G 、物联网、人工智能等数字化技术的驱动,企业数据正在呈爆发式增长,数据间的关联复杂度剧增。传统关系型数据库在处理这些复杂关联数据时效率较低且很难获得实时的洞察,企业很难进一步挖掘海量关系数据背后的价值。
因此图计算的重要性显得越来越重要。