作者:谷峪、于戈、鲍玉斌
定价:58
印次:1-1
ISBN(咨询特价)
出版日期:2015.(咨询特价)
印刷日期:2015.(咨询特价)
内容介绍:
随着以社交网络为代表的图数据规模高速增长,复杂的查询需求不断涌现,处理这类大规模数据有许多理论问题需要解决。本书结合作者多年的研究积累,系统地介绍了大图分布式处理中基础的数据划分、组织和消息管理技术,以及三角形、最大k边连通子图、最小生成树、频繁子图、重叠社区发现等大图查询和分析算法的优化,并对系统实现技术进行了探讨。 本书适合高等院校计算机专业的教师、学生及计算机应用系统的研发人员阅读参考。本书封面贴有清华大学出版社防伪标签,无标签者不得销售。
目录:
第1章大规模图数据处理: 问题与挑战
1.1大图数据处理的背景
1.2图数据的表示
1.3传统的大图数据管理方法
1.4云计算环境处理大图数据的优势
1.5新型大图计算系统面临的挑战
1.6关键技术问题
第2章大图分布式处理的计算模型和执行机制
2.1大图分布式处理的基本计算框架
2.1.1基于MapReduce的计算框架
2.1.2基于BSP的计算框架与GAS模型
2.1.3MapReduce与BSP对比
2.1.4其他处理框架
2.2图查询处理的遍历模式
2.2.1以顶点为中心
2.2.2以子图为中心
2.2.3以边和路径为中心
2.3消息通信
2.3.1消息发送时序控制
2.3.2消息交换模式
2.3.3网络通信平台
2.3.4上层消息优化技术
2.4同步控制
2.4.1同步模式
2.4.2异步模式
2.4.3混合模式
2.4.4跨步模式
2.5容错管理
2.5.1故障恢复技术
2.5.2故障侦测技术
2.6任务调度
2.7可扩展性
第3章大图数据划分技术
3.1图数据划分技术综述
3.1.1离线划分算法
3.1.2在线划分算法
3.1.3动态划分算法
3.2大图划分定义
3.2.1处理流程和定义
3.2.2真实图的局部性分析
3.3OnFlyP划分算法
3.3.1Range划分
3.3.2OnFlyP划分
3.3.3负载均衡控制机制
3.3.4计算接口描述
3.3.5动态调整机制
3.4性能评价
3.5小结
第4章大图数据分布式存储与索引技术
4.1大图数据的存储索引技术...