Course Code:
janusgraph
Duration:
14 hours
Prerequisites:
- 对数据库的理解
- 使用Linux命令行的经验
目标受众
- 开发人员
- 系统管理员
- 处理数据的工程师
Overview:
JanusGraph 是一个图数据库,用于存储和查询包含数千亿个顶点和边的图,这些图分布在多机集群中。
本课程为讲师指导的培训(线上或线下),面向希望使用 JanusGraph 处理需要异常存储和计算能力的超大规模图的工程师。
在培训结束时,参与者将能够:
- 安装和配置 JanusGraph。
- 将 JanusGraph 与多个后端存储系统(Cassandra、HBase 等)和多个索引软件(Elasticsearch、Solr 等)集成。
- 将多台机器配置为集群以供 JanusGraph 使用。
- 使用 Gremlin 查询语言查询数据库。
- 处理超出单机能力范围的大规模图数据。
- 支持数千名并发用户实时遍历图数据。
- 查询图数据以进行分析。
课程形式
- 互动式讲座和讨论。
- 大量练习和实践。
- 在实时实验环境中进行实践操作。
课程定制选项
- 如需为本课程定制培训,请联系我们进行安排。
Course Outline:
简介
JanusGraph 功能与架构概览
环境设置
JanusGraph 如何存储与分发数据
根据 CAP 定理(C=一致性, A=可用性, P=分区容忍性)规划 Database
安装与配置 JanusGraph 伺服器
将 JanusGraph 与 Casandra 整合
将 JanusGraph 与 HBase 整合
与伺服器连接(gremlin 控制台、gremlin python 和 graphexp)
查询 Database
使用 Gremlin 图遍历语言分析图数据
将领域建模为图
使用 Elasticsearch、Apache Solr 或 Apache Lucene 启用搜寻功能
数据可视化
与 Apache Spark 整合以分析全局图数据(OLAP)
将 JanusGraph 与第三方存储适配器整合
故障排除
总结与结论
Sites Published: