博客
关于我
apache Atlas 1.2.0 搭建以及hive的集成
阅读量:564 次
发布时间:2019-03-09

本文共 1578 字,大约阅读时间需要 5 分钟。

Apache Atlas 1.2.0 安装入门指南

1. 环境搭建与源码下载

1.1 下载镜像与解压

通过选择适合的镜像获取 Apache Atlas 1.2.0 源码包,并上传至您的 Linux环境下进行解压:

tar -zxvf apache-atlas-1.2.0-sources.tar.gz

解压后即可获得 Atlas 源码目录。

1.2 环境要求

  • Java 1.8:确保 Java 发行版为 1.8。
  • Maven 3.5以上:用于编译源码。
  • Node.js:节点包可能在构建过程中进行使用。

1.3 编译源码

进入 Atlas 源码目录,使用 Maven 进行编译:

mvn clean -DskipTests package -Pdist,embedded-hbase-solr

编译完成后,目标文件会出现在:

/export/servers/apache-atlas-sources-1.2.0/distro/target

2. 配置与环境设置

2.1 核心配置文件解析

修改 atlas-application.properties 配置文件,根据需求调整以下参数:

  • 存储后端配置
    atlas.graph.storage.backend=hbaseatlas.graph.storage.hbase.table=apache_atlas_janusatlas.graph.storage.hostname=localhost
  • HBase配置
    atlas.graph.storage.hbase.regions-per-server=1
  • 通知配置
    atlas.notification.embedded=true

2.2 集成Hive的配置

修改 hive-site.xml 添加 Atlas 插件:

hive.exec.post.hooks
org.apache.atlas.hive.hook.HiveHook

更新 hive-env.sh 文件,添加 HIVE_AUX_JARS_PATH:

export HIVE_AUX_JARS_PATH=/export/servers/apache-atlas-sources-1.2.0/distro/target/apache-atlas-1.2.0-server/apache-atlas-1.2.0/hook/hive

3. 启动服务

启动 Atlas 服务:

Renderer报错是因为缺少某些 Jackson 包,建议手动获取并部署:```bashscp -r hive root@node02:/export/servers/apache-atlas-sources-1.2.0/distro/target/apache-atlas-1.2.0-server/apache-atlas-1.2.0/hook/scp

重启 Hive 后,导入历史数据:

./import-hive.sh

验证服务状态,确保 HBase 和 Solr 正常运行。

Hive 集成详解

5.1 listener机制原理

Atlas通过监听 Hive 的 DDL、DML 事件,构建实体间的血缘关系。

5.2 plug-in开发与部署

修改 hive-site.xml,添加自定义 Hook 插件,确保路径正确。

5.3 数据导入与验证

输入默认账户密码,完成数据导入后,访问 Atlas WebUI 查看数据。

5.4 血缘关系可视化

通过 UI 查看实体间的血缘关系和操作历史,定位数据来源和流向。

通过以上步骤,您可以成功搭建并集成 Apache Atlas 1.2.0 与 Hive,实现元数据管理与数据资产价值提升。

转载地址:http://amvpz.baihongyu.com/

你可能感兴趣的文章
Objective-C实现conjugate gradient共轭梯度算法(附完整源码)
查看>>
Objective-C实现coulombs law库仑定律算法(附完整源码)
查看>>
Objective-C实现data transformations数据转换算法(附完整源码)
查看>>
Objective-C实现DBSCAN聚类算法(附完整源码)
查看>>
Objective-C实现DBSCAN聚类算法(附完整源码)
查看>>
Objective-C实现degreeToRadian度到弧度算法(附完整源码)
查看>>
Objective-C实现depth first search深度优先搜索算法(附完整源码)
查看>>
Objective-C实现des文件加密算法(附完整源码)
查看>>
Objective-C实现Diffie-Hellman算法(附完整源码)
查看>>
Objective-C实现Dijkstra最小路径算法(附完整源码)
查看>>
Objective-C实现dijkstra银行家算法(附完整源码)
查看>>
Objective-C实现Dinic算法(附完整源码)
查看>>
Objective-C实现disjoint set不相交集算法(附完整源码)
查看>>
Objective-C实现DisjointSet并查集的算法(附完整源码)
查看>>
Objective-C实现djb2哈希算法(附完整源码)
查看>>
Objective-C实现DNF排序算法(附完整源码)
查看>>
Objective-C实现doomsday末日算法(附完整源码)
查看>>
Objective-C实现double factorial iterative双阶乘迭代算法(附完整源码)
查看>>
Objective-C实现double factorial recursive双阶乘递归算法(附完整源码)
查看>>
Objective-C实现double hash双哈希算法(附完整源码)
查看>>