博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
企业级大数据平台构建
阅读量:6859 次
发布时间:2019-06-26

本文共 1109 字,大约阅读时间需要 3 分钟。

一、平台基本功能

1. 数据接入

2. 数据存储和查询,存储模型应包括关系型模型,非关系型模型,文档模型等。

3. 数据计算,包括离线批处理,实时计算,机器学习,多维分析和全文检索。

4. 平台安全与管理,解决用户管理,数据隔离,访问授权,访问控制和集群服务安全等问题。

5. 平台辅助工具,如程序开发套件,任务管理,与调度系统,自助式数据探索分析系统。

二、集群服务器的角色分类

1. 主控节点

定义:不承担具体的数据存储和计算工作,而是负责全局统筹的任务分配,资源调配或是平衡集群负载,角色包括NameNode,HMaster,ResourceManager等。

2. 存储和计算节点

如Datenode,RegionServer和NodeManger等

3. 安全认证和管理节点

定义:负责集群的安保和管理工作。如kerberos协议的认证中心服务,cloudera manager,Ambari等。

4. 协同管理与其他节点

负责服务进程之间的交互和协同,例如心跳检查,配置同步,主控服务选举等,如zookeeper等。

 三、构建企业级平台安全方案

1. 访问控制(Knox)

为保护平台中原生的web UI控制台和RESTful服务,我们引入一种使用HTTPS协议的代理网管系统。思路为:

1)通过防火墙将集群内hadoop系统相关的端口全部屏蔽,只保留代理网关访问端口。

2)用户对大数据平台内所有hadoop系统原生Web UI控制台和RESTful服务的访问都要经过网关进行代理访问,访问协议从HTTP升级到?HTTPS。

3)当用户通过代理网关访问服务的时候要求在网关处进行用户认证,只有认证通过的用户才能继续访问。

为此引入Knox技术,Apache Knox Gateway是一款用于保护Hadoop生态体系安全的代理网关系统,为hadoop集群提供唯一的代理入口。

2. 数据授权与管理(Ranger)

为保护大数据平台中的数据资源和系统资源,引入授权系统,集成所有子系统的权限管理功能,并提供统一的授权界面。Apache Ranger提供一个集中式安全管理框架,它可以对生态的组件如,Hbase进行细粒度的数据访问控制.通过操作Ranger控制台,管理员可以轻松的通过配置策略来控制用户访问HDFS文件夹、HDFS文件、、表、字段权限.这些策略可以为不同的用户和组来设置,同时权限可与hadoop无缝对接.同时提供审计日志的功能,包括访问日志,管理员日志,登录会话日志和插件日志等。

3. 

 

转载于:https://www.cnblogs.com/duaner92/p/9665240.html

你可能感兴趣的文章
CCEditBox/CCEditBoxImplAndroid
查看>>
TCP/IP协议栈--IP首部选项字段的分析
查看>>
Kubuntu 初始配置
查看>>
python中列表和元组的操作(结尾格式化输出小福利)
查看>>
用过的一些服务器集成软件
查看>>
一键拨打
查看>>
20120522:ERROR - ORA-12514: TNS: 监听程序当前无法识别连接描述符中请求的服务
查看>>
Maven构建war项目添加版本号
查看>>
更新 手淘 flexible 布局 rem 单位适配问题
查看>>
第三次作业
查看>>
新浪微博登录接口实例
查看>>
wcf技术剖析_会话
查看>>
AngularJS 指令的 Scope (作用域)
查看>>
gitlab的使用
查看>>
iOS 生成本地验证码
查看>>
找不到 javax.servlet.http.HttpServletResponse 和 javax.servlet.http.HttpServletRequest 问题解决...
查看>>
Flip Game(枚举)
查看>>
WebWorker与WebSocket实现前端消息总线
查看>>
Selector
查看>>
Unity 2018.3.1 SyncVar没有同步服务器变量
查看>>