Cloudera認證CDP管理員( CDP Aministrator)
發布日期:
2017/8/4 15:13:32
課程大綱
一、Cloudera Data Platform (CDP)
1、大數據行業趨勢
2、成為數據驅動的挑戰
3、企業數據云
4、CDP 概述
5、CDP 產品介紹
二、CDP 私有云基礎版安裝
1、安裝概述
2、Cloudera Manager 安裝
3、CDP Runtime 概述
三、集群配置
1、概述
2、配置設置
3、修改服務配置
4、配置文件
5、管理角色實例
6、添加新服務
7、添加和刪除主機
四、數據存儲
1、概述
2、HDFS 拓撲和角色
3、HDFS 性能和容錯
4、HDFS 和 Hadoop 安全概述
5、使用 HDFS
6、HBase 概述
7、Kudu 概述
五、數據攝取
1、數據攝取概述
2、文件格式
3、使用文件傳輸或 REST 接口攝取數據
4、使用 Apache Sqoop 從關系數據庫導入數據
5、使用 NiFi 攝取數據
6、導入數據的最佳做法
六、數據流
1、數據流管理和 NiFi 概述
2、NiFi 架構
3、Cloudera 邊緣數據流管理和 MiNiFi
4、控制器服務
5、Apache Kafka 概述
6、Apache Kafka 群集架構
7、Apache Kafka 命令行工具
七、數據訪問與發現
1、Apache Hive
2、Apache Impala
3、Apache Impala 調優
4、Search 概述
5、Hue 概述
6、管理和配置 Hue
7、Hue 認證和授權
8、CDSW 概述
八、數據計算
1、YARN 概述
2、在 YARN 上運行應用程序
3、查看 YARN 應用程序
4、YARN 應用程序日志
5、MapReduce 應用程序
6、YARN 內存和 CPU 設置
7、Tez 概述
8、Hive on Tez
9、ACID for Hive
10、Spark 概述
11、Spark 應用如何運行在 YARN 上
12、監控 Spark 應用
13、Phoenix 概述
九、管理資源
1、使用 CPU 調度配置 cgroup
2、容量計劃程序
3、管理隊列
4、Impala 查詢調度
十、規劃集群
1、總體規劃考慮因素
2、選擇正確的硬件
3、網絡考慮因素
4、CDP 私有云考慮因素
5、配置節點
十一、集群高級配置
1、配置服務端口
2、調優 HDFS 和 MapReduce
3、管理集群增長
4、刪除編碼
5、啟用 HDFS 高可用性
十二、集群維護
1、檢查 HDFS 狀態
2、在集群之間復制數據
3、在 HDFS 中重新平衡數據
4、HDFS 目錄快照
5、主機維護
6、升級一個集群
十三、集群監控
1、Cloudera Manager 監控功能
2、健康測試
3、事件和預警
4、圖表和報告
5、監控建議
十四、群集故障排除
1、概述
2、故障排除工具
3、錯誤配置示例
十五、安全
1、使用 SDX 進行數據治理
2、Hadoop 的安全概念
3、使用 Kerberos 的 Hadoop 身份驗證
4、Hadoop 授權
5、Hadoop 加密
6、保護 Hadoop 群集
7、Apache Ranger
8、Apache Atlas
9、備份和恢復
十六、私有云 / 公共云
1、CDP 概述
2、私有云功能
3、公共云功能
4、什么是 Kubernetes
5、WXM 概述
6、自動縮放
課程周期:
24課時(45分/課時)
無標題文檔