Greenplum分布式大數據實戰(zhàn)培訓
培訓班型: 企業(yè)內訓、公開課
課程長度: 3天/18小時
培訓講師: 博學高級講師
培訓地點: 杭州市文三路252號偉星大廈19樓博學教育
環(huán)境要求: 投影儀、白板、大白紙
培訓形式: 實例講授,現場演、練、及時溝通
培訓資料: 培訓教材
課程內容
Greenplum:Greenplum誕生于2003年硅谷,2010/07 EMC收購了GREENPLUM,并把GREENPLUM作為EMC面向分析云的戰(zhàn)略核心產品,加以大力發(fā)展。該產品不僅在國際市場發(fā)展很快,在國內市場發(fā)展也很快。最著名的案例就是阿里巴巴集團,經過多種產品的精心選型,最終選擇GREENPLUM作為它們的數據倉庫平臺存放數百TB的業(yè)務數據去高效支持各種分析應用。正是由于產品發(fā)展速度很快,但是在相關人才上存在很大缺口。
課程描述:本課程全面深入地介紹了Greenplum數據庫的方方面面,包括架構特性、部署、理、開發(fā)和調優(yōu)等,由淺入深,理論結合實戰(zhàn),讓同學全面徹底掌握這把大數據利劍。
培訓對象:本課程適合于有對數據庫和sql語句有一定了解,熟練使用linux系統(tǒng)的技術人員,特別適合于想換工作或尋求高薪職業(yè)的人士。
課程目標:課程結束時,幫助學員實現如下目標:
1、了解Greenplum的歷史及目前發(fā)展的現狀、以及它們的技術特點,從而把握分布式計算框架及未來發(fā)展方向,在大數據時代能為企業(yè)的技術選型及架構設計提供決策參考。
2、深入理解Greenplum的技術核心和管理操作,以此為基礎,進而掌握MPP架構數據庫的使用和調優(yōu)的思想。
課程大綱:
1. Greenplum 概述
Greenplum 數據庫架構和模塊
數據冗余模塊
數據監(jiān)控模塊
2. 分布式數據和查詢處理
分布式表結構
3. 并行查詢規(guī)劃和執(zhí)行
硬件設置
軟件設置考慮
存儲考慮
OS考慮
硬件優(yōu)化
4. 數據庫內部機制
System Catalog Table
數據庫物理存儲
數據庫進程介紹
5. 安裝和初始化
安裝介紹
環(huán)境設置
數據庫初始化
軟件更新
6. Postgres PSQL
連接數據庫
運行SQL語句
PSQL 命令
怎樣設置參數
怎樣查看參數
pg_hba.conf 配置文件
7. DDL 語句
Database
Schema
Table
Data Type
Constraints
其他數據庫對象
8. 角色授權介紹
數據庫用戶
數據庫群組
數據庫授權
資源隊列和工作負載管理
9. 表操作
表分區(qū)
怎樣分區(qū)一個表
AO表
10. 數據加載
外表
GPfdist和GPload
Copy
數據加載性能
11. 性能調優(yōu)
性能調優(yōu)考慮
常見問題
硬件問題
資源規(guī)劃問題
數據庫統(tǒng)計
12. 數據分布
數據庫設計
數據鎖
PSQL調優(yōu)
13. 數據庫管理
啟停數據庫服務
監(jiān)控系統(tǒng)狀態(tài)
檢查數據斜交
檢查磁盤空間使用
Log 文件
Vacuum
Analyze
Reindex
14. 容錯和高可用
主 Segment
鏡像Segment
15. 故障檢測和恢復
備用 Master
16. 備用和恢復
備份數據
恢復數據
自動備份
17. Greenplum技術實戰(zhàn)