SlideShare a Scribd company logo
1 of 3
1
CÔNG TY
CÔNG NGHỆ THÔNG TIN VNPT
BAN NHÂN SỰ
Số: 47/CV-NS
V/v: Triệu tập học viên khóa học Cloudera
Developer Training for Apache Spark and
Hadoop
CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc
Hà Nội, ngày 08 tháng 07 năm 2021
Kính gửi: Các đơn vị trực thuộc Công ty
Triển khai kế hoạch đào tạo, bồi dưỡng đã được phê duyệt tại Quyết định số
129/QĐ-VNPT-IT-NS ngày 02/02/2021, Ban Nhân sự thông báo đến các đơn vị các
khóa học Cloudera Developer Training for Apache Spark and Hadoop:
1. Thời gian khóa học: 20-23/07/2021.
2. Địa điểm: Tp.Hà Nội
3. Nội dung khóa học: Chi tiết trong phụ lục
4. Phân bổ học viên: Kỹ sư lập trình, kỹ sư dữ liệu thuộc các đơn vị sau
STT Họ và tên Phân bổ
1 Trung tâm Sáng tạo 3
2 Trung tâm ERP 4
3 Trung tâm eHEALTH 4
4 Trung tâm eGOV 4
5 Trung tâm eEDU 3
6 Trung tâm SI 3
7 Trung tâm VNPT IT KV1 1
8 Trung tâm VNPT IT KV3 2
9 Trung tâm VNPT IT KV4 1
Tổng cộng 25
Các đơn vị gửi danh sách học viên (theo mẫu file excel gửi kèm) gửi email về
Ban Nhân sự chậm nhất ngày 12/07/2021, theo địa chỉ:
Ban Nhân sự: Chị Bùi Thị Nga, ĐT: 0915071081; Email: ngabui@vnpt.vn.
Trân trọng./.
Nơi nhận:
- Như trên;
- TGĐ & các P. TGĐ (để b/c)
- Lưu NS, VT, BTN.
Số EOF: 552905/VBĐT
TRƯỞNG BAN NHÂN SỰ
<Đã ký>
Hoàng Trung Hiếu
2
PHỤ LỤC: NỘI DUNG KHÓA HỌC
Introduction
Introduction to Apache Hadoop and
the Hadoop Ecosystem
 Apache Hadoop Overview
 Data Processing
 Introduction to the Hands-On
Exercises
Apache Hadoop File Storage
 Apache Hadoop Cluster
Components
 HDFS Architecture
 Using HDFS
Distributed Processing on an Apache
Hadoop Cluster
 YARN Architecture
 Working With YARN
Apache Spark Basics
 What is Apache Spark?
 Starting the Spark Shell
 Using the Spark Shell
 Getting Started with Datasets
and DataFrames
 DataFrame Operations
Working with DataFrames and
Schemas
 Creating DataFrames from Data
Sources
 Saving DataFrames to Data
Sources
 DataFrame Schemas
 Eager and Lazy Execution
Analyzing Data with DataFrame
Queries
 Querying DataFrames Using
Column Expressions
 Grouping and Aggregation
Queries
 Joining DataFrames
RDD Overview
 RDD Overview
 RDD Data Sources
 Creating and Saving RDDs
 RDD Operations
Transforming Data with RDDs
 Writing and Passing
Transformation Functions
 Transformation Execution
 Converting Between RDDs and
DataFrames
Aggregating Data with Pair RDDs
 Key-Value Pair RDDs
 Map-Reduce
 Other Pair RDD Operations
Querying Tables and Views with
SQL
 Querying Tables in Spark Using
SQL
 Querying Files and Views
 The Catalog API
Working with Datasets in Scala
 Datasets and DataFrames
 Creating Datasets
 Loading and Saving Datasets
 Dataset Operations
Writing, Configuring, and Running
Spark Applications
 Writing a Spark Application
 Building and Running an
Application
3
 Application Deployment Mode
 The Spark Application Web UI
 Configuring Application
Properties
Spark Distributed Processing
 Review: Apache Spark on a
Cluster
 RDD Partitions
 Example: Partitioning in
Queries
 Stages and Tasks
 Job Execution Planning
 Example: Catalyst Execution
Plan
 Example: RDD Execution Plan
Distributed Data Persistence
 DataFrame and Dataset
Persistence
 Persistence Storage Levels
 Viewing Persisted RDDs
Common Patterns in Spark Data
Processing
 Common Apache Spark Use
Cases
 Iterative Algorithms in Apache
Spark
 Machine Learning
 Example: k-means
Introduction to Structured
Streaming
 Apache Spark Streaming
Overview
 Creating Streaming DataFrames
 Transforming DataFrames
 Executing Streaming Queries
Structured Streaming with Apache
Kafka
 Overview
 Receiving Kafka Messages
 Sending Kafka Messages
Aggregating and Joining Streaming
DataFrames
 Streaming Aggregation
 Joining Streaming DataFrames
Conclusion
Message Processing with Apache
Kafka
 What Is Apache Kafka?
 Apache Kafka Overview
 Scaling Apache Kafka
 Apache Kafka Cluster
Architecture
 Apache Kafka Command Line
Tools

More Related Content

Similar to Đăng ký khóa học Spark and Hadoop.doc

Giải pháp VED - TNMT full.pptx
Giải pháp VED - TNMT full.pptxGiải pháp VED - TNMT full.pptx
Giải pháp VED - TNMT full.pptxVDI
 
Bài 4: Lập trình với CSDL ADO.NET & Kiến trúc không kết nối & Lập trình giao ...
Bài 4: Lập trình với CSDL ADO.NET & Kiến trúc không kết nối & Lập trình giao ...Bài 4: Lập trình với CSDL ADO.NET & Kiến trúc không kết nối & Lập trình giao ...
Bài 4: Lập trình với CSDL ADO.NET & Kiến trúc không kết nối & Lập trình giao ...MasterCode.vn
 
ITLC - Hanoi - NodeJS - ArrowJS - 27-11 - 2015
ITLC - Hanoi - NodeJS - ArrowJS - 27-11 - 2015ITLC - Hanoi - NodeJS - ArrowJS - 27-11 - 2015
ITLC - Hanoi - NodeJS - ArrowJS - 27-11 - 2015IT Expert Club
 
Designing websites in dreamweaver cs5
Designing websites in dreamweaver cs5Designing websites in dreamweaver cs5
Designing websites in dreamweaver cs5Phạm Tấn Duy
 
CVNguyenThanhLam-102015-Vi
CVNguyenThanhLam-102015-ViCVNguyenThanhLam-102015-Vi
CVNguyenThanhLam-102015-ViLam Nguyen
 
đồ áN thiết kế web tuyển dụng sử dụng asp.net
đồ áN thiết kế web tuyển dụng sử dụng asp.netđồ áN thiết kế web tuyển dụng sử dụng asp.net
đồ áN thiết kế web tuyển dụng sử dụng asp.netnataliej4
 
Linq n hibernate net-tier
Linq n hibernate net-tierLinq n hibernate net-tier
Linq n hibernate net-tierNguyen Tran
 
Bắt đầu nghiên cứu Big Data
Bắt đầu nghiên cứu Big DataBắt đầu nghiên cứu Big Data
Bắt đầu nghiên cứu Big DataHong Ong
 
Bao cao web cake php
Bao cao web cake phpBao cao web cake php
Bao cao web cake phplaonap166
 
Luận Văn Xây Dựng Trang Web Cho Hợp Tác Xã Nông Nghiệp Và Du Lịch Cộng Đồng C...
Luận Văn Xây Dựng Trang Web Cho Hợp Tác Xã Nông Nghiệp Và Du Lịch Cộng Đồng C...Luận Văn Xây Dựng Trang Web Cho Hợp Tác Xã Nông Nghiệp Và Du Lịch Cộng Đồng C...
Luận Văn Xây Dựng Trang Web Cho Hợp Tác Xã Nông Nghiệp Và Du Lịch Cộng Đồng C...sividocz
 
xây dựng và quản trị hệ thống mạng doanh nghiệp với microsoft active directory
xây dựng và quản trị hệ thống mạng doanh nghiệp với microsoft active directoryxây dựng và quản trị hệ thống mạng doanh nghiệp với microsoft active directory
xây dựng và quản trị hệ thống mạng doanh nghiệp với microsoft active directoryTran Minh Tuan
 
[123doc.vn] xay dung he thong mang cho doanh nhiep nho
[123doc.vn]   xay dung he thong mang cho doanh nhiep nho[123doc.vn]   xay dung he thong mang cho doanh nhiep nho
[123doc.vn] xay dung he thong mang cho doanh nhiep nhoNguyễn Quân
 

Similar to Đăng ký khóa học Spark and Hadoop.doc (20)

Giải pháp VED - TNMT full.pptx
Giải pháp VED - TNMT full.pptxGiải pháp VED - TNMT full.pptx
Giải pháp VED - TNMT full.pptx
 
Bài 4: Lập trình với CSDL ADO.NET & Kiến trúc không kết nối & Lập trình giao ...
Bài 4: Lập trình với CSDL ADO.NET & Kiến trúc không kết nối & Lập trình giao ...Bài 4: Lập trình với CSDL ADO.NET & Kiến trúc không kết nối & Lập trình giao ...
Bài 4: Lập trình với CSDL ADO.NET & Kiến trúc không kết nối & Lập trình giao ...
 
ITLC - Hanoi - NodeJS - ArrowJS - 27-11 - 2015
ITLC - Hanoi - NodeJS - ArrowJS - 27-11 - 2015ITLC - Hanoi - NodeJS - ArrowJS - 27-11 - 2015
ITLC - Hanoi - NodeJS - ArrowJS - 27-11 - 2015
 
Designing websites in dreamweaver cs5
Designing websites in dreamweaver cs5Designing websites in dreamweaver cs5
Designing websites in dreamweaver cs5
 
CVNguyenThanhLam-102015-Vi
CVNguyenThanhLam-102015-ViCVNguyenThanhLam-102015-Vi
CVNguyenThanhLam-102015-Vi
 
Tại sao nên chọn ngôn ngữ php
Tại sao nên chọn ngôn ngữ phpTại sao nên chọn ngôn ngữ php
Tại sao nên chọn ngôn ngữ php
 
Baocaonghiem
BaocaonghiemBaocaonghiem
Baocaonghiem
 
Thutap
ThutapThutap
Thutap
 
đồ áN thiết kế web tuyển dụng sử dụng asp.net
đồ áN thiết kế web tuyển dụng sử dụng asp.netđồ áN thiết kế web tuyển dụng sử dụng asp.net
đồ áN thiết kế web tuyển dụng sử dụng asp.net
 
Linq n hibernate net-tier
Linq n hibernate net-tierLinq n hibernate net-tier
Linq n hibernate net-tier
 
Arrowjs.io
Arrowjs.ioArrowjs.io
Arrowjs.io
 
Bắt đầu nghiên cứu Big Data
Bắt đầu nghiên cứu Big DataBắt đầu nghiên cứu Big Data
Bắt đầu nghiên cứu Big Data
 
Bao cao web cake php
Bao cao web cake phpBao cao web cake php
Bao cao web cake php
 
Code Camp #1
Code Camp #1Code Camp #1
Code Camp #1
 
Nutch
NutchNutch
Nutch
 
Luận Văn Xây Dựng Trang Web Cho Hợp Tác Xã Nông Nghiệp Và Du Lịch Cộng Đồng C...
Luận Văn Xây Dựng Trang Web Cho Hợp Tác Xã Nông Nghiệp Và Du Lịch Cộng Đồng C...Luận Văn Xây Dựng Trang Web Cho Hợp Tác Xã Nông Nghiệp Và Du Lịch Cộng Đồng C...
Luận Văn Xây Dựng Trang Web Cho Hợp Tác Xã Nông Nghiệp Và Du Lịch Cộng Đồng C...
 
C1
C1C1
C1
 
Csdl
CsdlCsdl
Csdl
 
xây dựng và quản trị hệ thống mạng doanh nghiệp với microsoft active directory
xây dựng và quản trị hệ thống mạng doanh nghiệp với microsoft active directoryxây dựng và quản trị hệ thống mạng doanh nghiệp với microsoft active directory
xây dựng và quản trị hệ thống mạng doanh nghiệp với microsoft active directory
 
[123doc.vn] xay dung he thong mang cho doanh nhiep nho
[123doc.vn]   xay dung he thong mang cho doanh nhiep nho[123doc.vn]   xay dung he thong mang cho doanh nhiep nho
[123doc.vn] xay dung he thong mang cho doanh nhiep nho
 

Recently uploaded

Catalogue Thiết bị vệ sinh American Standard mới nhất 2024.pdf
Catalogue Thiết bị vệ sinh American Standard mới nhất 2024.pdfCatalogue Thiết bị vệ sinh American Standard mới nhất 2024.pdf
Catalogue Thiết bị vệ sinh American Standard mới nhất 2024.pdfOrient Homes
 
CATALOG PANASONIC Pricelist 042024 - Vn.pdf
CATALOG PANASONIC Pricelist 042024 - Vn.pdfCATALOG PANASONIC Pricelist 042024 - Vn.pdf
CATALOG PANASONIC Pricelist 042024 - Vn.pdfOrient Homes
 
Trắc nghiệm khả năng lãnh đạo - Trắc nghiệm ngay!
Trắc nghiệm khả năng lãnh đạo - Trắc nghiệm ngay!Trắc nghiệm khả năng lãnh đạo - Trắc nghiệm ngay!
Trắc nghiệm khả năng lãnh đạo - Trắc nghiệm ngay!Uy Hoàng
 
CATALOG TB điện OPPLE 2023 CATALOGUE.pdf
CATALOG TB điện OPPLE 2023 CATALOGUE.pdfCATALOG TB điện OPPLE 2023 CATALOGUE.pdf
CATALOG TB điện OPPLE 2023 CATALOGUE.pdfOrient Homes
 
catalog Tiền Phong Bảng giá PPR 01.07.23.pdf
catalog Tiền Phong Bảng giá PPR 01.07.23.pdfcatalog Tiền Phong Bảng giá PPR 01.07.23.pdf
catalog Tiền Phong Bảng giá PPR 01.07.23.pdfOrient Homes
 
Catalogue gach Đồng Tâm DongVan_2023.pdf
Catalogue gach Đồng Tâm DongVan_2023.pdfCatalogue gach Đồng Tâm DongVan_2023.pdf
Catalogue gach Đồng Tâm DongVan_2023.pdfOrient Homes
 
HSNL HAPULICO 29.05.2023 (VI) đầy đủ.pdf
HSNL HAPULICO 29.05.2023 (VI) đầy đủ.pdfHSNL HAPULICO 29.05.2023 (VI) đầy đủ.pdf
HSNL HAPULICO 29.05.2023 (VI) đầy đủ.pdfOrient Homes
 
Bài tiểu luận môn Marketing dịch vụ Nghiên cứu hoạt động Marketing của doanh ...
Bài tiểu luận môn Marketing dịch vụ Nghiên cứu hoạt động Marketing của doanh ...Bài tiểu luận môn Marketing dịch vụ Nghiên cứu hoạt động Marketing của doanh ...
Bài tiểu luận môn Marketing dịch vụ Nghiên cứu hoạt động Marketing của doanh ...lamluanvan.net Viết thuê luận văn
 
Catalogue Thiết bị điện 2023 TNC .pdf
Catalogue Thiết bị điện 2023 TNC    .pdfCatalogue Thiết bị điện 2023 TNC    .pdf
Catalogue Thiết bị điện 2023 TNC .pdfOrient Homes
 
Catalog Sino - Den chieu sang 1 - 15012024.pdf
Catalog Sino - Den chieu sang 1 - 15012024.pdfCatalog Sino - Den chieu sang 1 - 15012024.pdf
Catalog Sino - Den chieu sang 1 - 15012024.pdfOrient Homes
 
Công cụ Trắc nghiệm tính cách MBTI miễn phí
Công cụ Trắc nghiệm tính cách MBTI miễn phíCông cụ Trắc nghiệm tính cách MBTI miễn phí
Công cụ Trắc nghiệm tính cách MBTI miễn phíUy Hoàng
 
Cataogue thiết bị vệ sinh inax 042024.NEW.pdf
Cataogue thiết bị vệ sinh inax 042024.NEW.pdfCataogue thiết bị vệ sinh inax 042024.NEW.pdf
Cataogue thiết bị vệ sinh inax 042024.NEW.pdfOrient Homes
 
Catalog Tiền phong Bảng giá PVC 01.07.23.pdf
Catalog Tiền phong Bảng giá PVC 01.07.23.pdfCatalog Tiền phong Bảng giá PVC 01.07.23.pdf
Catalog Tiền phong Bảng giá PVC 01.07.23.pdfOrient Homes
 
Catalog Karofi KTF - 888 brochure (4).pdf
Catalog Karofi KTF - 888 brochure (4).pdfCatalog Karofi KTF - 888 brochure (4).pdf
Catalog Karofi KTF - 888 brochure (4).pdfOrient Homes
 
Catalogue Van vòi Novo-Viettiep Chốt.pdf
Catalogue Van vòi Novo-Viettiep Chốt.pdfCatalogue Van vòi Novo-Viettiep Chốt.pdf
Catalogue Van vòi Novo-Viettiep Chốt.pdfOrient Homes
 
Tài liệu trắc nghiệm phong cách lãnh đạo
Tài liệu trắc nghiệm phong cách lãnh đạoTài liệu trắc nghiệm phong cách lãnh đạo
Tài liệu trắc nghiệm phong cách lãnh đạoUy Hoàng
 
Catalog Gạch Đồng Tâm TrangAn_2023.pdf
Catalog Gạch Đồng Tâm   TrangAn_2023.pdfCatalog Gạch Đồng Tâm   TrangAn_2023.pdf
Catalog Gạch Đồng Tâm TrangAn_2023.pdfOrient Homes
 
Catalog BG - ổ cắm, công tắc PK Sino.pdf
Catalog BG - ổ cắm, công tắc PK Sino.pdfCatalog BG - ổ cắm, công tắc PK Sino.pdf
Catalog BG - ổ cắm, công tắc PK Sino.pdfOrient Homes
 
Catalog Đen led Kingled - Kingeco 2024.pdf
Catalog Đen led Kingled - Kingeco 2024.pdfCatalog Đen led Kingled - Kingeco 2024.pdf
Catalog Đen led Kingled - Kingeco 2024.pdfOrient Homes
 
Catalogue thiết bị vệ sinh Viglacera 2024.pdf
Catalogue thiết bị vệ sinh Viglacera 2024.pdfCatalogue thiết bị vệ sinh Viglacera 2024.pdf
Catalogue thiết bị vệ sinh Viglacera 2024.pdfOrient Homes
 

Recently uploaded (20)

Catalogue Thiết bị vệ sinh American Standard mới nhất 2024.pdf
Catalogue Thiết bị vệ sinh American Standard mới nhất 2024.pdfCatalogue Thiết bị vệ sinh American Standard mới nhất 2024.pdf
Catalogue Thiết bị vệ sinh American Standard mới nhất 2024.pdf
 
CATALOG PANASONIC Pricelist 042024 - Vn.pdf
CATALOG PANASONIC Pricelist 042024 - Vn.pdfCATALOG PANASONIC Pricelist 042024 - Vn.pdf
CATALOG PANASONIC Pricelist 042024 - Vn.pdf
 
Trắc nghiệm khả năng lãnh đạo - Trắc nghiệm ngay!
Trắc nghiệm khả năng lãnh đạo - Trắc nghiệm ngay!Trắc nghiệm khả năng lãnh đạo - Trắc nghiệm ngay!
Trắc nghiệm khả năng lãnh đạo - Trắc nghiệm ngay!
 
CATALOG TB điện OPPLE 2023 CATALOGUE.pdf
CATALOG TB điện OPPLE 2023 CATALOGUE.pdfCATALOG TB điện OPPLE 2023 CATALOGUE.pdf
CATALOG TB điện OPPLE 2023 CATALOGUE.pdf
 
catalog Tiền Phong Bảng giá PPR 01.07.23.pdf
catalog Tiền Phong Bảng giá PPR 01.07.23.pdfcatalog Tiền Phong Bảng giá PPR 01.07.23.pdf
catalog Tiền Phong Bảng giá PPR 01.07.23.pdf
 
Catalogue gach Đồng Tâm DongVan_2023.pdf
Catalogue gach Đồng Tâm DongVan_2023.pdfCatalogue gach Đồng Tâm DongVan_2023.pdf
Catalogue gach Đồng Tâm DongVan_2023.pdf
 
HSNL HAPULICO 29.05.2023 (VI) đầy đủ.pdf
HSNL HAPULICO 29.05.2023 (VI) đầy đủ.pdfHSNL HAPULICO 29.05.2023 (VI) đầy đủ.pdf
HSNL HAPULICO 29.05.2023 (VI) đầy đủ.pdf
 
Bài tiểu luận môn Marketing dịch vụ Nghiên cứu hoạt động Marketing của doanh ...
Bài tiểu luận môn Marketing dịch vụ Nghiên cứu hoạt động Marketing của doanh ...Bài tiểu luận môn Marketing dịch vụ Nghiên cứu hoạt động Marketing của doanh ...
Bài tiểu luận môn Marketing dịch vụ Nghiên cứu hoạt động Marketing của doanh ...
 
Catalogue Thiết bị điện 2023 TNC .pdf
Catalogue Thiết bị điện 2023 TNC    .pdfCatalogue Thiết bị điện 2023 TNC    .pdf
Catalogue Thiết bị điện 2023 TNC .pdf
 
Catalog Sino - Den chieu sang 1 - 15012024.pdf
Catalog Sino - Den chieu sang 1 - 15012024.pdfCatalog Sino - Den chieu sang 1 - 15012024.pdf
Catalog Sino - Den chieu sang 1 - 15012024.pdf
 
Công cụ Trắc nghiệm tính cách MBTI miễn phí
Công cụ Trắc nghiệm tính cách MBTI miễn phíCông cụ Trắc nghiệm tính cách MBTI miễn phí
Công cụ Trắc nghiệm tính cách MBTI miễn phí
 
Cataogue thiết bị vệ sinh inax 042024.NEW.pdf
Cataogue thiết bị vệ sinh inax 042024.NEW.pdfCataogue thiết bị vệ sinh inax 042024.NEW.pdf
Cataogue thiết bị vệ sinh inax 042024.NEW.pdf
 
Catalog Tiền phong Bảng giá PVC 01.07.23.pdf
Catalog Tiền phong Bảng giá PVC 01.07.23.pdfCatalog Tiền phong Bảng giá PVC 01.07.23.pdf
Catalog Tiền phong Bảng giá PVC 01.07.23.pdf
 
Catalog Karofi KTF - 888 brochure (4).pdf
Catalog Karofi KTF - 888 brochure (4).pdfCatalog Karofi KTF - 888 brochure (4).pdf
Catalog Karofi KTF - 888 brochure (4).pdf
 
Catalogue Van vòi Novo-Viettiep Chốt.pdf
Catalogue Van vòi Novo-Viettiep Chốt.pdfCatalogue Van vòi Novo-Viettiep Chốt.pdf
Catalogue Van vòi Novo-Viettiep Chốt.pdf
 
Tài liệu trắc nghiệm phong cách lãnh đạo
Tài liệu trắc nghiệm phong cách lãnh đạoTài liệu trắc nghiệm phong cách lãnh đạo
Tài liệu trắc nghiệm phong cách lãnh đạo
 
Catalog Gạch Đồng Tâm TrangAn_2023.pdf
Catalog Gạch Đồng Tâm   TrangAn_2023.pdfCatalog Gạch Đồng Tâm   TrangAn_2023.pdf
Catalog Gạch Đồng Tâm TrangAn_2023.pdf
 
Catalog BG - ổ cắm, công tắc PK Sino.pdf
Catalog BG - ổ cắm, công tắc PK Sino.pdfCatalog BG - ổ cắm, công tắc PK Sino.pdf
Catalog BG - ổ cắm, công tắc PK Sino.pdf
 
Catalog Đen led Kingled - Kingeco 2024.pdf
Catalog Đen led Kingled - Kingeco 2024.pdfCatalog Đen led Kingled - Kingeco 2024.pdf
Catalog Đen led Kingled - Kingeco 2024.pdf
 
Catalogue thiết bị vệ sinh Viglacera 2024.pdf
Catalogue thiết bị vệ sinh Viglacera 2024.pdfCatalogue thiết bị vệ sinh Viglacera 2024.pdf
Catalogue thiết bị vệ sinh Viglacera 2024.pdf
 

Đăng ký khóa học Spark and Hadoop.doc

  • 1. 1 CÔNG TY CÔNG NGHỆ THÔNG TIN VNPT BAN NHÂN SỰ Số: 47/CV-NS V/v: Triệu tập học viên khóa học Cloudera Developer Training for Apache Spark and Hadoop CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do - Hạnh phúc Hà Nội, ngày 08 tháng 07 năm 2021 Kính gửi: Các đơn vị trực thuộc Công ty Triển khai kế hoạch đào tạo, bồi dưỡng đã được phê duyệt tại Quyết định số 129/QĐ-VNPT-IT-NS ngày 02/02/2021, Ban Nhân sự thông báo đến các đơn vị các khóa học Cloudera Developer Training for Apache Spark and Hadoop: 1. Thời gian khóa học: 20-23/07/2021. 2. Địa điểm: Tp.Hà Nội 3. Nội dung khóa học: Chi tiết trong phụ lục 4. Phân bổ học viên: Kỹ sư lập trình, kỹ sư dữ liệu thuộc các đơn vị sau STT Họ và tên Phân bổ 1 Trung tâm Sáng tạo 3 2 Trung tâm ERP 4 3 Trung tâm eHEALTH 4 4 Trung tâm eGOV 4 5 Trung tâm eEDU 3 6 Trung tâm SI 3 7 Trung tâm VNPT IT KV1 1 8 Trung tâm VNPT IT KV3 2 9 Trung tâm VNPT IT KV4 1 Tổng cộng 25 Các đơn vị gửi danh sách học viên (theo mẫu file excel gửi kèm) gửi email về Ban Nhân sự chậm nhất ngày 12/07/2021, theo địa chỉ: Ban Nhân sự: Chị Bùi Thị Nga, ĐT: 0915071081; Email: ngabui@vnpt.vn. Trân trọng./. Nơi nhận: - Như trên; - TGĐ & các P. TGĐ (để b/c) - Lưu NS, VT, BTN. Số EOF: 552905/VBĐT TRƯỞNG BAN NHÂN SỰ <Đã ký> Hoàng Trung Hiếu
  • 2. 2 PHỤ LỤC: NỘI DUNG KHÓA HỌC Introduction Introduction to Apache Hadoop and the Hadoop Ecosystem  Apache Hadoop Overview  Data Processing  Introduction to the Hands-On Exercises Apache Hadoop File Storage  Apache Hadoop Cluster Components  HDFS Architecture  Using HDFS Distributed Processing on an Apache Hadoop Cluster  YARN Architecture  Working With YARN Apache Spark Basics  What is Apache Spark?  Starting the Spark Shell  Using the Spark Shell  Getting Started with Datasets and DataFrames  DataFrame Operations Working with DataFrames and Schemas  Creating DataFrames from Data Sources  Saving DataFrames to Data Sources  DataFrame Schemas  Eager and Lazy Execution Analyzing Data with DataFrame Queries  Querying DataFrames Using Column Expressions  Grouping and Aggregation Queries  Joining DataFrames RDD Overview  RDD Overview  RDD Data Sources  Creating and Saving RDDs  RDD Operations Transforming Data with RDDs  Writing and Passing Transformation Functions  Transformation Execution  Converting Between RDDs and DataFrames Aggregating Data with Pair RDDs  Key-Value Pair RDDs  Map-Reduce  Other Pair RDD Operations Querying Tables and Views with SQL  Querying Tables in Spark Using SQL  Querying Files and Views  The Catalog API Working with Datasets in Scala  Datasets and DataFrames  Creating Datasets  Loading and Saving Datasets  Dataset Operations Writing, Configuring, and Running Spark Applications  Writing a Spark Application  Building and Running an Application
  • 3. 3  Application Deployment Mode  The Spark Application Web UI  Configuring Application Properties Spark Distributed Processing  Review: Apache Spark on a Cluster  RDD Partitions  Example: Partitioning in Queries  Stages and Tasks  Job Execution Planning  Example: Catalyst Execution Plan  Example: RDD Execution Plan Distributed Data Persistence  DataFrame and Dataset Persistence  Persistence Storage Levels  Viewing Persisted RDDs Common Patterns in Spark Data Processing  Common Apache Spark Use Cases  Iterative Algorithms in Apache Spark  Machine Learning  Example: k-means Introduction to Structured Streaming  Apache Spark Streaming Overview  Creating Streaming DataFrames  Transforming DataFrames  Executing Streaming Queries Structured Streaming with Apache Kafka  Overview  Receiving Kafka Messages  Sending Kafka Messages Aggregating and Joining Streaming DataFrames  Streaming Aggregation  Joining Streaming DataFrames Conclusion Message Processing with Apache Kafka  What Is Apache Kafka?  Apache Kafka Overview  Scaling Apache Kafka  Apache Kafka Cluster Architecture  Apache Kafka Command Line Tools