SlideShare a Scribd company logo
1 of 6
HDFS 개념
• 정의
Hadoop Distributed FileSystem ( 하둡 분산 파일시스템 )
1) 특징
- 블록단위로 파일보관
파일을 블록 단위로 나눠서 보관 ( 기본설정 64M )
- 분산 파일 시스템 ( 블록을 다중노드에 분산해서 보관 )
- 리플리케이션
하나의 블록은 여러 노드에 복제
특정 노드 장애에 무정지 대응
- 범용 장비 사용
2
1. HDFS 특징
• 파일 시스템에 접근하기 위한 Shell Script( 명령형인터페이스 )
1) $hadoop fs –ls hdfs://localhost/
2) 클라이언트
- Shell Script, JAVA API, HTTP 등 제공
3
1. HDFS 파일시스템
• 블록
1) HDFS 에서의 파일은 블록크기로 분리되어 저장
2) 기본 블록 크기는 64MB(128MB 로 많이 사용 )
3) 파일분리 예
- 256MB 파일은 64M 네 개의 블록으로 분리되어 저장
( 즉 , 4 개의 파일로 분리되어 저장 )
- 블록 크기보다 작은 파일로 분리되어 저장
이 경우 , 블록 파일의 크기는 실제 파일크기임 .
4) 단일 디스크보다 더 큰 파일을 보관할 수 있음 .
5) 복제 단위
- 노드간 데이터 복사는 블록 단위로 됨 .
4
1. HDFS 블록
•
5
1. HDFS 구조
•
5
1. HDFS 구조

More Related Content

What's hot

Hadoop Overview 1
Hadoop Overview 1Hadoop Overview 1
Hadoop Overview 1Kay Kim
 
리눅스 시작하기
리눅스 시작하기리눅스 시작하기
리눅스 시작하기Pete Lee
 
An introduction to hadoop
An introduction to hadoopAn introduction to hadoop
An introduction to hadoopMinJae Kang
 
구글분산
구글분산구글분산
구글분산imscott
 
How ntfs works br
How ntfs works brHow ntfs works br
How ntfs works br상봉 이
 
about hadoop yes
about hadoop yesabout hadoop yes
about hadoop yesEunsil Yoon
 
하둡완벽가이드 Ch9
하둡완벽가이드 Ch9하둡완벽가이드 Ch9
하둡완벽가이드 Ch9HyeonSeok Choi
 
Hadoop Introduction (1.0)
Hadoop Introduction (1.0)Hadoop Introduction (1.0)
Hadoop Introduction (1.0)Keeyong Han
 
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)Matthew (정재화)
 
리눅스 간단 강의 4강
리눅스 간단 강의 4강리눅스 간단 강의 4강
리눅스 간단 강의 4강Junsu Kim
 
그림으로 공부하는 오라클 구조
그림으로 공부하는 오라클 구조그림으로 공부하는 오라클 구조
그림으로 공부하는 오라클 구조Choonghyun Yang
 

What's hot (20)

Hadoop Overview 1
Hadoop Overview 1Hadoop Overview 1
Hadoop Overview 1
 
Hadoop발표자료
Hadoop발표자료Hadoop발표자료
Hadoop발표자료
 
하둡관리
하둡관리하둡관리
하둡관리
 
HBase 훑어보기
HBase 훑어보기HBase 훑어보기
HBase 훑어보기
 
리눅스 시작하기
리눅스 시작하기리눅스 시작하기
리눅스 시작하기
 
Redis
RedisRedis
Redis
 
An introduction to hadoop
An introduction to hadoopAn introduction to hadoop
An introduction to hadoop
 
hadoop ch1
hadoop ch1hadoop ch1
hadoop ch1
 
구글분산
구글분산구글분산
구글분산
 
How ntfs works br
How ntfs works brHow ntfs works br
How ntfs works br
 
about hadoop yes
about hadoop yesabout hadoop yes
about hadoop yes
 
Apache hive
Apache hiveApache hive
Apache hive
 
Main memory
Main memoryMain memory
Main memory
 
하둡완벽가이드 Ch9
하둡완벽가이드 Ch9하둡완벽가이드 Ch9
하둡완벽가이드 Ch9
 
Hadoop Introduction (1.0)
Hadoop Introduction (1.0)Hadoop Introduction (1.0)
Hadoop Introduction (1.0)
 
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)
 
Hive begins
Hive beginsHive begins
Hive begins
 
리눅스 간단 강의 4강
리눅스 간단 강의 4강리눅스 간단 강의 4강
리눅스 간단 강의 4강
 
Hadoop io part2
Hadoop io part2Hadoop io part2
Hadoop io part2
 
그림으로 공부하는 오라클 구조
그림으로 공부하는 오라클 구조그림으로 공부하는 오라클 구조
그림으로 공부하는 오라클 구조
 

Recently uploaded

MOODv2 : Masked Image Modeling for Out-of-Distribution Detection
MOODv2 : Masked Image Modeling for Out-of-Distribution DetectionMOODv2 : Masked Image Modeling for Out-of-Distribution Detection
MOODv2 : Masked Image Modeling for Out-of-Distribution DetectionKim Daeun
 
A future that integrates LLMs and LAMs (Symposium)
A future that integrates LLMs and LAMs (Symposium)A future that integrates LLMs and LAMs (Symposium)
A future that integrates LLMs and LAMs (Symposium)Tae Young Lee
 
캐드앤그래픽스 2024년 5월호 목차
캐드앤그래픽스 2024년 5월호 목차캐드앤그래픽스 2024년 5월호 목차
캐드앤그래픽스 2024년 5월호 목차캐드앤그래픽스
 
Continual Active Learning for Efficient Adaptation of Machine LearningModels ...
Continual Active Learning for Efficient Adaptation of Machine LearningModels ...Continual Active Learning for Efficient Adaptation of Machine LearningModels ...
Continual Active Learning for Efficient Adaptation of Machine LearningModels ...Kim Daeun
 
Console API (Kitworks Team Study 백혜인 발표자료)
Console API (Kitworks Team Study 백혜인 발표자료)Console API (Kitworks Team Study 백혜인 발표자료)
Console API (Kitworks Team Study 백혜인 발표자료)Wonjun Hwang
 
Merge (Kitworks Team Study 이성수 발표자료 240426)
Merge (Kitworks Team Study 이성수 발표자료 240426)Merge (Kitworks Team Study 이성수 발표자료 240426)
Merge (Kitworks Team Study 이성수 발표자료 240426)Wonjun Hwang
 

Recently uploaded (6)

MOODv2 : Masked Image Modeling for Out-of-Distribution Detection
MOODv2 : Masked Image Modeling for Out-of-Distribution DetectionMOODv2 : Masked Image Modeling for Out-of-Distribution Detection
MOODv2 : Masked Image Modeling for Out-of-Distribution Detection
 
A future that integrates LLMs and LAMs (Symposium)
A future that integrates LLMs and LAMs (Symposium)A future that integrates LLMs and LAMs (Symposium)
A future that integrates LLMs and LAMs (Symposium)
 
캐드앤그래픽스 2024년 5월호 목차
캐드앤그래픽스 2024년 5월호 목차캐드앤그래픽스 2024년 5월호 목차
캐드앤그래픽스 2024년 5월호 목차
 
Continual Active Learning for Efficient Adaptation of Machine LearningModels ...
Continual Active Learning for Efficient Adaptation of Machine LearningModels ...Continual Active Learning for Efficient Adaptation of Machine LearningModels ...
Continual Active Learning for Efficient Adaptation of Machine LearningModels ...
 
Console API (Kitworks Team Study 백혜인 발표자료)
Console API (Kitworks Team Study 백혜인 발표자료)Console API (Kitworks Team Study 백혜인 발표자료)
Console API (Kitworks Team Study 백혜인 발표자료)
 
Merge (Kitworks Team Study 이성수 발표자료 240426)
Merge (Kitworks Team Study 이성수 발표자료 240426)Merge (Kitworks Team Study 이성수 발표자료 240426)
Merge (Kitworks Team Study 이성수 발표자료 240426)
 

Hdfs

  • 2. • 정의 Hadoop Distributed FileSystem ( 하둡 분산 파일시스템 ) 1) 특징 - 블록단위로 파일보관 파일을 블록 단위로 나눠서 보관 ( 기본설정 64M ) - 분산 파일 시스템 ( 블록을 다중노드에 분산해서 보관 ) - 리플리케이션 하나의 블록은 여러 노드에 복제 특정 노드 장애에 무정지 대응 - 범용 장비 사용 2 1. HDFS 특징
  • 3. • 파일 시스템에 접근하기 위한 Shell Script( 명령형인터페이스 ) 1) $hadoop fs –ls hdfs://localhost/ 2) 클라이언트 - Shell Script, JAVA API, HTTP 등 제공 3 1. HDFS 파일시스템
  • 4. • 블록 1) HDFS 에서의 파일은 블록크기로 분리되어 저장 2) 기본 블록 크기는 64MB(128MB 로 많이 사용 ) 3) 파일분리 예 - 256MB 파일은 64M 네 개의 블록으로 분리되어 저장 ( 즉 , 4 개의 파일로 분리되어 저장 ) - 블록 크기보다 작은 파일로 분리되어 저장 이 경우 , 블록 파일의 크기는 실제 파일크기임 . 4) 단일 디스크보다 더 큰 파일을 보관할 수 있음 . 5) 복제 단위 - 노드간 데이터 복사는 블록 단위로 됨 . 4 1. HDFS 블록