Recommended
PPTX
PDF
ํ๋ก (Hadoop) ๋ฐ ๊ด๋ จ๊ธฐ์ ํ์ด๋ณด๊ธฐ
PDF
PPTX
3ํ ์์ธ Hadoop ์ฌ์ฉ์ ๋ชจ์ / ์ํ์น ํผ๋์ค
PDF
์์ธ ํ๋ก ์ฌ์ฉ์ ๋ชจ์ ๋ฐํ์๋ฃ
PDF
ํ๋ก ์์๋ณด๊ธฐ(Learn about Hadoop basic), NetApp FAS NFS Connector for Hadoop
PDF
PPTX
An introduction to hadoop
PPT
PPTX
PDF
PPT
Hadoop Introduction (1.0)
PDF
PDF
์คํํธ์
์ฌ๋ก๋ก ๋ณธ ๋ก๊ทธ ๋ฐ์ดํฐ ๋ถ์ : Tajo on AWS
PDF
Big query at GDG Korea Cloud meetup
PPTX
Introduction to Apache Tajo
PDF
PDF
Cassandra ๋ฉ๋ถ๊ธฐ | Devon 2012
PDF
Expanding Your Data Warehouse with Tajo
PDF
์๊ณ ์ฐ์! HBase | Devon 2012
PDF
PPTX
Ndc14 ๋ถ์ฐ ์๋ฒ ๊ตฌ์ถ์ ABC
PDF
PDF
DirectStroageํ๋ก๊ทธ๋๋ฐ์๊ฐ
PDF
KEY
Distributed Programming Framework, hadoop
PDF
แแ
กแแ
ฎแธ แแ
ฉแแแ
ณแซแแ
ฃแจแแ
ตแแ
ตแแ
กแซ ๋ง๋ณํต์น์ฝ์ ์๋๋ค
PDF
PPT
091106kofpublic 091108170852-phpapp02 (๋ฒ์ญ๋ณธ)
PPTX
๋ถ์ฐ์ ์ฅ์์คํ
๊ฐ๋ฐ์ ๋ํ 12๊ฐ์ง ์ด์ผ๊ธฐ
More Related Content
PPTX
PDF
ํ๋ก (Hadoop) ๋ฐ ๊ด๋ จ๊ธฐ์ ํ์ด๋ณด๊ธฐ
PDF
PPTX
3ํ ์์ธ Hadoop ์ฌ์ฉ์ ๋ชจ์ / ์ํ์น ํผ๋์ค
PDF
์์ธ ํ๋ก ์ฌ์ฉ์ ๋ชจ์ ๋ฐํ์๋ฃ
PDF
ํ๋ก ์์๋ณด๊ธฐ(Learn about Hadoop basic), NetApp FAS NFS Connector for Hadoop
PDF
PPTX
An introduction to hadoop
What's hot
PPT
PPTX
PDF
PPT
Hadoop Introduction (1.0)
PDF
PDF
์คํํธ์
์ฌ๋ก๋ก ๋ณธ ๋ก๊ทธ ๋ฐ์ดํฐ ๋ถ์ : Tajo on AWS
PDF
Big query at GDG Korea Cloud meetup
PPTX
Introduction to Apache Tajo
PDF
PDF
Cassandra ๋ฉ๋ถ๊ธฐ | Devon 2012
PDF
Expanding Your Data Warehouse with Tajo
PDF
์๊ณ ์ฐ์! HBase | Devon 2012
PDF
PPTX
Ndc14 ๋ถ์ฐ ์๋ฒ ๊ตฌ์ถ์ ABC
PDF
PDF
DirectStroageํ๋ก๊ทธ๋๋ฐ์๊ฐ
PDF
KEY
Distributed Programming Framework, hadoop
PDF
แแ
กแแ
ฎแธ แแ
ฉแแแ
ณแซแแ
ฃแจแแ
ตแแ
ตแแ
กแซ ๋ง๋ณํต์น์ฝ์ ์๋๋ค
PDF
Similar to Hadoop engineering v1.0 for dataconference.io
PPT
091106kofpublic 091108170852-phpapp02 (๋ฒ์ญ๋ณธ)
PPTX
๋ถ์ฐ์ ์ฅ์์คํ
๊ฐ๋ฐ์ ๋ํ 12๊ฐ์ง ์ด์ผ๊ธฐ
PDF
Tdc2013 ์ ๋ฐฐ๋ค์๊ฒ ๋ฐฐ์ฐ๋ server scalability
PPTX
Introduction to scalability
PPTX
PDF
log-monitoring-architecture.pdf
PDF
[NDC 2018] Spark, Flintrock, Airflow ๋ก ๊ตฌํํ๋ ํ๋ ฅ์ ์ด๊ณ ์ ์ฐํ ๋ฐ์ดํฐ ๋ถ์ฐ์ฒ๋ฆฌ ์๋ํ ์ธํ๋ผ ๊ตฌ์ถ
PDF
Internet Scale Service Arichitecture
PDF
์์๋๋ฉด ์ธ๋ฐ์๋ ์กํ์ฌ์ - AWS Tipsํธ::ํ์ค, ๊น๋ณ์::AWS Summit Seoul 2018
PPTX
AWS ์ธํ๋ผ/์ํคํ
์ณ ์ต์ ํ๋ฅผ ํตํ ๋น์ฉ์ ๊ฐ - ์ต์ธ์, AWS ์๋ฃจ์
์ํคํ
ํธ :: AWS Travel and Transportatio...
PDF
์์ ์ ์ธ ์๋น์ค ์ด์ 2013.08
PDF
[แแ
ฉแแ
ณแซแแ
ฉแแ
ณแแ
ฅแซแแ
ฅแฏแแ
ตแผ] VMware แแ
ขแแ
กแซ ๊ฒํ ๋ฅผ ์ํ ํ๋ผ์ด๋น ํด๋ผ์ฐ๋ ์๋ฃจ์
์ ์ธ
PDF
PDF
[giip] A.I. Infrastructure Advisor (์ธ๊ณต์ง๋ฅ ์ธํ๋ผ ์ด๋๋ฐ์ด์ )
PDF
[NDC18] ์ผ์์ ๋
๋๋๊ณ ์ ๋ฐ์ดํฐ ์์ง๋์ด๋ง ์ด์ผ๊ธฐ: ๋ก๊ทธ ์์คํ
๊ตฌ์ถ ๊ฒฝํ ๊ณต์ (2๋ถ)
PPTX
PDF
PDF
์์ ์ ์ธ ์๋น์ค ์ด์ 2014.03
PDF
์ฐพ์๊ฐ๋ AWS ์ธ๋ฏธ๋(๊ตฌ๋ก,๊ฐ์ฐ,ํ๊ต) - AWS ํด๋ผ์ฐ๋๋ก ์๋น์ค ๋ฌดํ๋๋ก ํ์ฅํ๊ธฐ (๋ฐ์ฒ ์ ์๋ฃจ์
์ฆ ์ํคํ
ํธ)
PDF
AWS Finance Symposium_์ฒ๋ง ๊ณ ๊ฐ์ ์ํ AWS ํด๋ผ์ฐ๋ ์ํคํ
์ณ ํ์ฅํ๊ธฐ
Hadoop engineering v1.0 for dataconference.io 1. 2. Hadoop Engineering?
Hadoop
open-source software framework
for distributed storage
and distributed processing
of Big Data on clusters of commodity hardware
- Wikipedia
Engineering
the application of scientific, economic, social, and practical knowledge in order to
invent, design, build, maintain, and improve structures,
machines, devices, systems, materials and processes
- Wikipedia 3. ์ด๋ ต๋ค! ์ฝ๊ฒ ํฉ์๋ค!!
ํ๋ก ์์ง๋์ด๋ง
ํ๋ก์ ๊ธฐ๋ฐ์ผ๋ก ๋ชฉ์ ์์คํ
์ ๊ตฌ์ถํ๊ธฐ ์ํ ๋ชจ๋ ๊ณํ ๋ฐ ํ๋
ํ์ง๋งโฆ ๋๋ฌด ๋ฐฉ๋ํ๋คโฆ
์์งํ ๊ณผ์ ๋ง ๋ค ์ค๋ช
ํด๋ ์ค๋ ์ง์ ๋ชป๊ฐ๊ฒ ๋๋ค๋โฆ
์ฃผ์ด์ง ์๊ฐ๋ด๋ก ํ ์ ์๋ ๋ถ๋ถ๊น์ง๋ง ํ๋ค.
๋๋จธ์ง๋?
๋์ค์ ๊ผญ ํ๋ค!
to be continue~ 4. ๋จผ์ , ํ์์ ๋ฒ๋ฆฌ์!
ํ๋ก์ ๊ณ์ ๋
ธ๋๋ง ์ถ๊ฐํ๋ฉด ์ ์ฌ๋/์ฑ๋ฅ์ด ์ฌ๋ผ๊ฐ๋ค!?
์ด๋ก์ ์ผ๋ก๋ ๋
ธ๋๋ฅผ ์ถ๊ฐํ ์๋ก ์ ์ฌ๋/์ฑ๋ฅ์ ๋น๋กํด์ ์ฆ๊ฐํ๋ค.
๊ทธ๋ฌ๋ ํ์ค์์๋โฆ
System์ ํ๊ณ โค Money์ ํ๊ณ
PC๊ธ ์ฅ๋น๋ผ๋ ๋ง์ผ๋ฉด ์ ์ฌ๋๊ณผ ์ฑ๋ฅ์ด ์์ฒญ๋ ๊ฒ์ด๋ค!?
์์ฐํ ๋ฐ์์ ๋ชจ๋ ์๋ฐฑ๋๊ฐ ์ค๋ฐ์ดํธ(overheat)ํ ๋งํผ ์ง์ฃผํด๋โฆ
์ด์ฐจํผ ํ๋ผ๋ฆฌ ์์์๋ ๋ฌ๊ตฌ์ง์ผ ๋ฟโฆ
PC๋ ์๋ฒ๊ฐ ์๋๋ค! (๋ถํ์ฑ๋ฅ/๋ด๊ตฌ์ฑ ๋ฑ๋ฑ)
๊ฐ๊ฒฉ๋๋น ์ฑ๋ฅ๋น(ROI)๊ฐ ์ข์ ์๋ฒ๋ฅผ ์ ์ ํ ์ฐ๋๊ฒ ํ๋ช
ํ๋ค. 5. ์์ฐ ํฌ์
์ ๋ต
์์ฐํฌ์
์ด ํด์๋ก, ๋น๋กํ ๊ฒ๋ณด๋ค ๋ ๋ง์ ์ฑ๋ฅ์ ์ป๋๋ค.
์กฐ๊ธ์ฉ ์์ฃผ ๊ตฌ๋งค vs ํ๋ฐฉ์ ์์ฐฝ ๊ตฌ๋งค
ํ์ง๋ง ํ์ค์ ๋ฐ๋ฆฌ๋ค๋งค์ ์น๋ฆฌ! (์๋ง์กฒ, ์ฝ์คํธ์ฝ, ์๋งํธโฆ)
์ง์ง ๋์ ์๋ผ๊ณ ์ถ๋ค๋ฉด ์ข ์ฐธ์๋ค๊ฐ ํ๋ฐฉ์ ํฌ๊ฒ ์จ์ผ ํ๋ค!
๊ทผ๋ฐ ํ๋ฒ์ ๋ง์ด ๊ตฌ๋งคํ์๋ ๋๋ฌด Risk๊ฐ ์ปค์ง๋ค.
๊ทธ๋์โฆ ๊ต์ฅํ ๋ํ
์ผํ๊ณ ์น๋ฐํ ์ ๋ต์ด ํ์ํ๋ค.
ex) ์์ต~์๋ฐฑ์ต์ ํฌ์ํ๋๋ฐ ์ฅ๋น๊ถํฉ์ด ์๋ง์ ๊ฒฐ๊ตญ ์ฑ๋ฅ์ด ๋ฎ์์ ๋งํ๋ค.
You fire!!! 6. ์คํจํ์ง ์๋ ์ฅ๋น๊ตฌ๋งค ์ ๋ต
๋๋๋ก ๋ง์ ๋ฒค๋(vendor)๋ฅผ ๋ง๋๊ณ ํ์ํ๋ค.
๋น
๋ฒค๋๊ฐ ํญ์ ๋น์ผ๊ฑด ์๋๋ค.
๊ทธ๋ฆฌ๊ณ ์ค์๋ฒค๋๊ฐ ํญ์ ์ ๋ ดํ๊ฑด ๋์ฑ ์๋๋ค.
ํ๋ ๋ฏฟ์์ ๊ฐ๊ฑฐ๋ ๋ง์์ ๋๋ ์๊ฐ์ ๋ฐ๋ก ํธ๊ตฌ๊ฐ ๋๋ค.
์น๊ตฌ๋ ํ๊ต/์ง์ฅ ์ ํ๋ฐฐ๋ โฆ ์ธ์์ ๋ฏฟ์ ๋์ ์๋ค. ์ซ์๋ง ๋ฏฟ์ด๋ผ!
๊ฐ์ฅ ์ผ๋ฐ์ ์ธ ์คํ์ ๊ธฐ์ค์ผ๋ก ์ผ๋๋ค.
๋ชจ๋ ๋ฒค๋๊ฐ ๋ง์ถฐ์ค ์ ์๋ ์คํ์ ๊ธฐ์ค์ผ๋ก ์ ํ๊ณ ํ์ํ๋ค.
ํน์ ์ฅ๋น์ ๋ํ ์์กฒ์ฑ์ ๊ฑธ๋ฆฌ๊ธฐ๋ ์ฌ์๋ ํ๊ธฐ๋ ์ ๋ง ์ด๋ ต๋ค.
ํน์ ๋ฒค๋์ ํน์ฑ์ด ๊ฐ์กฐ๋ ์คํ์ ์ฒ ์ ํ ๋ฐฐ์ ํ๋ค.
7. ๋ชฉ๋์ด ์๋ค! ๊ตฌ๋งคํ์ง ์๊ณ ๋ ํํ๋ ์๋!
์ด๋ฏธ ์ฃผ๋ ฅ ์๋น์ค์ ๋ฐ์ดํฐ๊ฐ AWS์ ์๋ ๊ฒฝ์ฐ
EMR์ ํ์ํ ๋ ํ์ํ ๋งํผ๋ง ์ฌ์ฉํ ์ ์์ด ๋งค์ฐ ํฉ๋ฆฌ์ .
๊ทธ๋ฌ๋,
์ฅ๊ธฐ๊ฐ/์ง์์ ์ธ ์ฌ์ฉ ๏จ ๋น์ฉ ์ด์
์ฅ์ ๋ฐ์ ๏จ ์๋ง์กฒ ํด๋ฐ๋ผ๊ธฐํ ์ข๋น๋ก ๋ณ์
AWS์ ๋ชจ๋ ์ด๋ช
์ ๊ฑธ์ด๋์ ๋ถ๋ค์๊ฒ ๊ฐ๋ ฅ ์ถ์ฒํจ.
Public cloud์ VM์ผ๋ก ๊ตฌ์ฑํ๋ ๊ฒฝ์ฐ
์ ๋ ์ด๋ฐ ์ง์ ํด์๋ ์๋จ.
- ๋ป์ง์ ๊ฒฝํํ ์ ๊ตฌ์(๋๋ ๋ง๋ฃจํ)์ ํ๊ณ
์ฑ๋ฅ/๋น์ฉ ๋ชจ๋ ๋ง์กฑํ ์ ์์.
8. Private cloud๋ฅผ ๊ตฌ์ถํ๋๋ฐโฆ
CloudStack ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์ถํ ๊ฒฝ์ฐ
๋์ผ๋(๋์ผRVM) ์ด๋ด๋ก ๊ท๋ชจ๋ฅผ ์ ํํ ๊ฒฝ์ฐ ์ ๋นํ ์ธ๋งํจ.
๋๊ธ์ EMR๋ณด๋ค ์ข ๋ ์ข์ ์ฑ๋ฅ์ ์ป์ ์ ์์.
๊ทธ๋ฌ๋,
๋ฐ๋์ ํ ํด๋ฌ์คํฐ๋ฅผ ํ๋์ ๋ฌผ๋ฆฌ๋์ ์ง์ ํด์ ๋ชฐ๋นตํด์ผ ํจ.
๋๋ ๋ง : ๊ทธ๋ผ ๋ญํ๋ฌ cloud๋ฅผ ์ฐ๋๊ฑฐ์ง???
์ฌ๋ฌ ๋ฌผ๋ฆฌ๋์ผ๋ก ๊ตฌ์ฑํ ์๋ ์์ผ๋ ์์ฒญ๋ ์ฑ๋ฅ์ ํ๋ฅผ ๊ฐ์ํด์ผ ํจ.
OpenStack ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์ถํ ๊ฒฝ์ฐ
CloudStack์ ๋นํด ๊ตฌ์กฐ์ ์ผ๋ก ์ ์ฐํ๊ณ ์ด์์ ์.
๊ทธ๋ฌ๋,
Network ๊ตฌ์ฑ์์ ์ค์ ๋ก ์์ฒญ๋ ๋์ญํญ์ ํ์๋ก ํจ.
์๋ฒ๋ณด๋ค ๋คํธ์ํฌ์ ๋ ํฌ์ํ ์ ์๋ค๋ฉด ์ถ์ฒํจ. (์๋ฐฑGbps?)
9. ์ง์ ๊ตฌ์ถํ๋ ค๋ฉด ์ด๋์?
ํ์ฌ ๋ด๋ถ์์ ๊ด๋ฆฌํ๋ ์ ์ฐ์ค์ ์ค์น
์๋ฉด/๋คํธ์ํฌ ๋น์ฉ ์ ์ฝ, ์ฅ์ ๋์/์ ์ง๋ณด์ํ๋๋ฐ ์ต๊ณ ์ ์ ํ์ง.
๊ทธ๋ฌ๋,
(์ ์ฌ ๋คํธ์ํฌ๋ฅผ ๋ง๋น์ํค๊ณ ์ถ์ง ์๋ค๋ฉด)
๋ฐ๋์ vLAN ๊ตฌ์ฑ ๋ฐ ํ์๋ง์ ๋ณ๋ ๊ตฌ์ฑํด์ ์์ฒญ๋ ํธ๋ํฝ์ ๊ฐ๋ฌ์ผ ํจ.
์ ์ฐ์ค์ด IDC ์์ค์ ๋ชป ๋ฏธ์น๋ค๋ฉด ์ถ๊ฐ ๊ณ ๋ ค์ฌํญ(๋น์ฉ)์ด ๋ง์ด ์ฆ๊ฐํจ.
IDC์ co-location์ผ๋ก ์งฑ๋ฐ์ ๋๊ธฐ
์ฌ๋ด ์ ์ฐ์ค์ด ์๊ฑฐ๋ ์๋ฉด์ด ๋ถ์กฑํ๋ฉด IDC๊ฐ ์ ์ผํ ์ ํ์ง์.
๊ทธ๋ฌ๋,
์๋ฉด/๋คํธ์ํฌ ๋น์ฉ์ด ๋๋ค. (1U๋น 100๋ง์/๋
์ด์ ์ง์ถ)
์ฅ์ ๊ฐ ๋ฐ์ํ๋ฉด ์ธ์ ๋ ์ง IDC์ ๋ค์ด๊ฐ ๋ณต๊ตฌํ ์ฉ์๊ฐ ํ์.
10. ์ฉ๋์ฐ์ ์ ์ด๋ป๊ฒ?
โ 1์ผ ์ ์ฌ๋
โก ํฅํ 2~3๋
๋์ ์ฆ๊ฐ๊ฐ ์์๋๋ ์ฆ๊ฐ ๋น์จ (์๋น์ค ์งํ ๋ฑ์ ์ฐธ๊ณ ๋ก ๋น์จ์ ๋ณด์์ ์ผ๋ก ์ฐ์ถ)
โข ๊ธฐ์กฒ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๊ณ ์์ฒด์ ์ผ๋ก ์์ฐํ๋ ์ฉ๋
โฃ ๋ฐ์ดํฐ๋ฅผ ์ญ์ ํ์ง ์๊ณ ๋ณด๊ดํ๋ ๊ธฐ๊ฐ
โค OS ์ค์น์ฉ๋ (๋๋น 1~20GB)
โฅ ์์ ์ฉ๋ (HDFS temp ๋ฐ shuffle์ฉ, ๋ณดํต 10%)
โฆ ์ค์น ํ๋ก๊ทธ๋จ ์ฉ๋ (๋๋น 1~30GB)
โง ์์ฒด๋ก๊ทธ ์ ์ฌ ์ฉ๋ (hadoop ์์ฒด log๋ฅผ ๋ณด๊ดํ ์ฉ๋, ๋ณดํต 10%)
โจ ์ฅ์ ๋์ ์ฌ์ ์จ (๋ณดํต 30%)
โฉ ๋
ธ๋๋น ๋์คํฌ ๊ฐ์ (1U=4 or 8, 2U=12 or 24)
โช ๊ฐ๋ณ ๋์คํฌ ์ฉ๋
โซ ๋จ์ ๋ณด์ (1TB ๋์คํฌ๋ ์ค์ 1,000,000,000,000 Byte ๏ 931GB ๏จ 10% ๋ณด์ ์ด ํ์)
- HDFS ์ ์ฌ ์์๋ ๊ณต์ : Hs = (โ + โข ) x โก x โฃ x 3[replica]
ex) Hs = ( 500GB + 30GB ) x 101 / 100 x 365day x 3[rep] = 573TB
- ์ ์ฒด ์๋ฒ๋์ 1์ฐจ ์ฐ์ถ ๊ณต์ : St1 = Hs / โฉ / โช x โซ ex) St1 = 573 / 4 / 3 x 10% = 53๋ (์์์ ์ดํ ๋ฐ์์ ๋ฌด์กฐ๊ฑด +1 ํด์ผํจ)
- ์ ์ฒด ๋ฌผ๋ฆฌ์ ์ฉ๋ ๊ณต์ : Ts = ( Hs + ( โค + โฆ ) x St1 x โฅ x โง ) x โจ
ex) Ts = ( 573TB + ( 20GB + 30GB ) x 53๋ x 10% x 10% x 10% ) x 30% = 750 TB
- ์ ์ฒด ์๋ฒ๋์ ์ต์ข
์ฐ์ถ ๊ณต์ : St2 = Ts / โฉ / โช x โซ
ex) St2 = 750 / 4 / 3 x 10% = 69๋
ps. Hive๋ฅผ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ ์ข๋ ๋ํ
์ผ์ด ํ์. (File format/์์ถ ์ข
๋ฅ์ ๋ฐ๋ผโฆ) 11. ์ฌ์ฐจ์ ์ฐจ ๋์
ํ๋๋ฐ.. ๋ด ์น์ง์ด ๊ธํ๊ฑด๊ฐ, ์๋ฒ๊ฐ ๋๋ฆฐ๊ฑด๊ฐ
์ฑ๋ฅ์ด์๋ ๋ฏธ๋ฆฌ ๋๋นํ๋๋ผ๋ ๋๋ถ๋ถ ๋ฐ์ํ๋ค.
(์์๊ธฐ๋๊ฒ ์ด์ํจโฆ ์๋๋ฉด ์์
์ ๋นก์ธ๊ฒ ์๋๋ ธ๋๊ฐโฆ)
์์ฃผ ๋ค์ํ ์์ธ์ด ์กฒ์ฌํจ.
๋๋ถ๋ถ์ ์ด์๊ฐ ๋ฐ์ํ๋ ๊ณณ ๏ ์ฑ๋ฅ์ด ๋ฎ์ ์์ ๏จ ๋์คํฌ & ๋คํธ์ํฌ!
์ผ๋ฐ SATA Disk = ํ๊ท 150MB/s
๋คํธ์ํฌ 1Gb = ํ๊ท 100MB/s
1Gb๋ ์ผ๋ฐ ๋์คํฌ 1๊ฐ ์๋๋ ์๋๋ ๊ฑฐ๋ถ์ดโฆ
๊ทธ๋์ ํ๋ก์ ์ฌ์ฉํ๋ ๊ณณ์ ๋๋ถ๋ถ 10Gb๊ฐ ๊ธฐ๋ณธ์ด ๋์๋ค. 12. ๋์คํฌ ์ฑ๋ฅ ์ด์ : RAID๋ฅผ ์ ์ฐ๋ฉด ์ฑ๋ฅ์ด ๋ฌ๋ผ์ง๋ค.
Case
Disk
์ ์ฉ ์ฌํญ
Data Node
Master Node
๊ธฐํ
(์์ง/Import/Export)
Boot ์์ญ
DFS ์์ญ
1U
2.5โ
(8~10๊ฐ)
โข๊ณ ๊ฐ์ฉ์ฑ ์ ์ฉ
โขDisk 2๊ฐ๋ฅผ RAID-1
โข๊ณ ์ฑ๋ฅ ํ์ฉ
โขDisk 2๊ฐ์ฉ RAID-0 ์ค์ ๏ 3~4๊ฐ ํํฐ์
๊ตฌ์ฑ
โข๊ณ ๊ฐ์ฉ์ฑ ์ ์ฉ
โขDisk 2๊ฐ๋ง RAID-1 (Boot) + ๋๋จธ์ง RAID-10 (Package+Data)
โขAll RAID-10
โข๊ณ ๊ฐ์ฉ์ฑ + ๊ณ ์ฑ๋ฅ ํ์ฉ
โขDisk 2๊ฐ๋ง RAID-1 (Boot) + ๋๋จธ์ง RAID-10 or 5 (Package+Data)
โขAll RAID-10 or 5
3.5โ
(4๊ฐ)
โข๊ฐ์ฉ์ฑ ๊ทน๋ํ
โขDisk 1๊ฐ์ OS ์ค์น์ฉ ์ต์ ํํฐ์
๊ตฌ์ฑ, ๋๋จธ์ง๋ DFS ์์ญ
โขSSD๋ฅผ ์ถ๊ฐ ๏ OS์ ์ฉ
โข๊ฐ์ฉ์ฑ ๊ทน๋ํ
โขDisk ๊ฐ๋ณ ํํฐ์
๊ตฌ์ฑ ๏ 3~4๊ฐ ํํฐ์
๊ตฌ์ฑ
โข๊ณ ๊ฐ์ฉ์ฑ ์ ์ฉ
โขAll RAID-10
โข๊ณ ๊ฐ์ฉ์ฑ + ๊ณ ์ฑ๋ฅ ํ์ฉ
โขAll RAID-10 or 5
2U
2.5โ
(20~24๊ฐ)
โข๊ณ ๊ฐ์ฉ์ฑ ์ ์ฉ
โขDisk 2๊ฐ๋ฅผ RAID-1
โข๊ณ ์ฑ๋ฅ ํ์ฉ
โขDisk 2๊ฐ์ฉ RAID-0 ์ค์ ๏ 9~11๊ฐ ํํฐ์
๊ตฌ์ฑ
โข๊ณ ๊ฐ์ฉ์ฑ ์ ์ฉ
โขDisk 2๊ฐ๋ง RAID-1 (Boot) + ๋๋จธ์ง RAID-10 (Package+Data)
โขAll RAID-10
โข๊ณ ๊ฐ์ฉ์ฑ + ๊ณ ์ฑ๋ฅ ํ์ฉ
โขDisk 2๊ฐ๋ง RAID-1 (Boot) + ๋๋จธ์ง RAID-10 or 5 (Package+Data)
โขAll RAID-10 or 5
3.5โ
(8~10๊ฐ)
โข๊ณ ๊ฐ์ฉ์ฑ ์ ์ฉ
โขDisk 2๊ฐ๋ฅผ RAID-1
โขSSD๋ฅผ ์ถ๊ฐ ๏ OS์ ์ฉ
โข๊ณ ์ฑ๋ฅ ํ์ฉ
โขDisk 2๊ฐ์ฉ RAID-0 ์ค์ ๏ 3~4๊ฐ ํํฐ์
๊ตฌ์ฑ
โข๊ณ ๊ฐ์ฉ์ฑ ์ ์ฉ
โขDisk 2๊ฐ๋ง RAID-1 (Boot) + ๋๋จธ์ง RAID-10 (Package+Data)
โขAll RAID-10
โข๊ณ ๊ฐ์ฉ์ฑ + ๊ณ ์ฑ๋ฅ ํ์ฉ
โขDisk 2๊ฐ๋ง RAID-1 (Boot) + ๋๋จธ์ง RAID-10 or 5 (Package+Data)
โขAll RAID-10 or 5 13. ๋์คํฌ ์ฑ๋ฅ ์ด์ : ๊ทธ๋ผ SSD๋ฅผ ์ฐ๋ฉด ์์ฒญ๋๊ฒ ์ข์์ง๋ ค๋?
์ SSD๋ฅผ ์ฌ์ฉํ๋ ค ํ๋๊ฐ?
๏ ๋น ๋ฅธ ์๋์ ์์ฒญ๋ ๋๋ค์ต์ธ์ค ์ฑ๋ฅ (์ค์ ๋ก HBase์ฉ Hadoop์์ ์์ฃผ ์ฑ์ฉ)
ํ์ง๋ง ์์ง์ ๋ด๊ตฌ์ฑ์ ๋ฌธ์ ๊ฐ ์์ ๏ WRITE ํ์ ์ ํ (์ค์ RDB main store๋ก ์ฌ์ฉ์ 6๊ฐ์์ ๋ชป๋ฒํฐ๊ณ ์ฌ๋ง)
๏ ๋ง์ฝ ๋์ผ ์ญํ ์ ์ฌ๋ฌ ์ฅ๋น์ ๋์์ ์ฅ์ฐฉํ๋ฉด ๊ฑฐ์ ๋์๋ค๋ฐ๋ก ์ฅ์ ๊ฐ ๋ฐ์
๏ ๋ง์ฝ DataNode์๋ค ์ฅ์ฐฉํ๋ค๋ฉดโฆ ํ๋ก์ 3-replica๋ ๋ฌด์ฉ์ง๋ฌผ์ด ๋ ์ ์์.
๋ด๊ตฌ์ฑ๊ณผ ์ฑ๋ฅ์ด ์ข์ ์ ํ์ ๊ฐ๊ฒฉ์ด 10๋ฐฐ ์ด์ ์์น ๏ Fusion IO (์ด์ ์ด๊ฒ ๋ถ์ ์์ง์ธ๊ฐ?)
SSD, ๊ทผ๋ฐ ์ ๋ง ๋น ๋ฅธ๊ฐ? ๏ ์ผ๋ฐ SSD๋ 500 MB/s ์์ค, Fusion IO๋ ๋ณดํต 1 GB/s ์์ค
Workaround : SSD์ ๋ง๋จน๋ ์๋๊ฐ ํ์ํ ๋ ๏ ๋จ์ผ HDD๋ ๋ณดํต 150 MB/s ์์ค (์ต์๋ชจ๋ธ์ 170MB/s๊น์ง ํ์ธ) ๏ HDD 4๊ฐ ์ด์์ RAID-10๋ก ๋ฌถ์ผ๋ฉด 350MB/s ์์ค์ ์ฑ๋ฅ ํ๋ ๏ ์์ฆ RAID Controller ์ฑ๋ฅ ๋ฌด์ง ์ข์์ง (RAID-5๊ฐ RAID-10๋ณด๋ค ๋น ๋ฆ, ์คํํ์ธ ํ์!) 14. ๋์คํฌ ์ฑ๋ฅ ์ด์ : OS ํ๋๋ ํ์ํด!
์์ธ๋ก ๋ฆฌ๋
์ค ์ปค๋๋ฒ๊ทธ๊ฐ ๋ง๋ค.
๏ ๋ํ์ ์ผ๋ก RHEL 6.2/6.3 THP issue (THP๋ฅผ ๋นํ์ฑํ์์ผ์ผ ํจ) http://structureddata.org/2012/06/18/linux-6-transparent-huge-pages-and-hadoop-workloads/
I/O Scheduler ๏ RAID๊ฐ ์์ผ๋ฉด DataNode๋ daedline
๏ RAID๊ฐ ์์ผ๋ฉด DataNode๋ noop
Disk Cache๋ฅผ ์ต๋ํ ์ฅ์ด์ง์ผ ํ๋ค. ๏ Linux์ Read Ahead cache๋ ๊ฒจ์ฐ 128KB.
๏ ์ ์ ํ ์ฆ๊ฐ์์ผ์ผ ํ๋ค. (๋ณดํต 2MB ์ถ์ฒ)
๏ 1MB ๋จ์๋ก Disk์ Cache size (๋ณดํต 64MB)๊น์ง 1~8MB ๋จ์๋ก ๋๋ฆฌ๋ฉด์ ํ
์คํธ ํ์.
๏ ์ถ์ ๊น์ง? ๏จ I/O Wait์ด ๋ฐ์ํ์ง ์๊ฑฐ๋ ๊บฝ์ผ ๋ ๊น์งโฆ ๊ทธ๋์ ์บ์ํฌ๊ธฐ๋ฅผ ์ต์ ์ผ๋ก ์ผ๋๋ค.
๏ RAID Controller๊ฐ ์ฅ์ฐฉ๋ ๊ฒฝ์ฐ ์ต๋ 2GB์ cache๊ฐ ์์.
15. ๊ธ๋ก๋ฒ ๋ ํผ๋ฐ์ค ์คํ์ ์๊ณ ์ถ์ด์!
๋ชจ๋ ํํธ๋ www.opencompute.org์์ ํ์ธํ ์ ์๋ค.
facebook์ ํ์ค ์ฅ๋น์คํ์ ์ ๋ฆฌํ ๋ด์ฉ๋คโฆ
facebook?
์๋ง ์ ์ธ๊ณ์์ Hadoop์ ๊ฐ์ฅ ๋ง์ด ์ฌ์ฉํ๋ ํ์ฌโฆ
์ฐธ๊ณ ๋ก, ์ฌ๊ธฐ์์ ๋คํธ์ํฌ ๊ด๋ จ PDF๋ค์ ๋ค์ฒ๋ฐ์์ ๋ณด์๋ผโฆ
10Gb๋ ๋น์ฐํ ๊ธฐ๋ณธ.
UP-Link๋ 40Gb๊ฐ ์ต๋ 12๊ฐ!!!
(40 x 12 = 480Gbps ๋์ญํญ)
๊ทธ๋ฐ๋ฐโฆ
๊ฒฝํ์ ์ผ๋ก ์์ํ๊ฑด๋ฐ,
์ด ์ ๋ ์คํ๋ facebook์์๋ ๋ชจ์๋ฅผ๊ป?
๊ณต์ ์ฑ๋์ ํตํด ๋น๊ณต์์ ์ผ๋ก ๋ค์ ์ด์ผ๊ธฐ๋ก๋โฆ
ํ์ฌ ๋ฏธ๊ตญ ๋ช๋ช ํ์ฌ์์ 100Gb ์ฅ๋น๋ฅผ BMT ํ๋ ์ค ์ด๋ผ๊ณ โฆ 16.