SlideShare a Scribd company logo
1 of 5
kenji
목차

 구글의 탄생
 구글의 공룡화
 구글의 분산 스토리지
구글의 탄생
(1) URL 서버가 크롤러에게 웹페이지를 다운로드 하도록 요구한다

(2) 복수의 크롤러가 동시에 다운로드 하면서 docID를 할당해 리포지터
    에 저장

(3) 리포지터리에서 웹페이지를 가져오면 인덱스생성이 시작된다. 구조해
   석을 통해 웹페이지 내의 텍스트를 추출함과 동시에 웹페이지의 타이틀
   등이 DocIndex에 기록되고, URL이 URLlist에 각각 기록된다.

(4) 단어 처리에 의해 모든 단어가 Lexicon에 따라 wordID로 변환되고, 단어의
    위치와 크기가 모두 Barrels에 기록된다.
(5) 웹페이지내에 링크가 있다면 URLlist를 기초로 docID를 조사하고
    링크관계를 Links에 기록한다.

(6) docID를 찾을 수 없다면 URL Server에 의해 새로 크롤링을 시작한다.

(7) 랭킹을 위한 사전 처리를 해야하는데 여기서는 Links를 기초로 페이지
    랭크가 계산된다. 최종적인 랭킹처리는 서버가 담당한다.

(8) 검색 서버는 User로부터 요청이 들어오면 Lexicon에 따라 검색어를
    변환하고

(9) 이어서 Barrels의 역 인덱스에서 docID list를 가져온 후, 각각의
    랭킹함수를 적용해 순위를 결정한다.

(10) 랭킹에 의해 상위로 올라온 docID는 DocIndex에서 웹페이지의
     정보를 가져와 보기 쉽게 이용자에게 반환한다.
구글의 공룡화
(1) 소프트웨어로 신뢰성을 높인다.

하드웨어가 고장나더라도 시스템전체의 동작을 유지할수 있도록 한다.

(2) 하드웨어를 늘려서 부하를 분산한다.

데이터를 복제하고 분할하여 하드웨어 늘리기만으로 시스템확장

(3) 비용대비 고성능 하드웨어를 선택한다.

무조건 고성능 하드웨어를 고집할수 없으므로 그시점에서 가격대비
성능이 좋은 하드웨어를 선택한다.

More Related Content

What's hot

2006 קיץ ב 005
2006 קיץ ב 0052006 קיץ ב 005
2006 קיץ ב 005bagrutonline
 
www.fn.ua
www.fn.uawww.fn.ua
www.fn.uaAnton
 
Msdn Seminar 070911 Silver Light
Msdn Seminar 070911 Silver LightMsdn Seminar 070911 Silver Light
Msdn Seminar 070911 Silver Lightgojipcap
 
Top 10 Mobile Web 2.0 Predictions for 2008
Top 10 Mobile Web 2.0 Predictions for 2008 Top 10 Mobile Web 2.0 Predictions for 2008
Top 10 Mobile Web 2.0 Predictions for 2008 Jonathan Jeon
 
Relation between weather and accidents in Korea_using R
Relation between weather and accidents in Korea_using RRelation between weather and accidents in Korea_using R
Relation between weather and accidents in Korea_using RHyeinGu
 
10월 셋째주 작업지시사항 정리
10월 셋째주 작업지시사항 정리10월 셋째주 작업지시사항 정리
10월 셋째주 작업지시사항 정리guestffbde6
 
Алгоритм решения задачи в Exel
Алгоритм решения задачи в ExelАлгоритм решения задачи в Exel
Алгоритм решения задачи в Exelkseniya13
 
2013.06.17 キャンパス・ハラスメント講習会
2013.06.17 キャンパス・ハラスメント講習会2013.06.17 キャンパス・ハラスメント講習会
2013.06.17 キャンパス・ハラスメント講習会吉良貴之 KIra Takayuki
 
Cbe profile (tamil)
Cbe profile (tamil)Cbe profile (tamil)
Cbe profile (tamil)Coimbatore
 
Medical Wiki Project
Medical Wiki ProjectMedical Wiki Project
Medical Wiki ProjectKwangmo Yang
 
Mies Van Der Rohe
Mies Van Der RoheMies Van Der Rohe
Mies Van Der Rohekbs7243
 
Оптимизация фильтра интернет-магазина. Решаем SEO и пользовательскую задачу
Оптимизация фильтра интернет-магазина. Решаем SEO и пользовательскую задачуОптимизация фильтра интернет-магазина. Решаем SEO и пользовательскую задачу
Оптимизация фильтра интернет-магазина. Решаем SEO и пользовательскую задачуcollaborator.pro
 
рациональный гардероб
рациональный гардеробрациональный гардероб
рациональный гардеробSvetlana Divinsky
 
웹기획 V090605
웹기획 V090605웹기획 V090605
웹기획 V090605oros83
 

What's hot (20)

Web3
Web3Web3
Web3
 
2006 קיץ ב 005
2006 קיץ ב 0052006 קיץ ב 005
2006 קיץ ב 005
 
www.fn.ua
www.fn.uawww.fn.ua
www.fn.ua
 
Msdn Seminar 070911 Silver Light
Msdn Seminar 070911 Silver LightMsdn Seminar 070911 Silver Light
Msdn Seminar 070911 Silver Light
 
Top 10 Mobile Web 2.0 Predictions for 2008
Top 10 Mobile Web 2.0 Predictions for 2008 Top 10 Mobile Web 2.0 Predictions for 2008
Top 10 Mobile Web 2.0 Predictions for 2008
 
Relation between weather and accidents in Korea_using R
Relation between weather and accidents in Korea_using RRelation between weather and accidents in Korea_using R
Relation between weather and accidents in Korea_using R
 
Keynote Genius
Keynote GeniusKeynote Genius
Keynote Genius
 
חורף 2005 006
חורף 2005 006חורף 2005 006
חורף 2005 006
 
10월 셋째주 작업지시사항 정리
10월 셋째주 작업지시사항 정리10월 셋째주 작업지시사항 정리
10월 셋째주 작업지시사항 정리
 
Алгоритм решения задачи в Exel
Алгоритм решения задачи в ExelАлгоритм решения задачи в Exel
Алгоритм решения задачи в Exel
 
2013.06.17 キャンパス・ハラスメント講習会
2013.06.17 キャンパス・ハラスメント講習会2013.06.17 キャンパス・ハラスメント講習会
2013.06.17 キャンパス・ハラスメント講習会
 
Cbe profile (tamil)
Cbe profile (tamil)Cbe profile (tamil)
Cbe profile (tamil)
 
Module 14-light
Module 14-lightModule 14-light
Module 14-light
 
Look So Good Offer4photographers
Look So Good Offer4photographersLook So Good Offer4photographers
Look So Good Offer4photographers
 
Medical Wiki Project
Medical Wiki ProjectMedical Wiki Project
Medical Wiki Project
 
Mies Van Der Rohe
Mies Van Der RoheMies Van Der Rohe
Mies Van Der Rohe
 
presentashka
presentashkapresentashka
presentashka
 
Оптимизация фильтра интернет-магазина. Решаем SEO и пользовательскую задачу
Оптимизация фильтра интернет-магазина. Решаем SEO и пользовательскую задачуОптимизация фильтра интернет-магазина. Решаем SEO и пользовательскую задачу
Оптимизация фильтра интернет-магазина. Решаем SEO и пользовательскую задачу
 
рациональный гардероб
рациональный гардеробрациональный гардероб
рациональный гардероб
 
웹기획 V090605
웹기획 V090605웹기획 V090605
웹기획 V090605
 

Viewers also liked

동부CNI - 구글 앱스 사용팁 - 메일에 대용량 파일 첨부
동부CNI - 구글 앱스 사용팁 - 메일에 대용량 파일 첨부동부CNI - 구글 앱스 사용팁 - 메일에 대용량 파일 첨부
동부CNI - 구글 앱스 사용팁 - 메일에 대용량 파일 첨부steve_song
 
1301 구글 문서도구 활용(01) 계정생성,문서작성
1301 구글 문서도구 활용(01) 계정생성,문서작성1301 구글 문서도구 활용(01) 계정생성,문서작성
1301 구글 문서도구 활용(01) 계정생성,문서작성서 창갑
 
소셜웹 기반 협업 프로젝트사례
소셜웹 기반 협업 프로젝트사례소셜웹 기반 협업 프로젝트사례
소셜웹 기반 협업 프로젝트사례Youngmi Kang
 
구글앱스(Google apps) 소개서
구글앱스(Google apps) 소개서 구글앱스(Google apps) 소개서
구글앱스(Google apps) 소개서 Spike Nam
 
협업 툴 사용법
협업 툴 사용법협업 툴 사용법
협업 툴 사용법ang0123dev
 
Google Apps를 활용한 Smart Work 구축
Google Apps를 활용한 Smart Work 구축Google Apps를 활용한 Smart Work 구축
Google Apps를 활용한 Smart Work 구축선진 장
 
보도자료 작성 2014708
보도자료 작성  2014708보도자료 작성  2014708
보도자료 작성 2014708Won Beck
 
[2010 네이트 앱스토어 개발자 세미나] 앱스 제작 사례 (2) 소셜게임 서버 구성 전략
[2010 네이트 앱스토어 개발자 세미나] 앱스 제작 사례 (2) 소셜게임 서버 구성 전략[2010 네이트 앱스토어 개발자 세미나] 앱스 제작 사례 (2) 소셜게임 서버 구성 전략
[2010 네이트 앱스토어 개발자 세미나] 앱스 제작 사례 (2) 소셜게임 서버 구성 전략Cyworld AppStore (SK Communications)
 
4. 구글 무무세(39 p)
4. 구글 무무세(39 p)4. 구글 무무세(39 p)
4. 구글 무무세(39 p)하이퍼테크
 
Google Drive 협업 - 초등학생도 이해하기 쉬운 협업
Google Drive 협업 - 초등학생도 이해하기 쉬운 협업Google Drive 협업 - 초등학생도 이해하기 쉬운 협업
Google Drive 협업 - 초등학생도 이해하기 쉬운 협업CharlyChoi
 
구글을 활용하여 스마트하게 일하기
구글을 활용하여 스마트하게 일하기구글을 활용하여 스마트하게 일하기
구글을 활용하여 스마트하게 일하기(주)위브스튜디오
 
2014 트렌드에 따른 기업 소셜미디어SNS 활용 전략
2014 트렌드에 따른 기업 소셜미디어SNS 활용 전략2014 트렌드에 따른 기업 소셜미디어SNS 활용 전략
2014 트렌드에 따른 기업 소셜미디어SNS 활용 전략Jay Cho
 

Viewers also liked (12)

동부CNI - 구글 앱스 사용팁 - 메일에 대용량 파일 첨부
동부CNI - 구글 앱스 사용팁 - 메일에 대용량 파일 첨부동부CNI - 구글 앱스 사용팁 - 메일에 대용량 파일 첨부
동부CNI - 구글 앱스 사용팁 - 메일에 대용량 파일 첨부
 
1301 구글 문서도구 활용(01) 계정생성,문서작성
1301 구글 문서도구 활용(01) 계정생성,문서작성1301 구글 문서도구 활용(01) 계정생성,문서작성
1301 구글 문서도구 활용(01) 계정생성,문서작성
 
소셜웹 기반 협업 프로젝트사례
소셜웹 기반 협업 프로젝트사례소셜웹 기반 협업 프로젝트사례
소셜웹 기반 협업 프로젝트사례
 
구글앱스(Google apps) 소개서
구글앱스(Google apps) 소개서 구글앱스(Google apps) 소개서
구글앱스(Google apps) 소개서
 
협업 툴 사용법
협업 툴 사용법협업 툴 사용법
협업 툴 사용법
 
Google Apps를 활용한 Smart Work 구축
Google Apps를 활용한 Smart Work 구축Google Apps를 활용한 Smart Work 구축
Google Apps를 활용한 Smart Work 구축
 
보도자료 작성 2014708
보도자료 작성  2014708보도자료 작성  2014708
보도자료 작성 2014708
 
[2010 네이트 앱스토어 개발자 세미나] 앱스 제작 사례 (2) 소셜게임 서버 구성 전략
[2010 네이트 앱스토어 개발자 세미나] 앱스 제작 사례 (2) 소셜게임 서버 구성 전략[2010 네이트 앱스토어 개발자 세미나] 앱스 제작 사례 (2) 소셜게임 서버 구성 전략
[2010 네이트 앱스토어 개발자 세미나] 앱스 제작 사례 (2) 소셜게임 서버 구성 전략
 
4. 구글 무무세(39 p)
4. 구글 무무세(39 p)4. 구글 무무세(39 p)
4. 구글 무무세(39 p)
 
Google Drive 협업 - 초등학생도 이해하기 쉬운 협업
Google Drive 협업 - 초등학생도 이해하기 쉬운 협업Google Drive 협업 - 초등학생도 이해하기 쉬운 협업
Google Drive 협업 - 초등학생도 이해하기 쉬운 협업
 
구글을 활용하여 스마트하게 일하기
구글을 활용하여 스마트하게 일하기구글을 활용하여 스마트하게 일하기
구글을 활용하여 스마트하게 일하기
 
2014 트렌드에 따른 기업 소셜미디어SNS 활용 전략
2014 트렌드에 따른 기업 소셜미디어SNS 활용 전략2014 트렌드에 따른 기업 소셜미디어SNS 활용 전략
2014 트렌드에 따른 기업 소셜미디어SNS 활용 전략
 

More from sejong uni.

More from sejong uni. (6)

M Economy 6장
M Economy 6장M Economy 6장
M Economy 6장
 
벤치마킹
벤치마킹벤치마킹
벤치마킹
 
웹기획
웹기획웹기획
웹기획
 
M Economy 3장 4장
M Economy 3장 4장M Economy 3장 4장
M Economy 3장 4장
 
M Economy
M EconomyM Economy
M Economy
 
미코노미 1장
미코노미 1장미코노미 1장
미코노미 1장
 

구글

  • 2. 목차  구글의 탄생  구글의 공룡화  구글의 분산 스토리지
  • 3. 구글의 탄생 (1) URL 서버가 크롤러에게 웹페이지를 다운로드 하도록 요구한다 (2) 복수의 크롤러가 동시에 다운로드 하면서 docID를 할당해 리포지터 에 저장 (3) 리포지터리에서 웹페이지를 가져오면 인덱스생성이 시작된다. 구조해 석을 통해 웹페이지 내의 텍스트를 추출함과 동시에 웹페이지의 타이틀 등이 DocIndex에 기록되고, URL이 URLlist에 각각 기록된다. (4) 단어 처리에 의해 모든 단어가 Lexicon에 따라 wordID로 변환되고, 단어의 위치와 크기가 모두 Barrels에 기록된다.
  • 4. (5) 웹페이지내에 링크가 있다면 URLlist를 기초로 docID를 조사하고 링크관계를 Links에 기록한다. (6) docID를 찾을 수 없다면 URL Server에 의해 새로 크롤링을 시작한다. (7) 랭킹을 위한 사전 처리를 해야하는데 여기서는 Links를 기초로 페이지 랭크가 계산된다. 최종적인 랭킹처리는 서버가 담당한다. (8) 검색 서버는 User로부터 요청이 들어오면 Lexicon에 따라 검색어를 변환하고 (9) 이어서 Barrels의 역 인덱스에서 docID list를 가져온 후, 각각의 랭킹함수를 적용해 순위를 결정한다. (10) 랭킹에 의해 상위로 올라온 docID는 DocIndex에서 웹페이지의 정보를 가져와 보기 쉽게 이용자에게 반환한다.
  • 5. 구글의 공룡화 (1) 소프트웨어로 신뢰성을 높인다. 하드웨어가 고장나더라도 시스템전체의 동작을 유지할수 있도록 한다. (2) 하드웨어를 늘려서 부하를 분산한다. 데이터를 복제하고 분할하여 하드웨어 늘리기만으로 시스템확장 (3) 비용대비 고성능 하드웨어를 선택한다. 무조건 고성능 하드웨어를 고집할수 없으므로 그시점에서 가격대비 성능이 좋은 하드웨어를 선택한다.