Google : 신화와 야망
구글의 성장
구글의 창립
래리와 세르게이
미시건 출신의 래리페이지는 어릴때부터 발명가를 꿈꿔왔으며, 발명을 통해 세상을 바꾸고 싶다는 포부를 가지고 있었다.
러시아 출신의 브린은 대중적 친화력과 수학에 천부적인 재능을 가지고 있었다.
그들은 스탠포드대학에서 함께 박사과정을 밟으며, 같이 일을 시작하게 되었고 그 만남으로 인해 인생의 크나큰 장을 열게 되었다.
간략한 소개
창립: 1998년창립자: Larry Page와 Sergey Brin
법인 설립: 1998년 9월 4일기업공개(NASDAQ): 2004년 8월 19일
본사: 1600 Amphitheatre Parkway, Mountain View, CA 94043
구글이란..
구글(google)은 구골(googol)의 오자형이다.
구골이란 10의 100제곱을 나타내는 수학 용어
인터넷에 존재하는 무한한 정보를 체계화하겠다는 Google의 의지를 반영
구글의 성장
구글 1.0
웹페이지만을 검색
구글 2.0
웹페이지 이외의 모든 정보들이 검색
책, 뉴스, 동영상, 이 세 분야가 구글의 데이터베이스의 중요한 정보 카테고리
출판 신문 TV엔터테이먼트 업계와 갈등을 겪음
구글 성장의 원동력
Page Rank
웹페이지의 중요도를 객관적으로 평가
페이지 A에서 페이지 B로 연결된 링크 하나를 한 표로 해석
득표 수를 기준으로 해당 페이지의 중요도를 평가
하이퍼텍스트 매칭 분석
페이지의 전체 콘텐츠도 분석
글꼴, 구획 및 단어의 정확한 위치까지 고려
검색결과가 검색어와 가장 관련성이 높은 것인지 확인
구글, 검색어의 일생
구글 적? 동료?
주파수경쟁 / 통신사들과 연합
구글은 2008년 미 연방 정부의 주파수 경매에 참여하여 AT&T, 버라이존(Verizon)과 경쟁
반면 자신들의 소프트웨어가 탑재될 휴대전화를 출시할 통신사들과는 연합
성장을 위해서라면..
Youtube.com
2006년에 16억 5,000만 달러 인수
온라인 동영상 시장 장악
더블클릭(double click)
2008년, 31억 달러 합병
웹사이트 배너 광고 시장 장악
iGoogle을 아시나요?
기존의 구글의 깔끔한 메인에서 변형되어 운영되는 메인 페이지,
간단한 설정으로 처음 뜨는 페이지를 변형할 수 있다.
구글의 수익
구글도 기업, 소득은?
구글의 초기 재정적인 기반
검색엔진임대를 통한 수입
계속되는 재정의 압박
광고를 거부
광고는 검색결과를 왜곡하게 된다고 생각
하지만 텍스트 광고로서 수입을 얻게 됨
구글, 99%의 수익원!
텍스트 광고 도입
2000년에 도입, 초기 2년간 수익은 미비
수정도입 - 사용자의 관심에 따라서 광고를 반영
광고주는 경매방식으로 광고비 정하고
클릭하는 횟수에 따라 광고비를 산출하는 시스템
구글, 99%의 수익원!
텍스트 광고(Text Ads)의 수익
08년 추가적으로 동영상 광고 실험(더블클릭)
텍스트 광고와 함께 나오는 플러스 표시 클릭시 동영상 광고가 나옴. 같은 원칙사용
구글 수익의 그래프
광고를 통해 얻은 수익 어디에 쓸까?
세계 곳곳의 웹페이지 수집하는 재원. (단위 : 천달러)
출처 : http://investor.google.com/fin_data.html
네이버, 애드포스트?
네이버도
애드 포스트라는 이름으로 블로그에 광고를 달게 되었다.
구글의 텍스트광고인
애드센스를 따라서 만든 느낌이 강하다.
네이버의 애드 포스트는
09년도에 시작하여 올해 4월 5일 모든 블로그에 확대 적용된 것이다.
개인 정보도 데이터화!
사용자가 동의하면 구글은 사용자의 사진, 비디오, 이메일, 일정관리 캘린더, 문서, 스프레드시트,
Google : 신화와 야망
구글의 성장
구글의 창립
래리와 세르게이
미시건 출신의 래리페이지는 어릴때부터 발명가를 꿈꿔왔으며, 발명을 통해 세상을 바꾸고 싶다는 포부를 가지고 있었다.
러시아 출신의 브린은 대중적 친화력과 수학에 천부적인 재능을 가지고 있었다.
그들은 스탠포드대학에서 함께 박사과정을 밟으며, 같이 일을 시작하게 되었고 그 만남으로 인해 인생의 크나큰 장을 열게 되었다.
간략한 소개
창립: 1998년창립자: Larry Page와 Sergey Brin
법인 설립: 1998년 9월 4일기업공개(NASDAQ): 2004년 8월 19일
본사: 1600 Amphitheatre Parkway, Mountain View, CA 94043
구글이란..
구글(google)은 구골(googol)의 오자형이다.
구골이란 10의 100제곱을 나타내는 수학 용어
인터넷에 존재하는 무한한 정보를 체계화하겠다는 Google의 의지를 반영
구글의 성장
구글 1.0
웹페이지만을 검색
구글 2.0
웹페이지 이외의 모든 정보들이 검색
책, 뉴스, 동영상, 이 세 분야가 구글의 데이터베이스의 중요한 정보 카테고리
출판 신문 TV엔터테이먼트 업계와 갈등을 겪음
구글 성장의 원동력
Page Rank
웹페이지의 중요도를 객관적으로 평가
페이지 A에서 페이지 B로 연결된 링크 하나를 한 표로 해석
득표 수를 기준으로 해당 페이지의 중요도를 평가
하이퍼텍스트 매칭 분석
페이지의 전체 콘텐츠도 분석
글꼴, 구획 및 단어의 정확한 위치까지 고려
검색결과가 검색어와 가장 관련성이 높은 것인지 확인
구글, 검색어의 일생
구글 적? 동료?
주파수경쟁 / 통신사들과 연합
구글은 2008년 미 연방 정부의 주파수 경매에 참여하여 AT&T, 버라이존(Verizon)과 경쟁
반면 자신들의 소프트웨어가 탑재될 휴대전화를 출시할 통신사들과는 연합
성장을 위해서라면..
Youtube.com
2006년에 16억 5,000만 달러 인수
온라인 동영상 시장 장악
더블클릭(double click)
2008년, 31억 달러 합병
웹사이트 배너 광고 시장 장악
iGoogle을 아시나요?
기존의 구글의 깔끔한 메인에서 변형되어 운영되는 메인 페이지,
간단한 설정으로 처음 뜨는 페이지를 변형할 수 있다.
구글의 수익
구글도 기업, 소득은?
구글의 초기 재정적인 기반
검색엔진임대를 통한 수입
계속되는 재정의 압박
광고를 거부
광고는 검색결과를 왜곡하게 된다고 생각
하지만 텍스트 광고로서 수입을 얻게 됨
구글, 99%의 수익원!
텍스트 광고 도입
2000년에 도입, 초기 2년간 수익은 미비
수정도입 - 사용자의 관심에 따라서 광고를 반영
광고주는 경매방식으로 광고비 정하고
클릭하는 횟수에 따라 광고비를 산출하는 시스템
구글, 99%의 수익원!
텍스트 광고(Text Ads)의 수익
08년 추가적으로 동영상 광고 실험(더블클릭)
텍스트 광고와 함께 나오는 플러스 표시 클릭시 동영상 광고가 나옴. 같은 원칙사용
구글 수익의 그래프
광고를 통해 얻은 수익 어디에 쓸까?
세계 곳곳의 웹페이지 수집하는 재원. (단위 : 천달러)
출처 : http://investor.google.com/fin_data.html
네이버, 애드포스트?
네이버도
애드 포스트라는 이름으로 블로그에 광고를 달게 되었다.
구글의 텍스트광고인
애드센스를 따라서 만든 느낌이 강하다.
네이버의 애드 포스트는
09년도에 시작하여 올해 4월 5일 모든 블로그에 확대 적용된 것이다.
개인 정보도 데이터화!
사용자가 동의하면 구글은 사용자의 사진, 비디오, 이메일, 일정관리 캘린더, 문서, 스프레드시트,
7. pagerank – rank sink 두 페이지가 서로 가리키고 있으며 다른 페이지로는 연결되어 있지 않은 경우 무한 루프에 빠져 랭크를 계속 계산하며 외부로 전혀 분산하지 못한다. rank sink로부터 초래되는 문제를 해결하기 위해 rank source를 도입 source와 sink (그래프 이론 용어) sink : 밖으로 나가는 링크가 없는 것 source : 안으로 들어오는 링크가 없고 밖으로 나가는 것만 잇는 것
8. pagerank (랭크 소스 도입) E(u) : 랭크의 소스에 해당하는 웹 페이지의 벡터 중 하나 Random Surfer Model ‘랜덤 서퍼’의 행동을 모델링한 것이 페이지랭크 실제 웹서퍼가rank sink를 만나 루프 내를 맴돌 가능성 -> ZERO 실제 웹서퍼라면 다른 페이지로 점프할 것이다. -> 부가적인 팩터E
9. Dangling links problem Dangling Links 외부로 나가는 링크가 없는 페이지를 가리키는 링크 Problem dangling link의 가중치가 어디로 분산되고 있는지가 불분명 danglink link가 너무 많다. 다운로드한 문서가 100인 경우 100개의 문서에서 가리키는 링크의 문서를 모두 다운받기 어렵다. Solution dangling link 제거 모든 페이지 랭크가 계산될 때까지 무시 다른 링크의 노멀라이제이션이 영향을 받을 수는 있지만 크게 변화하지는 않는다. 페이지 랭크의 계산이 끝난 후 dangling link 첨가
10. Implementation 부모ID를 이용해서 링크 구조를 정렬 댕글링 링크 제거 몇 번의 반복 작업만으로도 대부분의 댕글링 링크 제거 가능 랭크값 초기화 초기화 값을 잘 설정하면 수렴과정의 속도를 높일 수 있다. 가중치 수렴 현재 진행 중인 단계의 가중치는 메모리에 저장되고 전단계의 가중치는 디스크를 통해 리니어하게엑세스한다. 가중치 수렴 후, 댕글링 링크 추가 후 랭킹 재연산
15. 페이지랭크의 적용 웹 트래픽의 추산 백 링크 예측자로써의 페이지랭크 사용자 네비게이션:페이지랭크 프락시
16. 결론 페이지랭크 페이지의 컨텐트에 상관없이 오직 웹의 그래프 구조 상의 위치에만 의존하는 모든 웹 페이지의 글로벌 랭킹 ‘중요한’페이지로부터의 백링크는 평균적인 페이지들로부터의 백 링크보다 더 중요하다. 재귀적인 정의를 통해 확실히 구현되어 있다. 페이지랭크 실험을 통해 웹 그래프의 구조가 정보검색 작업에서 매우 유용하다는 것을 증명하였다.