google 的搜尋方式 <ul><li>主要參考資料 : </li></ul><ul><li>Sergey Brin and Lawrence Page ,1998, The anatomy of a large-scale hypertex...
搜尋引擎的排名 <ul><li>2003/8,  在美國境內各家搜尋引擎被搜尋的百分比例 ,  分別為 </li></ul><ul><li>Google:32% </li></ul><ul><li>AOL:19% </li></ul><ul><...
搜尋引擎的類型 <ul><li>搜尋引擎快速蓬勃發展大約只有十年左右 </li></ul><ul><li>Google 在搜尋引擎的市場佔有率高達 3/4 </li></ul><ul><li>searchengineguide.com: 付費排...
Web search engines -scaling up:1994-2000 <ul><li>In 1994, one of the first web search engine &quot;World Wide Web Worm(WWW...
Design Goals <ul><li>Improved Search Quality->>Precision </li></ul><ul><li>People are only willing to look at the first fe...
Differences between the web and well controlled collections <ul><li>Web:a vast collection of completely uncontrolled heter...
Description of PageRank Calculation <ul><li>Assume page A has pages  T1..Tn  which point to it(i.e., are citations). The p...
Intuitive description of PageRank: A page has high rank if the sum of the ranks of its backlinks is high.
What's &quot; d &quot; <ul><li>Assume there is a &quot;random surfer&quot; who is given a web page at random and keeps cli...
PageRank 的計算範例 <ul><li>假設一個小網站由三個頁面 A 、 B 、 C 組成 , A 連接到 B 和 C, B 連接到 C, C 連接到 A 。雖然 Page 和 Brin 實際上將阻尼係數 d 設為 0.85 ,  但這裏...
<ul><li>求方程式的解 ,  可得到每個頁面的 PageRank 值: </li></ul><ul><li>PR(A) = 14/13 = 1.07692308 PR(B) = 10/13 = 0.76923077 PR(C) = 15/...
<ul><li>PageRank 的 iteration 計算 </li></ul><ul><li>以前述例子來說明 iteration 計算 ,  這裏設每個頁面的初始值為 1 。 </li></ul><ul><li>重複約 10 次後 , ...
<ul><li>PageRank 理論上擁有最大值 (Nd+(1-d)) ,  這裏的 N 為互聯網頁總數 ,  d 為通常被設為 0.85 ,  計算出的 PageRank 值和工具欄顯示出的數值成一定的比例關係。它們之間的比例並非線性的 ,...
PR value while d=0 to 1 <ul><li>d=0 </li></ul><ul><li>PR(A)=1 </li></ul><ul><li>PR(B)=1 </li></ul><ul><li>PR(C)=1 </li></u...
查詢 :&quot; 大學 &quot;  查詢 :&quot; 科技大學 &quot;  查詢 :&quot; 工業設計系 &quot; <ul><li>Sorting  PageRank  Backlinks </li></ul><ul><...
依前頁查詢所有結果繪製的 scatter diagram
Compress and store pages to repository Each page has ID number called  docID Contains the full HTML of every web pages  Do...
Anchor Text <ul><li>Advantages </li></ul><ul><li>Provide more accurate descriptions  of web pages than the page themselves...
The ranking system <ul><li>Single word query </li></ul><ul><li>Google looks at that document's hit list for that word </li...
Google 搜尋的程序 <ul><li>   Google 通過下述幾個步驟來實現網頁在其搜索結果頁 (SERPS) 中的排名:    1)  找到所有與搜索關鍵字匹配的網頁    2)  根據頁面因素如標題  關鍵字密度等排列等級    3...
Feedback <ul><li>Ranking function has many parameters like the type-weights and type-prox-weights </li></ul><ul><li>(there...
一些影響搜尋結果排序的變數 <ul><li>相似性文件的總合數 </li></ul><ul><li>資料庫內容相關文件的機率 </li></ul><ul><li>文件出現頻率經加權後的總合數 </li></ul><ul><li>廣義性查詢與資料...
如何提高 google 的網站排名  <ul><li>基本作法 </li></ul><ul><li>1.  在網站的標題標簽 (Title,Meta tag) 中包含主要關鍵字和關鍵短語 </li></ul><ul><li>3.  讓網站被大型...
Google 搜尋的特色與應用 <ul><li>集合眾人的智慧 ,  將網路行為應用在搜尋引擎設計上 </li></ul><ul><li>Pagerank 雖無法完全避免商業操作 ( 如買位置 ),  但可 under control </li...
Upcoming SlideShare
Loading in...5
×

Google的搜尋方式與網頁設計注意事項

1,505

Published on

Published in: Design, Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,505
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
13
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Google的搜尋方式與網頁設計注意事項

  1. 1. google 的搜尋方式 <ul><li>主要參考資料 : </li></ul><ul><li>Sergey Brin and Lawrence Page ,1998, The anatomy of a large-scale hypertextual web search engine. http://www- db.stanford.edu/pub/papers/google.pdf </li></ul><ul><li>Larry Page, 1996,The PageRank Citation Ranking-Bringing Order to the Web: http://www.siam.org/meetings/sdm03/proceedings/sdm03_24.pdf </li></ul><ul><li>SEO FORUM: http://www.hkseo.com/seo-article/06-11-2004_20.html </li></ul><ul><li>Webworkshop (pagerank calculator): http://www.webworkshop.net/pagerank.html#top#top </li></ul>Googol:10 的 100 次方 明志科技大學 工業設計系 : 洪偉肯 與網頁設計注意事項
  2. 2. 搜尋引擎的排名 <ul><li>2003/8, 在美國境內各家搜尋引擎被搜尋的百分比例 , 分別為 </li></ul><ul><li>Google:32% </li></ul><ul><li>AOL:19% </li></ul><ul><li>Yahoo:26% </li></ul><ul><li>MSN:17% </li></ul><ul><li>Ask Jeeves:2% </li></ul><ul><li>其它 4%, 其中 AOL 與 Yahoo 採 Google 的資料庫引擎系統資訊 , 換言之 Google 總計合佔 77% 的搜尋引擎市場 </li></ul><ul><li>2003 年 10 月 Hitwise 統計 2 千 5 百萬人次的網路流量資訊顯示 , 搜尋引擎前三名分別為 </li></ul><ul><li>Google:13% </li></ul><ul><li>Yahoo:10.1% </li></ul><ul><li>MSN:7.4% </li></ul>
  3. 3. 搜尋引擎的類型 <ul><li>搜尋引擎快速蓬勃發展大約只有十年左右 </li></ul><ul><li>Google 在搜尋引擎的市場佔有率高達 3/4 </li></ul><ul><li>searchengineguide.com: 付費排序 (pay per click), 通用性引擎 (general search), 整合式引擎 (meta search), 目錄式引擎 (directories) 等共計 13 類 87 個不同特色的搜尋引擎 </li></ul><ul><li>英國 zoomgroup 公司 :6 類 318 個不同類別搜尋引擎 </li></ul><ul><li>Yahoo 的 categories 中 , 總計可列出 472 個搜尋引擎 </li></ul><ul><li>網路排序服務公司聲稱可以將公司網頁登錄於 80 萬 9 千個搜尋引擎或網址 </li></ul>
  4. 4. Web search engines -scaling up:1994-2000 <ul><li>In 1994, one of the first web search engine &quot;World Wide Web Worm(WWWW)&quot; had an index of 110,000 web pages and web accessible documents.(Mcbryan,1994) </li></ul><ul><li>In November,1997, Altavista claimed it handled 20 million queries per day </li></ul><ul><li>Challenges! </li></ul><ul><li>Crawling technology is needed to gather the web documents and keep them up to date. </li></ul><ul><li>Storage space must be used efficiently to store indices and documents. </li></ul><ul><li>The indexing system must process hundreds of gigabytes of data efficiently </li></ul><ul><li>Queries must be handled quickly, at a rate of hundreds to thousands per second </li></ul><ul><li>(luckily, Hardware performance and cost have improved dramatically to partially offset the difficulty.) </li></ul>
  5. 5. Design Goals <ul><li>Improved Search Quality->>Precision </li></ul><ul><li>People are only willing to look at the first few tens of result, But Junk result often wash out any result that a user is interested in. </li></ul><ul><li>Marchiori(1997):the use of more hypertextual information can help improve search and other applications. </li></ul><ul><li>Page(1998) thought that link structure and link text provide a lot of information for making relevance judgments and quality filtering. </li></ul><ul><li>>>Google makes use of both link structure and anchor text </li></ul><ul><li>Academic search engine research </li></ul><ul><li>Usage </li></ul><ul><li>>>Build an architecture that can support novel research activities on large-scale web data. </li></ul>
  6. 6. Differences between the web and well controlled collections <ul><li>Web:a vast collection of completely uncontrolled heterogeneous documents. </li></ul><ul><li>Internal </li></ul><ul><li>Language (both human and programming) </li></ul><ul><li>Vocabulary (email addresses, links, zip codes, phone numbers, product numbers) </li></ul><ul><li>Type of format(text, HTML, PDF, Images, Sounds) </li></ul><ul><li>Machine generated (log files or output from a database) </li></ul><ul><li>external </li></ul><ul><li>Reputation of the source </li></ul><ul><li>Update frequency </li></ul><ul><li>Quality </li></ul><ul><li>Popularity or usage </li></ul><ul><li>Citations </li></ul>
  7. 7. Description of PageRank Calculation <ul><li>Assume page A has pages T1..Tn which point to it(i.e., are citations). The parameter d is a damping factor which can be set between 0 and 1 . google usually sets d to to 0.85 . Also C(A) is defined as the number of links going out of page A. </li></ul><ul><li>PR(A)=(1- d )+( d (( PR ( T1 )/C( T1 )+…+PR( Tn )/C( Tn ))) </li></ul><ul><li>說明 : PR(A) : 網頁 A 頁的 PageRank 值 </li></ul><ul><li>PR(Ti) : 鏈結到 A 頁的網頁 Ti 的 PageRank 值 </li></ul><ul><li>C(Ti) : 網頁 Ti 鏈出的數量 </li></ul><ul><li>d : 阻尼係數, 0<d<1, 一般設為 0.85 。 </li></ul><ul><li>可線上查詢某網頁 PageRank 的網站 : http:// www.pagerank.net / </li></ul><ul><li>可試算 pagerank 公式的網站 : http:// www.webworkshop.net/pagerank.html#top#top </li></ul>
  8. 8. Intuitive description of PageRank: A page has high rank if the sum of the ranks of its backlinks is high.
  9. 9. What's &quot; d &quot; <ul><li>Assume there is a &quot;random surfer&quot; who is given a web page at random and keeps clicking on links, never hitting &quot;back&quot; but eventually gets board and starts on another random page. </li></ul><ul><li>The d damping factor is the probability at each page the &quot;random surfer&quot; will get board and request another random page. </li></ul><ul><li>random surfer 的說明 </li></ul><ul><li>Lawrence Page 和 Sergey Brin 為 PageRank 演算法提出一個非常簡單直觀的解釋。他們將 PageRank 視作一種模型 , 就是用戶不關心網頁內容而隨機點擊鏈結。 </li></ul><ul><li>網頁的 PageRank 值決定了隨機訪問到這個頁面的機率。用戶點擊頁面內的鏈結的機率,完全由頁面上鏈結數量的多少決定的 , 這也是上面 PR(Ti)/C(Ti) 的原因。 </li></ul><ul><li>因此 , 一個頁面通過 random surfer 到達的機率 , 就是它鏈入別的頁面上的鏈結的被點擊概率的和。並且 , 阻尼係數 d 減低了這個概率。 d 的引入 , 是因為用戶不可能無限的點擊鏈結 , 常常因無聊而隨機跳入另一個頁面。 </li></ul><ul><li>阻尼係數 d 定義為用戶不斷隨機點擊鏈結的概率 , 所以 , 它取決於點擊的次數 , 被設定為 0-1 之間。 d 的值越高,繼續點擊鏈結的概率就越大。因此,用戶停止點擊並 random surfer 至另一頁面的概率在式子中用常數 (1-d) 表示。無論入站鏈結如何 , random surfer 至一個頁面的概率總是 (1-d) 。 (1-d) 本身也就是頁面本身所具有的 PageRank 值。 </li></ul>
  10. 10. PageRank 的計算範例 <ul><li>假設一個小網站由三個頁面 A 、 B 、 C 組成 , A 連接到 B 和 C, B 連接到 C, C 連接到 A 。雖然 Page 和 Brin 實際上將阻尼係數 d 設為 0.85 , 但這裏我們為了簡便計算就將其設為 0.5 。儘管阻尼係數 d 的精確值無疑是影響到 PageRank 值的 , 可是它並不影響 PageRank 計算的原理。因此 , 可得到以下計算 PageRank 值的方程式: </li></ul><ul><li>PR(A) = 0.5 + 0.5 PR(C) PR(B) = 0.5 + 0.5 (PR(A) / 2) PR(C) = 0.5 + 0.5 (PR(A) / 2 + PR(B)) </li></ul>資料來源 : http://pr.efactory.de/e-pagerank-implementation.shtml
  11. 11. <ul><li>求方程式的解 , 可得到每個頁面的 PageRank 值: </li></ul><ul><li>PR(A) = 14/13 = 1.07692308 PR(B) = 10/13 = 0.76923077 PR(C) = 15/13 = 1.15384615 </li></ul><ul><li>很明顯所有頁面 PageRank 之和為 3 ,等於網頁的總數。 </li></ul><ul><li>對於這個只有三個頁面的簡單範例來說 , 通過方程組很容易求得 PageRank 值。但實際上 , 互聯網包含數以億計的檔案 , 是不可能解方程組的。 </li></ul><ul><li>由於實際的互聯網頁數量 , Google 搜索引擎使用了一個近似的、迭代的計算方法計算 PageRank 值。就是說先給每個網頁一個初始值,然後利用上面的公式 , 迴圈進行有限次運算得到近似的 PageRank 值。 </li></ul>
  12. 12. <ul><li>PageRank 的 iteration 計算 </li></ul><ul><li>以前述例子來說明 iteration 計算 , 這裏設每個頁面的初始值為 1 。 </li></ul><ul><li>重複約 10 次後 , 可得到一個良好的接近 PageRank 理想值的近似值。根據 Lawrence Page 和 Sergey Brin 共開發表的文章 , 他們實際需要進行 100 次迭代才能得到整個互聯網的滿意的網頁級別值。 </li></ul>
  13. 13. <ul><li>PageRank 理論上擁有最大值 (Nd+(1-d)) , 這裏的 N 為互聯網頁總數 , d 為通常被設為 0.85 , 計算出的 PageRank 值和工具欄顯示出的數值成一定的比例關係。它們之間的比例並非線性的 , 而是成 對數關係 。如果設阻尼係數 d 為 0.85 而 PageRank 的最低值為 0.15, 並且對數的基數為 6, 可得到以下的比例關係: </li></ul><ul><li>可下載 pagerank 的 toolbar 來觀察 </li></ul>
  14. 14. PR value while d=0 to 1 <ul><li>d=0 </li></ul><ul><li>PR(A)=1 </li></ul><ul><li>PR(B)=1 </li></ul><ul><li>PR(C)=1 </li></ul><ul><li>d=0.1 </li></ul><ul><li>PR(A)=1 </li></ul><ul><li>PR(B)=0.95 </li></ul><ul><li>PR(C)=1.05 </li></ul><ul><li>d=0.2 </li></ul><ul><li>PR(A)=1 </li></ul><ul><li>PR(B)=0.9 </li></ul><ul><li>PR(C)=1.1 </li></ul><ul><li>d=0.3 </li></ul><ul><li>PR(A)=1 </li></ul><ul><li>PR(B)=0.85 </li></ul><ul><li>PR(C)=1.15 </li></ul><ul><li>d=0.4 </li></ul><ul><li>PR(A)=1 </li></ul><ul><li>PR(B)=0.8 </li></ul><ul><li>PR(C)=1.2 </li></ul><ul><li>d=0.5 </li></ul><ul><li>PR(A)=1 </li></ul><ul><li>PR(B)=0.75 </li></ul><ul><li>PR(C)=1.25 </li></ul><ul><li>d=0.6 </li></ul><ul><li>PR(A)=1 </li></ul><ul><li>PR(B)=0.7 </li></ul><ul><li>PR(C)=1.3 </li></ul><ul><li>d=0.7 </li></ul><ul><li>PR(A)=1 </li></ul><ul><li>PR(B)=0.65 </li></ul><ul><li>PR(C)=1.35 </li></ul><ul><li>d=0.8 </li></ul><ul><li>PR(A)=1 </li></ul><ul><li>PR(B)=0.6 </li></ul><ul><li>PR(C)=1.4 </li></ul><ul><li>d=0.9 </li></ul><ul><li>PR(A)=1 </li></ul><ul><li>PR(B)=0.55 </li></ul><ul><li>PR(C)=1.45 </li></ul><ul><li>d=1 </li></ul><ul><li>PR(A)=1 </li></ul><ul><li>PR(B)=0.5 </li></ul><ul><li>PR(C)=1.5 </li></ul>d=0.85 PR(A)=1 PR(B)=0.575 PR(C)=1.425 補充 : 此頁為 &quot; 同時 &quot; 代入 PR(A)=1,PR(B)=1,PR(C)=1 之結果 , 故在 d=0.5 處與前述不同 公式 PR(A) = 0.5 + 0.5 PR(C) PR(B) = 0.5 + 0.5 (PR(A) / 2) PR(C) = 0.5 + 0.5 (PR(A) / 2 + PR(B)) 計算結果 PR(A) = 0.5 + 0.5 (1)=1 PR(B) = 0.5 + 0.5 (0.5)=0.75 PR(C) = 0.5 + 0.5 (0.5 + 0.75)=1.125--> 此時代入的 PR(B) 值為 0.75
  15. 15. 查詢 :&quot; 大學 &quot; 查詢 :&quot; 科技大學 &quot; 查詢 :&quot; 工業設計系 &quot; <ul><li>Sorting PageRank Backlinks </li></ul><ul><li>台大 8 964 </li></ul><ul><li>長庚 6 233 </li></ul><ul><li>中山 6 311 </li></ul><ul><li>元智 6 401 </li></ul><ul><li>文化 6 475 </li></ul><ul><li>政大 4 ?? 17 ?? </li></ul><ul><li>海洋 6 231 </li></ul><ul><li>銘傳 6 156 </li></ul><ul><li>嘉大 5 139 </li></ul><ul><li>淡江 6 249 </li></ul><ul><li>世新 5 105 </li></ul><ul><li>朝陽 5 238 </li></ul><ul><li>義守 6 13100 </li></ul><ul><li>中華 5 89 </li></ul><ul><li>華梵 5 484 </li></ul><ul><li>Sorting PageRank Backlinks </li></ul><ul><li>北科 5 248 </li></ul><ul><li>雲科 5 157 </li></ul><ul><li>朝陽 5 238 </li></ul><ul><li>屏科 5 106 </li></ul><ul><li>台科 ( 圖 ) 5 52 </li></ul><ul><li>樹德 5 51 </li></ul><ul><li>嘉藥 5 78 </li></ul><ul><li>台科 5 94 </li></ul><ul><li>龍華 4 31 </li></ul><ul><li>輔英 5 54 </li></ul><ul><li>高應 5 54 </li></ul><ul><li>正修 4 28 </li></ul><ul><li>雲科 ( 圖 ) 6 116 </li></ul><ul><li>清雲 4 34 </li></ul><ul><li>高第一 5 100 </li></ul><ul><li>明新 4 33 </li></ul><ul><li>明志 5 46 </li></ul><ul><li>萬能 6 70 </li></ul><ul><li>弘光 4 20 </li></ul><ul><li>南台 5 48 </li></ul>目標 : 台灣的網頁 2005/4/6 沒有以下的學校 Why ??? 台師大 (7,871)-title,frame, keyword 清大 (6,39)-title, keyword 交大 (7,691)-links, keyword 陽明 (6,252)-title, keyword 中央 (6,496)-title, keyword 台科的排序 ??(title, Meta, Keyword) <ul><li>Sorting PageRank Backlinks </li></ul><ul><li>成大 4 8 </li></ul><ul><li>雲科 4 19 </li></ul><ul><li>長庚 4 5 </li></ul><ul><li>大葉 0 ?? 0 ?? </li></ul><ul><li>朝陽 3 4 </li></ul><ul><li>明志 4 3 </li></ul><ul><li>華梵 3 3 </li></ul><ul><li>北科 3 7 </li></ul>北科工設 ??(flash,title, Keyword) 查詢 : 工商業設計系 : 1. 台科 2. 亞東 查詢 : 工業設計科 : 1. 亞東 2. 明志 3. 聯合
  16. 16. 依前頁查詢所有結果繪製的 scatter diagram
  17. 17. Compress and store pages to repository Each page has ID number called docID Contains the full HTML of every web pages Downloading of web pages Send lists of URLs Read ,uncompress and parse pages Parse out all the links in pages and store important information in an anchors file Convert into a set of word occurrences called hits Every word is converted into a wordID by using an in-memory hash table-Lexicon Hits record the word, position in document, font size, capitalization Contains information to determine where each link points from and to, and the text of the link. Convert relative URLs into absolute URLs. Turn into docIDs Put anchor text into the forward index Generate a database of links of docIDs >>used to compute PageRank Sorted by docID , and resorts them by wordID 53.5G 147.8G 293M 3.9G 9.7G 6.6G <ul><li>Number of web pages fetched: 24million </li></ul><ul><li>Number of Urls Seen: 76.5million </li></ul><ul><li>Number of Email address : 1.7million </li></ul><ul><li>Number of 404's:1.6million </li></ul>
  18. 18. Anchor Text <ul><li>Advantages </li></ul><ul><li>Provide more accurate descriptions of web pages than the page themselves </li></ul><ul><li>Anchors may exist for documents which cannot be indexed by a text-based search engine, such as images, programs, and databases. </li></ul><ul><li>possible to return web pages which have not actually been crawled . </li></ul><ul><li>Other Features </li></ul><ul><li>It has location information for all hits and so it makes extensive use of proximity in search </li></ul><ul><li>Google keeps track of some visual presentation details such as font size of words. Words in a larger or bolder font are weighted higher than other words. </li></ul><ul><li>Full raw HTML of pages is available in a repository. </li></ul>
  19. 19. The ranking system <ul><li>Single word query </li></ul><ul><li>Google looks at that document's hit list for that word </li></ul><ul><li>Compute IR score by type-weight and count-weight </li></ul><ul><li>Combine the IR score with PageRank to give a final rank to the document </li></ul><ul><li>Multi-word search </li></ul><ul><li>Hits occuring close together in a document are weighted higher than hits occuring far apart </li></ul><ul><li>Compute tha proximity to get a type-prox-weight . </li></ul><ul><li>Compute IR score by type-prox-weight and count-weight . </li></ul><ul><li>All of these matrices can all be displayed in the search result. </li></ul>
  20. 20. Google 搜尋的程序 <ul><li>   Google 通過下述幾個步驟來實現網頁在其搜索結果頁 (SERPS) 中的排名:    1)  找到所有與搜索關鍵字匹配的網頁    2)  根據頁面因素如標題 關鍵字密度等排列等級    3)  計算導入鏈結的錨文本中的關鍵字    4)  通過 PageRank 得分調整網站排名結果 </li></ul>
  21. 21. Feedback <ul><li>Ranking function has many parameters like the type-weights and type-prox-weights </li></ul><ul><li>(there are 200million parameters and 5000million hits now) </li></ul><ul><li>http://www.google.com.hk/intl/zh-TW/corporate/tech.html </li></ul><ul><li>Figuring out the right values for these parameters is something of a black art. </li></ul><ul><li>Using a user feedback mechanism to evaluate all of the results that are returned. </li></ul>
  22. 22. 一些影響搜尋結果排序的變數 <ul><li>相似性文件的總合數 </li></ul><ul><li>資料庫內容相關文件的機率 </li></ul><ul><li>文件出現頻率經加權後的總合數 </li></ul><ul><li>廣義性查詢與資料庫內容描述的相似性字義 </li></ul><ul><li>相似性文件數量採門檻值的期望值 </li></ul><ul><li>關鍵字頻率 </li></ul><ul><li>按照語言 , 區域 , 日期 , 網域 , URL 分類 </li></ul><ul><li>網頁出現主題的次數 </li></ul><ul><li>搜尋詞句的出現次數 </li></ul><ul><li>資料庫中搜尋詞句的字數 </li></ul><ul><li>一筆記錄中關鍵字的出現次數 </li></ul><ul><li>一筆記錄中關鍵字出現的頻率 </li></ul><ul><li>資料庫索引中記錄的筆數 </li></ul>
  23. 23. 如何提高 google 的網站排名 <ul><li>基本作法 </li></ul><ul><li>1.  在網站的標題標簽 (Title,Meta tag) 中包含主要關鍵字和關鍵短語 </li></ul><ul><li>3. 讓網站被大型門戶網站收錄 , 如知名網路目錄 DMOZ , Yahoo 和 Looksmart </li></ul><ul><li>4.  提高網站外部鏈結的質量和數量 </li></ul><ul><li>就目前來說,要想在 Google 中取得理想排名的重點是外部鏈結而不是 PageRank     </li></ul><ul><li>1)  須有相當數量的外部鏈結 </li></ul><ul><li>2)  外部鏈結應與網站內容密切相關  </li></ul><ul><li>3)  這些鏈結應來自不同的 C 類 IP 位址  (nnn,hhh,hhh,hhh) </li></ul><ul><li>4)  在這些鏈結的鏈結文字中應富含關鍵字  </li></ul><ul><li>5)  鏈結文字在內容上應靈活多變 ( 重視相關性而非重複 )  </li></ul><ul><li>< 注意 > 絕大多數搜索引擎的 SPIDERS 無法支援 javascript, frame 與動態生成網頁 (asp), 免費網頁或網址過長通常也找不到 , 網頁採用靜態 HTML 標記是最佳方式 . 而對於 flash 的 swf 檔或圖片應盡可能加上 alt 標記 . </li></ul>
  24. 24. Google 搜尋的特色與應用 <ul><li>集合眾人的智慧 , 將網路行為應用在搜尋引擎設計上 </li></ul><ul><li>Pagerank 雖無法完全避免商業操作 ( 如買位置 ), 但可 under control </li></ul><ul><li>排名第一的是 best backlink, 如同學術上的 citation </li></ul><ul><li>Google 的研發人員不斷增加與修正變數 , 預期 pagerank 的重要性將逐漸降低至 30% 以下 . </li></ul><ul><li>相關研究如分析那些是使用頻繁但 pagerank 很低的網頁 </li></ul><ul><li>用以分析競爭者 , 瞭解值得信賴的網站 ( 例如 search:&quot;car rental&quot;) </li></ul><ul><li>提供一種機制 , 透過機制的運作讓隱含的資訊顯露出來 </li></ul>
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×