導論
搜尋引擎




I. 搜尋引擎
「Google」的名稱是從「googol」衍生而來,這個字是由美國數學家 Edward Kasner 的侄子 -
Milton Sirotta 所創造。一個 Googol 所代表的數字為 1 後面加上 1...
c. 刪除帳戶
  ��.4Google Alert
  ��.5Google Sets
  ��.6Google Suggest

我們通常將美國之外的國家/地區的用戶從 Google.com 重定向到我們面向特定國家/地區的網站
(例如,針...
Google 可以為大多數的網頁和檔案建立索引, 涵蓋的副檔名有:
pdf、asp、cfm、doc、html、jsp、lwp、php、ppt、rtf、shtml、swf、wks、 wri、xml、xls 等。


Google 的漫遊器會定期檢...
清楚的階層和文字連結是必要的, 每個網頁至少能從一個靜態文字連結加以開啟。
提供網站地圖給使用者, 並加入指向重要部分的連結; 網站地圖不得大於 100 個連結。
網站本身以實用為目的, 網頁內容應清楚正確地呈現其內容。
從使用者角度思考, 將...
為使用者製作網頁, 不是為搜尋引擎製作網頁。實際的內容應與搜尋引擎找到的相符, 否則即是
「偽裝」(cloaking)。
避免以不當手法改善在搜尋引擎的排名。應該自問: 「沒有搜尋引擎時, 還會這樣做嗎?」
不要刻意增加網站排名或網頁級的連結。...
1a2b. 移除部份網站內容


有兩種方式指示網頁爬梳器移除部份網站內容, 以 Robots.txt 移除特定目錄或檔案類型的網頁, 以
中繼標記移除特定網頁的內容。

若要移除特定目錄(angelina)下的所有網頁, 則在 robots....
若要 Google 排除網站中的放在/images/目錄裡的 dogs.png 圖檔, 應在 robots.txt 裡, 使用如下的標
記:

User-agent: Googlebot-Image
Disallow: /images/dogs...
1c. 搜尋


好的搜尋引擎完全配合用戶的想法, 不要太多思考, 把想到的字詞直接鍵入, 就會出現預期的結
果。


如果, 與設想的情況不同, 就好好的研究 Google 的服務吧!


Google 技術

Google 出類拔萃的地方在...
3. 搜 尋結果會在一   1. 網 頁伺服器將查詢傳送給索引伺服器。在索引伺
秒內傳回給使用者。     服器內的內容,就像是書本後面的索引一般 - 它會告
知使用者哪個網頁包含符合查詢的字詞。




        2.查詢接著會傳到文件伺服器,此時才會確實從儲存的文件中擷取資
        訊。而後會產生一小段落的文字來描述每個搜尋結果。




2. 排序


我們對網頁的關鍵字不進行人工...
2a. 評鑑


面對無窮盡的網路資源, 圖書館員及使用者最困擾的事, 不再是找不到資料, 而是判斷資料本身的
合用性。從網站為出發點, Google 列出五項判斷的原則:


Availability [可及性] - 網站運作正常, 資料可自...
網頁級別的值, 由 0 至 10, 分為 11 個等級。被 Google 爬梳到的網頁, 都有網頁級別。新加入的網
頁, 其網頁級別值都是 0, 只有百來個網頁, 得到網頁級別值的最高值 10, 包括
yahoo.com、adobe.com 等...
2d. 搜尋引擎最佳化專員(SEO)


搜索引擎優化是 Search Engine Optimization 的譯名, 縮寫為 SEO。調整網站的內容, 讓它配合搜
尋引擎的排序法則, 稱為搜尋引擎最佳化專員。經過優化的網站, 明顯排名上升,...
務,請在 Google 首頁上按一下 [我的帳戶] 連結,並在左邊的選單上選擇 [刪除個人化搜尋]。
請確認您已經登入 Google 帳戶,這樣才能看到 [我的帳戶] 連結。

注意: 如果您和別人共用電腦,而且不希望別人看到您的個人化首頁 (...
淨。


帳戶的使用者名稱就是您完整的電子郵件地址。接著, 就照著步驟進行即可, 熟稔網路的運作, 就
沒有問題; 若有任何問題, 最大的可能還是使用者本身對網路及電子郵件不熟悉所造成, 向
Google 抱怨之前, 先請教朋友, 排除問題的速...
•   可在任何語言字典中查到的字。
  •   字典中常見的數字/字母取代方法,例如用 0 代替字母 O、用數字 1 代替字母 L、用數字
      3 代替字母 E 等。
  •   在此或網路上找到的任何密碼範例。

好密碼應符合下列條...
��.1Google 快訊
  ��.2Google 網上論壇
  ��.3個人化搜尋
  ��.4Google Answer[懸賞提問]
  ��.5Gmail/交談
  ��.6Froogle[購物清單]
  ��.7個人化網頁
  ��....
左邊為過去兩天的搜尋記錄, 沒有點擊結果的搜尋會被特別標示; 右邊有個日曆, 依搜尋總數以不
同的顏色深度呈現。


對瞭解過去的行為, 很有幫助。

為了提供這項服務, 個人化搜尋會儲存用戶在 Google 的活動資訊, 包括搜尋查詢、點選的...
Gmail 有中文介面沒有中文名稱, 是網頁郵件的一種新嘗試,這個概念是要建立一個不用再刪除
郵件,且您可以隨時找到想要的郵件。主要的功能包含:


  •   只需搜尋, 而不用分類。使用 Google 搜尋特定的郵件, 不論它是已傳送或已接...
��.2Google 網上論壇
  ��.3個人化搜尋[需要密碼]
  ��.4Gmail[需要密碼]
  ��.5Google 新聞
  ��.6orkut [需要密碼]

  ��.7Froogle 購物清單
  ��.8Google 使用...
Google 我的網站可以協助網站管理員:

  •   更好的搜尋涵蓋範圍和較新的搜尋結果, 以協助人們找到更多用戶的網頁。
  •   有了智慧型的搜尋, 就可以告訴 Google, 網頁修改的時間或網頁變更的頻率等。
  •   詳細的報...
��.3Baidu [百度網站]

  ��.4wikipedia [維基百科]

  ��.5orkut
  ��.6iTunes
  ��.7Sky News
  ��.8World of Warcraft
  ��.9Green Day
...
��.6中国移动(China mobile)
  ��.7刀光传奇(a game's name)
  ��.8火影忍者(a game's name)
  ��.9驱动之家(an IT website)
  ��.10吉祥三宝(a song's ...
多因素 (像是地理位置和搜尋流量) 決定查詢會送到哪裡。 因為我們所有資料中心並不是同步更
新,有可能會因哪個資料中心處理您的查詢,導致搜尋結果有些微出入。

儘管我們無法保證任何網頁在搜尋結果內的排名將保持不變,或者將網頁納入所有適用的搜尋
...
避開那些指稱利用「完全免費」連結來連結熱門配置的 SEO,或是那些指稱能送出您的網站至上千個搜尋引擎的
SEO。 這些通常是白費工夫,它們不會影響您在主要搜尋引擎結果中的排名 -- 至少,它們沒有您想像中的正面效
果。
   • 一些 SEO ...
•   在搜尋結果中無法區別哪些是真正的搜尋結果和廣告
   •   保證排名位置,但是只侷限在那些模糊冗長的關鍵字
   •   以多重別名或偽造的 WHOIS 資訊操作
   •   從「假造的」搜尋引擎、間諜軟體或變臉軟體 (Scumwa...
Upcoming SlideShare
Loading in …5
×

導論

984 views
893 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
984
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
5
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

導論

  1. 1. 導論 搜尋引擎 I. 搜尋引擎 「Google」的名稱是從「googol」衍生而來,這個字是由美國數學家 Edward Kasner 的侄子 - Milton Sirotta 所創造。一個 Googol 所代表的數字為 1 後面加上 100 個零。Googol 是一個非常大 的數目, 宇宙中沒有任何事物可以用 Googol 來表示,即使是星辰、微塵粒子或原子也是如此。 Google 沿用此字來對映我們的任務 - 組織世界上無窮無盡的資訊,供全球使用並讓大家從中受 益。 「Google」唸做「goo-gull」 (有點像「noodle」,但是把「n」和「d」換成「g」)。 兩個「o」 的發音與在「moo」和「kangaroo」中相同。 1. 運作模式 ��.1三部曲 a. 爬梳 i. 對爬梳器友善 ii. 移除內容 b. 索引 c. 搜尋 ��.2排序 a. 評鑑 b. 網頁級別(PageRank) c. PigeonRank[鴿子排行] d. 搜尋引擎最佳化專員(SEO) ��.3帳戶(Google Account) a. 個人資料 b. 服務資訊 i. Google 快訊 ii. Google 網上論壇 iii. 個人化搜尋 iv. Google Answer[懸賞提問] v. Gmail vi. Froogle[購物清單] vii. 個人化的主頁 viii. 使用的語言 ix. 谷 歌視訊上載計劃 x. 文字廣告[AdWord] xi. Google 新聞 xii. orkut
  2. 2. c. 刪除帳戶 ��.4Google Alert ��.5Google Sets ��.6Google Suggest 我們通常將美國之外的國家/地區的用戶從 Google.com 重定向到我們面向特定國家/地區的網站 (例如,針對德國的 Google 網站是 www.google.de ),以使用戶可以輕鬆使用面向特定國家/ 地區的搜索功能。我們使用您電腦的 IP 位址來確定您的位置以及相應的 Google 域,這一 IP 地 址通常是您的互聯網服務提供商 (ISP) 的互聯網地址。 如果您希望訪問 Google.com 而不進行重定向,請單擊 Google 主頁右下方的"Google.com"鏈 結。 如果您啟用了 cookie,之後每次進行訪問時,您的流覽器都會直接連接到 Google.com。有關 cookie 的詳細資訊,請訪問 http://www.google.com.tw/cookies.html 和 http://www.google.com.tw/privacy.html 如果禁用 cookie,則每次訪問 Google 時,都照樣會進行重定向。啟用 cookie 或為 http://www.google.com/webhp 設置書簽都可以解決這一問題。在後一種情況下,每次在您選擇 該書簽時,都會轉到 http://www.google.com/webhp ,它與 Google.com 完全相同。 最後,如果您認為我們沒有正確地檢測您的 IP 位址,請提供以下資訊。 1. 您的 IP 地址。 如果您不知道自己的 IP 位址,請單擊"開始">"運行"> 鍵入"cmd"> 單擊"確定"> 鍵入"ipconfig"> 按 Enter 鍵。您的 IP 地址類似於:217.148.184.7 2. 您的實際位置(例如:法國巴黎) 3. 您被重定向到的 Google 網站(例如,Google.co.in)。 如果問題出在我們這端,我們會在數周內解決這個問題。 1. 三部曲 搜尋引擎的運作模式, 可分為三個程序: 爬梳網頁資訊、索引成資料庫、用戶搜尋。 1a. 爬梳 Googlebot 是 Google 爬梳網頁資訊的工具, 即俗稱的蜘蛛精(spider)的程式, 不捨晝夜地在網路上 爬梳資料, 傳回 Google 的伺服器, 並對每份資料編號, 以備使用者搜尋。
  3. 3. Google 可以為大多數的網頁和檔案建立索引, 涵蓋的副檔名有: pdf、asp、cfm、doc、html、jsp、lwp、php、ppt、rtf、shtml、swf、wks、 wri、xml、xls 等。 Google 的漫遊器會定期檢索網頁,為超過幾十億的網頁產生索引。 在我們很快將完成的下次檢 索後,新網站、現有網站的變更及無效連結均會反應在索引中。因為我們每次檢索時收集大量 資訊,因此更新程序是完全自動化的。 我們無法對個別網站進行手動變更。 我在搜尋結果中找不到我最喜愛的網站。Google 是如何找到網站並將他們添加到檢索中? Google 是使用 [spiders] 軟體在網路上定期抓取網站的全自動搜尋引擎。它通過每個網頁的超連 結找到網站並添加到我們的檢索中。如果您想更進一步瞭解關於 Google 搜索的技術資訊,請您 查看 http://www.google.com/intl/zh-TW/corporate/tech.html 儘管 Google 抓取無以計數的網頁,但是不可避免會漏抓一些網站。如果 Google 沒有抓取到某 網站,那很有可能使因為以下的某個原因: - 該網站與其他的網頁沒有很好地通過多個連結相連。 - 該網站是在 Google 最近一次抓取完成之後才發佈的。 - 該網站的設計使 Google 難以有效地抓取其內容。 - 該網站在我們嘗試抓取時暫時無法獲得。 請注意,納入 Google 的搜尋結果是免費的,並且我們的抓取過程是全自動的。我們不接受為納 入檢索結果的付費,我們也決不人工操縱搜尋結果。我們深信憑藉網路民主可以確定搜尋結 果 所包括的內容和網頁排序。如想獲得更多關於在索引中針對網站的可行性實踐的資訊,請您造 訪我們的網站管理員指南 http://www.google.com.tw/support/webmasters/bin/answer.py? answer=35769 有時候 Google 搜尋結果會出現不包含您搜尋字詞或詞組的頁面。 即使您執行詞組搜尋時也可 能發生此情況。 在評估某網頁的價值與相關性時,Google 查看的不只是網頁本身的內容,同時 也會查看連結文字錨點指向的網頁。如果指向網頁的鏈結包含您搜索的片語,Google 可能會將 其視為符合查尋的匹配項而返回此頁。發生这种情況時,我們網頁的快取副本會在左上角的區 域,顯示下列訊息: [這些字詞只出現在指向本網頁的連結]。對多數的搜尋而言 (包含詞組搜 尋),對文字錨點的評估大大地改善了搜尋結果的相關性。 1a1. 對爬梳器友善 對網頁爬梳器友善的網站, 有助於搜尋引擎找到它。 1a1a. 網站設計及網頁內容 設計網站及撰寫網頁時, 應遵照下列的原則, 便於被搜尋引擎找到。
  4. 4. 清楚的階層和文字連結是必要的, 每個網頁至少能從一個靜態文字連結加以開啟。 提供網站地圖給使用者, 並加入指向重要部分的連結; 網站地圖不得大於 100 個連結。 網站本身以實用為目的, 網頁內容應清楚正確地呈現其內容。 從使用者角度思考, 將使用者想到旳字詞納入網頁。 重要的名稱、內容或連結, 應以文字顯示, 搜尋引擎無法辨識在圖檔裡的文字。 網頁的「標題」、相關的「ALT」標記, 都有明確且正確描述。 檢查 HTML 語法的正確性, 刪除及更新無效的連結。 儘量少用動態網頁, 即包括「?」字元的網頁; 網頁爬梳器一定可以檢索靜態網頁, 但常常漏失動 態動態網頁的內容, 即使有必要, 也應保持參數的簡短。 每個網頁的連結數量在合理的範圍內, 100 個連結是公認的上限。 1a1b. 技術 採用簡單的技術架設網站及撰寫網頁。 使用 Lynx 之類的文字瀏覽器檢查網站, 能夠被文字瀏覽器閱讀的網站, 才是好的網站。自動尋檢 程式瀏覽網站的方法和 Lynx 近似。JavaScript、 cookies、工作階段 ID(session ID)、頁 框、DHTML 或 Flash 等花俏功能, 文字瀏覽器都無法閱讀, 自動尋檢程式也可能有問題。 允許網頁爬梳器檢索整個網站, 不要採用工作階段 ID 或引數的方法, 追蹤網頁的路徑。這些技術 在追蹤個別使用者行為時很有用, 但網頁爬 梳器以不同的方式運作。採用這些技術將導致索引 不完整, 讓網頁爬梳器無法刪除那些看起來不同, 但實際上卻指向同一網頁的網址。 確認網頁伺服器支援 If-Modified-Since HTTP 標頭, 允許網頁伺服器告訴搜尋引擎, 自從上次爬梳 之後, 網站內容是否有變動, 以節省頻寬。 使用內容管理系統時, 應確認該系統可匯出內容供網頁爬梳器爬梳網站之用。 不要使用「&id=」作為網址的參數, 因為搜尋引擎不會索引這些網頁。 1a1c. 推廣網站 秘密社團的網站儘量隱蔽, 不要讓外人知道, 以密碼或其他方法控制訪客。除此之外, 絕大多數的 網站架好, 網頁就緒時, 都應儘量推廣: 請求相關的網站連結至該網站。 主動提交至各大搜尋引擎, 如: http://www.google.com.tw/addurl/?hl=zh-TW&continue=/addurl。 參與 Google 網站地圖的運作, 提交網站地圖, 讓 Google 瞭解網站的架構, 增加 Google 對網頁的涵 蓋範圍。 確認相關網站知道該網頁, 且了解網站已經開站。 提交您的網站到相關的目錄, 如「開放式目錄專案」(Open Directory Project)及其他專業網站目 錄。 1a1d. 網頁品質 優良的網頁品質, 不但有助於搜尋引擎的運作, 也可增加使用者的信心。
  5. 5. 為使用者製作網頁, 不是為搜尋引擎製作網頁。實際的內容應與搜尋引擎找到的相符, 否則即是 「偽裝」(cloaking)。 避免以不當手法改善在搜尋引擎的排名。應該自問: 「沒有搜尋引擎時, 還會這樣做嗎?」 不要刻意增加網站排名或網頁級的連結。尤其避免連結至廣告網站等網路惡棍, 反而造成負面影 響。 不要以 WebPosition 等軟體, 主動送出網頁和檢查排名。 避免隱藏文字或隱藏連結。 不要使用偽裝或鬼祟的重新導向功能。 不要對搜尋引擎送出自動查詢。 不要載入具有不相關字詞的網頁。 不要建立擁有大量相同內容的多個網頁、子網域或網域。 避免用專門為搜尋引擎建立的「入口」網頁, 或網站聯盟(Affiliate Program)的行銷模式。 1a2. 移除內容 Google 本身不審查網頁的內容, 只會在下列情況三種情況下, 停止爬梳特定的網頁: ��.1網站管理員提出要求 ��.2網頁為垃圾訊息 ��.3受到法律要求 有一個業界標準, 供不願意被搜尋引擎爬梳的網站使用。在網站伺服器的根目錄, 置入一個名稱 為 robots.txt 的檔案, 絕大多數的網頁爬梳器都遵循此通訊協定, 將此伺服器的網頁內容, 自索引 中排除。它的技術資料是公開的, 請參閱: http://www.robotstxt.org/wc/norobots.html。不過, 這是 君子協定, 刻意違反此協定的網頁爬梳器, 依然可以讀取相關的資料。 1a2a. 移除網站內容 為阻擋網頁爬梳器進入, 可將下列 robots.txt 檔案放到您伺服器的根目錄中:在伺服器的根目錄 裡, 置入檔名為 robots.txt 的純文字檔, 其內容為: User-agent: * Disallow: / 若祗想防止 Google 的網頁爬梳器進入, 則在第一行加入其名稱 Googlebot, 歡迎其他搜尋引擎的 網頁爬梳器, 祗排除 Google 的網頁爬梳器: User-agent: Googlebot Disallow: / 每個通訊埠都應有自己的 robots.txt 檔案。
  6. 6. 1a2b. 移除部份網站內容 有兩種方式指示網頁爬梳器移除部份網站內容, 以 Robots.txt 移除特定目錄或檔案類型的網頁, 以 中繼標記移除特定網頁的內容。 若要移除特定目錄(angelina)下的所有網頁, 則在 robots.txt 裡, 置入下列文字: User-agent: Googlebot Disallow: /angelina 若要移除特定檔案類型(.doc)的所有檔案, 則在 robots.txt 裡, 置入下列文字: User-agent: Googlebot Disallow: /*.doc$ 若要移除動態產生的網頁, 則在 robots.txt 裡, 置入下列文字: User-agent: Googlebot Disallow: /*? 個別網頁不願意被網頁爬梳器取走內容, 可在網頁最前端, 加入<META>標記, 指示網頁爬梳器不 要產生該網頁的索引: <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> 可以單獨阻止 Google 的網頁爬梳器, 同意其他搜尋引擎的網頁爬梳器產生該網頁的索引: <META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW"> 祗同意網頁爬梳器對該網頁做索引, 但不同意將對外的連結, 納入索引, 則使用如下的標記: <META NAME="ROBOTS" CONTENT="NOFOLLOW"> 1a2c. 移除圖檔
  7. 7. 若要 Google 排除網站中的放在/images/目錄裡的 dogs.png 圖檔, 應在 robots.txt 裡, 使用如下的標 記: User-agent: Googlebot-Image Disallow: /images/dogs.png 若要 Google 排除網站中的所有圖檔, 應在 robots.txt 裡, 使用如下的標記: User-agent: Googlebot-Image Disallow: / 1b. 索引 爬梳回來的資料, 必須建立索引後, 才能夠使用。用反置法索引爬梳回來的資料, 以 civil war[內 戰] 為例, civil 出現在編號 3、8、22、56、68、92 等資料裡, war 出現在編號 2、8、15、22、68、77 等資料裡。 索引建好後, 再決定資料的順位。搜尋 civil war 時, Google 做兩件事: 1.找到含有該字的資料 2.依相關度排序該等資料 Google 把索引儲存在數百部電腦裡, 以縮短處理的時間。以 civil war 為例: civil 3 8 22 56 68 92 war 2 8 15 22 68 77 civil war 8 22 68 很快找到三個資料, 8、22、68。 Google 的資料庫有多大呢? 所有網頁是重點, 以簡單的布林運算就可得到答案。以「毛慶禎」為 鍵詞, 查得 4650 個網頁, 以「-毛慶禎」為鍵詞, 查得 46 億 7 千萬個網頁; 以「mao」為鍵詞, 查得 4970 萬個網頁, 以「-mao」為鍵詞, 查得 252 億 7 千萬個網頁。 所以, Google 的資料庫有 46 億 7 千萬個中文網頁, 253 億 2 千萬個英文網頁。中文網頁的數量祗 有英文網頁的 18.5%, 有份量, 還沒有足夠的影響力。 Google 索引會動態產生網頁,包括 .asp 網頁、.php 網頁,以及在其 URL 內使用問號的網頁。 不過,這些網頁可能會使我們的檢索器發生問題,而可能被忽略。 如果您擔心檢索器會忽略動 態產生的網頁,您可以考慮為我們的檢索器建立這些網頁的靜態副本。 如果您這麼做,請務必 加入一個可防止動態網頁被檢索的 robots.txt 檔案,以確保這些網頁不會被視為重複的內容。
  8. 8. 1c. 搜尋 好的搜尋引擎完全配合用戶的想法, 不要太多思考, 把想到的字詞直接鍵入, 就會出現預期的結 果。 如果, 與設想的情況不同, 就好好的研究 Google 的服務吧! Google 技術 Google 出類拔萃的地方在於專注開發「完美的搜尋引擎」,創辦人 Larry Page 將其定義為「能做到確實瞭解使用 者想要的東西,並確實提供對應的資訊」。為了達成此一目標,Google 永續地追求創新,並且拒絕接受現有模式 的限制。因此,Google 已經開發自己的服務結構和突破性的 PageRank™ 技術,此改變了以往執行搜尋的方式。 從一開始, Google 的開發人員便意識到提供最快和最正確的結果需要新型態的伺服器設定。鑒於多數的搜尋引擎 使用少數的大型伺服器,其在尖峰時段登入的情況下通常會減緩速度, Google 利用連結的電腦以快速地尋找每個 查詢的答案。 此創新的方法成功獲得較快的回應時間、較大的規模和較低的成本。其它搜尋引擎也起而仿效此方 法,而 Google 已持續修正其後端技術以使其運作得更有效率。 Google 搜尋技術背後的軟體可以在一秒內執行一系列同步的計算。傳統的搜尋引擎非常倚重某字詞出現在網頁上 的頻率。Google 使用 PageRank™ 檢查網路上的整個連結結構,藉此決定網頁的重要性。接著其會執行超文字符合 分析來判定哪些網頁與所執行的特定搜尋相關。在結合了所有的重要性和特定查詢的 相關性,Google 才得以將最 相關和最可靠的結果放在搜尋結果最前方。 • PageRank 技術:PageRank 會藉由解析超過 5 億筆變數和 20 億個字詞,來執行對網頁重要性的客觀測 量。PageRank 不會計算網頁間的直接連結,而是將網頁 A 連至網頁 B 的連結解釋為網頁 B 得到網頁 A 的 一張選票。接著 PageRank 會由網頁收到的選票數量來評估其重要性。 PageRank 也會考量每個投出選票的該網頁重要性,也就是一些擁有較大價值網頁的選票,會因此給予該 連結網頁較大的價值。重要的網頁會收到較高的 PageRank,並出現在搜尋結果的頂端。Google 的技術是 使用網頁的集合情報來判定網頁的重要性。由於沒有人為因素的介入或操控結果,使用者相信 Google 是 一個不會收受付款而有偏頗的客觀資訊來源。 • 超文字符合分析:Google 的搜尋引擎也會分析網頁內容。但是,Google 並非只是簡單地掃描網頁文字 (網站出版者可透過中繼標記操控這些文字),Google 的技術會分析網頁的完整內容,以及字型、分支和每 個字詞的確切位置等因素。Google 也會分析相鄰網頁的內容,藉此確保傳回的結果能與使用者的查詢最為 相關。 Google 的創新不僅只有在電腦桌面上而已。 為了把 Google 正確和快速的搜尋結果帶給透過可攜式配備使用網路 的使用者,Google 也開創了第一個無線的搜尋技術,提供 HTML 的即時 (on-the-fly) 翻譯給專為 WAP、i-mode、J- SKY 和 EZWeb 最佳化的格式。 Google 查詢的生命 Google 查詢一般只有半秒不到的壽命,然而這期間卻包含許多不同的步驟要完成,才能將查詢結果呈現給搜尋資 訊的使用者。
  9. 9. 3. 搜 尋結果會在一 1. 網 頁伺服器將查詢傳送給索引伺服器。在索引伺 秒內傳回給使用者。 服器內的內容,就像是書本後面的索引一般 - 它會告
  10. 10. 知使用者哪個網頁包含符合查詢的字詞。 2.查詢接著會傳到文件伺服器,此時才會確實從儲存的文件中擷取資 訊。而後會產生一小段落的文字來描述每個搜尋結果。 2. 排序 我們對網頁的關鍵字不進行人工分配,也決不會操縱我們搜索結果的排列順序。 請相信我們一直在努力完善我們的演算法,以便為您提供與您詢問最為相關的結果。 尋找資料是一門大學問, 類比的印本時代, 祗怕找不到資料, 沒有資料泛濫的憂慮; 數位的網路時 代, 就怕找到太多資訊, 形成資訊焦慮。印本時代的資料, 任何蛛絲馬跡都不能放過; 網路時代的 資料, 先排序再說。 Google 採用包括 PageRank[網頁級別]在內的一百多個或更多因子, 判斷網頁的排序。 Google 把網際網路視為民主平台, 連結到別的網頁, 表示投那個網頁一票。甲網頁可連結至乙網 頁, 表示乙網頁得到甲網頁的一票, PageRank[網頁級別]根據乙網頁的得票數, 判斷乙網頁的排 序。 同時, 分析爬梳來的網頁內容, 不祗是網頁內容的文字, 還考慮文字的字型、出現位置等因素, 並 檢視鄰近網頁的內容。 還有很多的計算因子, 有些太過於技術性, 有些基於商業利益, 難以全面揭露。
  11. 11. 2a. 評鑑 面對無窮盡的網路資源, 圖書館員及使用者最困擾的事, 不再是找不到資料, 而是判斷資料本身的 合用性。從網站為出發點, Google 列出五項判斷的原則: Availability [可及性] - 網站運作正常, 資料可自由取得。 Credibility [可靠性] - 最新最正確的資訊, 作者的資歷恰當。.edu.tw 或 .gov.tw 應該較為可靠的。 Authorship [作者] - 名不見經傳或聲名狼藉的作者, 文字錯誤連連或文法繆誤百出的網站, 應質 疑。 External Links [外部連結] - 出現數量相當的失效外部連結, 幾乎可以確定該網頁資料已經過時。 Legality [合法] - 資料本身應以合法的面目出現。 此外, 還可再深入思考: 資料來源明確嗎? 明顯標示事實與意見嗎? 預期讀者群為何? 內容與其相當嗎? 資料的立場, 採取客觀角度嗎? 與其他類似主題的網站相比, 有何特色? 參考書目及相關連結 2b. PageRank[網頁級別] Google 創辦人之一賴瑞‧佩吉(Larry Page), 基於「從優質網頁連結過來的網頁, 必定是優質網頁, 連結愈多愈優質」的思考, 發明網頁排序的技術, 命名為 PageRank[網頁級別], 藉以評鑑網頁的品 質。2001 年九月, 被核准為美國專利, 頒發給史丹福大學, 於專利文件中明述 Lawrence Page 為發 明人。 網頁級別計算個別網頁的重要性, 是 Google 發明的技術之一, 相當於網頁的價值指示器, 以民主 的程序建構個別網頁的價值。 藉由解析 5 億多個變數及 20 多億個字詞, 測量網頁的價值。網頁級別不理會網頁本身的價值, 而 是將網頁甲連至網頁乙的連結, 解釋為網頁乙得到網頁甲的一張選票, 計算網頁收到的選票數量, 評估其價值。 Google 查看這些票數的來源, 或連結網頁收到的票數, 藉以分析投票網頁本身的價值。考量投出 選票網頁的價值, 價值較大網頁的選票, 會給予較大的權值。價值較大的網頁, 其網頁級別較高, 排列在搜尋結果的前面。 因此, Google 將網頁級別和內文比對技術結合, 找出重要並且與鍵詞相關的網頁。顯示搜尋的鍵 詞, 並且檢查所有的網頁內容, 及連結到此網頁的其他網頁內容, 判斷查詢的結果是否最符合使用 者的需求。 搭配分析網頁內容的技術, 以字型、字詞的位置等因素, 分析相鄰網頁的內容, 藉此確保搜尋的結 果能與使用者的查詢最為相關。 這種複雜且自動運作的方法, 使有心人難以篡改搜尋結果。
  12. 12. 網頁級別的值, 由 0 至 10, 分為 11 個等級。被 Google 爬梳到的網頁, 都有網頁級別。新加入的網 頁, 其網頁級別值都是 0, 只有百來個網頁, 得到網頁級別值的最高值 10, 包括 yahoo.com、adobe.com 等網站所屬的數個網頁; 甚至 Google 本身的首頁, 祗得到網頁級別 10; 臺 灣的 Google 首頁, 得到網頁級別 8; 中國大陸的 Google 首頁, 得到網頁級別 10。 Google 的軟體工具核心是網頁級別), 這個系統是由兩位創辦人賴瑞‧佩吉(Larry Page)和賽吉‧布 林(Sergey Brin)於在史丹佛大學唸博士班時, 研發出來的。 網頁級別如同個別網頁價值的指示器, 透過龐大的連結架構來信賴網站獨特地民主性質。簡單來 說, Google 說明網頁 A 連結至網頁 B 時, 則視為網頁 A 投給網頁 B 一票。當然, Google 會查看票 數來源, 或是連結網頁接收的票數;同時它也會分析參予投票的網頁。透過「重要的」網頁來參 予投票, 並且幫助其它的網頁也成為「重要的」網頁資料。 重要、優質的網站會得到較高的網頁級別, 同時 Google 會記住每次所處理的查詢情況。當然, 如 果查詢出來的網頁結果並不符合您的需求, 重要的網頁對您也不具任何意義。因此, Google 將網 頁級別和精密的內文比對技術結合, 來找出重要並且與您的查詢相關的網頁。Google 會將出現 於網頁上的字詞顯示出來, 並且檢查所有的網頁內容及連結到此網頁的其他網頁內容以決定這樣 的查詢結果是否最符合您的需求。 網頁級別有三個指標: ��.1被連結數 - 最容易理解的指標 ��.2來自優質網頁的被連結 - 有優值的指標 ��.3被連結網頁的連結數 - 有意義的指標 第一個指標最容易理解, 被連結次數多等同於受歡迎程度; 來自優質網頁的連結, 其價值較高; 被 連結網頁的連結數在合理範圍內, 表示該網頁的連結是有意義的。 對於線性代數稍有瞭解的人, 不妨深入閱讀參考書目的資料, 一定會喜歡的。 2c. PigeonRank[鴿子排序] 2002 年 4 月 1 日, Google 公佈鴿子排序細節, 它是網頁級別的核心。 有點像是愚人節的把戲, Google 以鴿子的行為比擬為它的搜尋運算。把一大群個人電腦等級的 機器, 比喻為鴿子, 每個電腦找到相關的結果, 就給予一個排序值, 愈多電腦認定該結果是相關, 該 結果的排序值就愈高。 鴿子的行為不受個別鴿子的影響, 眾多個人電腦運算的結果也不受個別電腦的影響, 網頁主以最 受歡迎的服務各種手法欺瞞搜尋引擎, 祗能得逞於一時一地, 無法長久地全面地影響搜尋結果。
  13. 13. 2d. 搜尋引擎最佳化專員(SEO) 搜索引擎優化是 Search Engine Optimization 的譯名, 縮寫為 SEO。調整網站的內容, 讓它配合搜 尋引擎的排序法則, 稱為搜尋引擎最佳化專員。經過優化的網站, 明顯排名上升,而且可維持一段 時間。八成以上的陌生訪客, 多半以搜索引擎查找資料, 在 Google 等知名搜索引擎上的排名, 直 接影響網站的能見度。 以合理的手段, 優化網站的內容, 使之符合搜尋引擎的排名規則, 藉以迅速提高排名, 達到擴大網 站影響力的目的。 2006 年 2 月在歐洲曾經傳出一則新聞,德國 BMW 汽車公司的網頁被 Google 認定採用了不正當 的搜尋引擎行銷(Search Engine Marketing,SEM)手法,透過欺瞞行為來提高自身網頁在搜尋 引擎中的排名,以致遭到除名,雖然 BMW 後來改正了網頁,但重新登錄 Google 後 就變為新網 站,必須從頭累積可見度與搜尋排序。而藉著這次事件,也使得 SEM 的相關問題逐漸受到重 視。 搜尋引擎行銷有二種模式, 由搜尋引擎本身提供, Google 在網頁上端及右方提供贊助商連接, 由 廠商付費取得特定的廣告位置, ,這種做法被稱做「關鍵字行銷」。另一種方法, 是愚弄搜尋引 擎, 讓它以為該網頁很受歡迎, 將其放在搜尋結果的前面位置, 即「搜尋引擎最佳化專員」技術。 找出搜尋引擎建立索引的邏輯, 並配合其關鍵字排序, 據以修改網頁, 強化加權的項目, 就能提高 網頁的搜尋排序, 進而增加被用戶點選 的機率。 以使用者行為分析、關鍵字研究與搜尋引擎排序邏輯解析等手段, 影響搜尋引擎檢索結果的排 序, 是搜尋引擎所默許的, 但是以某些不正當手法, 提供排序結果, 祗適用於短暫的時間, 被發現後 將列入黑名單, 整個排序值歸零。 在網頁中塞進各式各樣當前熱門的關鍵字, 當用戶以這些關鍵字搜尋時, 該網頁就很容易的會出 現在搜尋引擎排序的前列。其實, 這種做法的意義不大, 被潛在客戶找到才是行銷的前提, 亂塞熱 門關鍵字的做法雖然能增加網站的能見度, 但這些熱門關鍵字與廠 商自身業務卻沒多少關係, 即使網頁藉此得到了很高的點擊率, 但用戶只是被熱門關鍵字誘使而點擊, 不會對業務產生正面 幫助。而正規的 SEO 則是要儘可能的準確找出潛在用戶。 3. 帳戶 您的 Google 帳戶能讓您使用多種 Google 服務,包括您的個人化首頁、Google 網上論 壇、Google 快訊、Froogle 購物清單以及個人化搜尋。 如果您有使用過任何上述的服務,您就 有一個 Google 帳戶。 如果您有 Gmail 帳戶,您就可以使用您的 Gmail 使用者名稱和密碼登入 您的 Google 帳戶。 如果您還沒有 Google 帳戶,您可以到 https://www.google.com/accounts/NewAccount 建立一個新帳戶。 當您建立 Google 帳戶時,便自動地取得許多 Google 服務的使用權,包含個人化搜尋、Google 網上論壇、Google 快訊以及您的個人化首頁。 如果您要從 Google 帳戶中刪除個人化搜尋服
  14. 14. 務,請在 Google 首頁上按一下 [我的帳戶] 連結,並在左邊的選單上選擇 [刪除個人化搜尋]。 請確認您已經登入 Google 帳戶,這樣才能看到 [我的帳戶] 連結。 注意: 如果您和別人共用電腦,而且不希望別人看到您的個人化首頁 (有可能會連結到您的 Gmail 帳戶) ,那麼請您務必在每次用完電腦時登出您的 Google 帳戶。 • Google 帳戶能做的事, https://www.google.com/accounts/ManageAccount Alerts Analytics Base Calendar Froogle Shopping List Gmail Google in Your Language Groups News Notebook orkut Page Creator Personalized Homepage Personalized Search Picasa Reader Sitemaps Spreadsheets Video Google 的帳戶, 不以使用 Gmail 為前提, 祗要是有效的電子郵件帳號就可以。 必須先開設 Google 帳戶, 才能享受 Google 的進階服務: GoogleAnswer[懸賞提問]、Google 快 訊、Google 網上論壇、Froogle[購物清單]、Gmail、個人化搜尋、Google 使用您的語言等。反 之亦然, 已經使用以上的 Google 服務之一, 就有了 Google 帳戶。已有 Gmail 帳戶的使用者, 就是 Google 帳戶的使用者名稱和密碼。 Google 帳戶本身是免費的, 不過, 使用 GoogleAnswer[懸賞提問]、文字廣告[AdWord]等有價服務, 仍需以信用卡付費。 就像電腦上的其他帳戶, 申請 Google 帳戶沒什麼特別之處, 祗需鍵入三項資料: 電子郵件地址、 密碼、名稱及其它, 不要求填寫任何個人資料, 不需要身份證字號, 也不要求地址、電話, 簡單乾
  15. 15. 淨。 帳戶的使用者名稱就是您完整的電子郵件地址。接著, 就照著步驟進行即可, 熟稔網路的運作, 就 沒有問題; 若有任何問題, 最大的可能還是使用者本身對網路及電子郵件不熟悉所造成, 向 Google 抱怨之前, 先請教朋友, 排除問題的速度比較快。 兩招就能排除多數的狀況: • 打開瀏覽器的 Cookie 設定, 設定為接受狀態 • 打開電子郵件信箱, 找到 Google 帳戶驗證電子郵件, 並回覆它 開戶成功之後, 隨時可進入 Google 帳戶控制中心檢視並修改相關的資料。 任何時候都可以刪除帳戶, 同時也刪除與該帳戶有關的所有 Google 服務, 包括: orkut 個人資料、 搜尋記錄和個人化首頁等; 如果此帳戶也是 Gmail 帳戶, 將再也無法使用該電子郵件服務。不過, 若還有未完成的交易(例如, 使用「GoogleAnswers」[懸賞提問]服務), 仍須負擔該等費用。 字詞驗證係避免被軟體誤用。必須同意 Google 的服 務條款和隱私權 政策。 從 Google 首頁, 點選右上角的登入。 並點選 [我的帳戶] 修改或取消 Google 帳戶。 3a. 個人資料 從建立 Google 帳戶進入, https://www.google.com/accounts/CreateAccount, 填入電子郵件地址、自 選密碼、字詞驗證後, 點選我接受:創建我的帳戶。 Google 寄信到電子郵件地址, 依照指示, 接受驗證, 點選指定的連結, 立即啟用 Google 帳戶。 選擇安全的密碼是很重要的事。Google 有些建議。 請勿以下列項目或其部份做為密碼: • 使用者名稱。 • 真實姓名。 • 任何名字。 • 生日、電話號碼、地址、身份證字號或學生證號碼。
  16. 16. • 可在任何語言字典中查到的字。 • 字典中常見的數字/字母取代方法,例如用 0 代替字母 O、用數字 1 代替字母 L、用數字 3 代替字母 E 等。 • 在此或網路上找到的任何密碼範例。 好密碼應符合下列條件之一: • 加入標點符號,例如 .,!@# 等。 • 混合使用大小寫字母。 • 至少有 8 個字元。 密碼越長,安全性越高。 • 選擇有趣的詞句、一句詩詞、或一段歌詞。 然後取每個字的第一個字母做為您的密碼。 確定您沒有因此意外地造出一個在字典上查得到的單字! • 走上街頭或停車場,記下您所看到前三或四個牌照。拿掉重複的字母與號碼,用剩下的 號碼組合成您的密碼。 • 找出其他的方式隨意用字母和數字設定密碼,例如翻開書本,將您所見到的前十個名詞 的第三個字母組合成密碼。 善用您的創意吧。 Google 示範一個很複雜但不會忘記的密碼: • 我們將取材自 Lewis Carroll 的詩 Jabberwocky: Twas brillig, and the slithy toves did gyre and gimble in the wabe. • 現在,我們擷取每個字的第二個字母: wrnhloiyninha。 • 其中有些字母重複了,所以我們可以用數字和/或其他符號來取代這些字母,例如: wrnhloiy!3%7a。 • 來玩玩吧!現在我們把取自形容詞單字的字母變成大寫: wRnhLoiy!3%7a。 • 結果就成了看起來滿詭異,但很難被破解的密碼: wrnhloiy!3%7a。這麼做還有一個附 加的好 處,若以比較有系統的方式設定密碼,萬一以後不小心忘記 密碼了,還可以想辦 法重新組合出來。 設定自己的密碼時,您可以像這樣利用一個比較容易記憶的系統。 將您的密碼保存在安全的地方 • 不要將密碼告訴任何人。 • 別將您的密碼寫下來。 • 每隔幾個月變更一次密碼。 3b. 服務資訊 Google 的服務以免費為原則, 而且不會詢問用戶的私人資料, 以免打擾用戶的使用興緻。但是以 個人為基礎的服務, 免不了必須請用戶提供私人資料, 建立個人帳戶。除非涉及金錢交易, 祗需提 供電子郵件地址及自行選定的密碼即可。 Google 有 12 種服務, 必須先申請 Google 的個人帳戶, 才能享受, 申請個人帳戶是免費的。
  17. 17. ��.1Google 快訊 ��.2Google 網上論壇 ��.3個人化搜尋 ��.4Google Answer[懸賞提問] ��.5Gmail/交談 ��.6Froogle[購物清單] ��.7個人化網頁 ��.8使用的語言 ��.9谷 歌視訊上載計劃 ��.10文字廣告[AdWord] ��.11Google 新聞 ��.12orkut 3b1. Google 快訊 指定搜尋字彙, 由 Google 快訊幫忙追蹤這些字彙的發展, 然後送到 Google 個人帳戶的電子郵件 地址, 指定寄送的格式: 純文字或 HTML。 可指定搜尋的範圍: 新聞、網頁、新聞及網頁、群組[即網上論壇]; 並指定追蹤的頻率: 一天一 次、即時、一週一次。 建立之後, 隨時可以再回來修改或刪除。 3b2. Google 網上論壇 閱讀公開的 Google 網上論壇, 不需要任何帳戶。閱讀封閉的 Google 網上論壇或張貼、回應 Google 網上論壇, 都需要有帳戶。 第一次進入 Google 網上論壇時, 應先設定別人向自己發出邀請函的授權設定: • 不允許群組管理員邀請我到他們的群組中 • 不允許群組管理員直接將我新增到他們的群組中 不喜歡加入別人的群組, 祗想在旁默默的觀看, 應勾選第一個; 不願意被過度熱心的群組管理員打 擾, 應勾選第二個, 必須回信後, 才能被新增至對方的群組中。 3b3. 個人化搜尋 Google 會記錄所有的網頁、圖片、新聞及 Froogle 搜尋經過, 在網頁上呈現。
  18. 18. 左邊為過去兩天的搜尋記錄, 沒有點擊結果的搜尋會被特別標示; 右邊有個日曆, 依搜尋總數以不 同的顏色深度呈現。 對瞭解過去的行為, 很有幫助。 為了提供這項服務, 個人化搜尋會儲存用戶在 Google 的活動資訊, 包括搜尋查詢、點選的項目及 搜尋的日期和時間。累積足夠的資訊後, Google 分析判斷之後, 個人化搜尋就能主動提供額外的 資訊, 並據以改善個人的搜尋結果。 在 Google 的活動資訊被電腦截取, 有被監視的感覺, 一但被外力介入, 個人的隱私就一覽無遺, 包 括 IP 位址、瀏覽器類型、瀏覽器語言和可識別您瀏覽器的 cookies。 任何時間都可以暫時地或永久地要求 Google 停止儲存用戶的搜尋資訊。Google 有一個分離的記 錄系統作為審查之用, 並以此改善服務品質。包括審查 Google 的廣告系統、瞭解最受使用 者歡 迎的功能、改善搜尋結果的品質, 最重要的是幫助 Google 對抗各種外來的破壞, 如: 抵禦服務攻 擊。 根據以往的搜尋記錄找到搜尋結果。 個人化搜尋根據以往的搜尋記錄和點擊過的搜尋結果, 將 最相關的特定結果, 移到比較前面的位置。 瀏覽並搜尋以往的搜尋記錄和點擊過的搜尋結果。可以移除任何您不希望被包含在個人化搜尋 中的項目。 將您最喜愛的網站加入書籤, 並新增您可以搜尋的標籤和附註。 3b4. Google Answer[懸賞提問] 提出問題, 設定價碼, 得到答案。或者瀏覽別人提出的問題, 主動回答該問題, 得到適當的報酬, 甚 至得到額外的小費。任何人都可以瀏覽別人提 出的問題, 瀏覽已經被回答的問題。 提問者需填寫若干資料: 問題、主題、價碼、領域, 再填寫信用卡資料即可。 反應太好, 願意回答問題的研究者太多, 從 2005 年 12 月 26 日起, Google 暫停新研究者的申請。 3b5. Gmail/交談 Gmail 是 Google 公司推出的免費電子郵件, 無法經由申請而來, 必須由使用 Gmail 的朋友推薦, 才 可以取得。45 天不使用, 就會被刪除。
  19. 19. Gmail 有中文介面沒有中文名稱, 是網頁郵件的一種新嘗試,這個概念是要建立一個不用再刪除 郵件,且您可以隨時找到想要的郵件。主要的功能包含: • 只需搜尋, 而不用分類。使用 Google 搜尋特定的郵件, 不論它是已傳送或已接受的郵件。 • 不需捨棄任何郵件。2726 MB 的免費儲存空間, 還有什麼放不下的, 完全不需要刪除任何 郵件。 • 保留完整的內容脈絡。每封郵件都會和其回函組合起來, 形成對話群組。 • 沒有彈出式視窗廣告、沒有不相關的橫幅廣告。只有與信件內容相關的文字廣告和網頁 連結。 如果, 你的朋友還沒有 Gmail 帳號, 我給你一個。 3b6. Froogle[購物清單] 單純的在 Froogle 搜尋, 不需要帳戶。找到滿意的物品, 準備購置時, 或想對物品加上評語或註解 時, 就需要帳戶。 Froogle 有兩份清單: 自已買單的物品, 置於購物清單(Shopping List)內; 夢想清單(My Wish List)裡 放的是等待別人贈送的東西, 送禮的人從受禮者的帳號, 看到他的夢想清單, 採購受禮者夢想中的 禮品, 雙方皆大歡喜, 當然, 主動把夢想清單寄給你的朋友也是可行的。 3b7. 個人化的主頁 Google 個人化的主頁就是 Google 的入口網站, 它的內容由使用者自行決定, 可以隨著用戶的 Google 帳戶帶著走, 不侷限於特定的電腦。 3b8. 使用的語言 讓 Google 知道用戶偏好的語言。 3c. 刪除帳戶 以 Gmail 登入, 應該沒有刪除帳戶的必要, 祗要 45 天不使用 Gmail, 此郵件信箱就被刪除。 可以刪除個別的服務: ��.1Google 快訊
  20. 20. ��.2Google 網上論壇 ��.3個人化搜尋[需要密碼] ��.4Gmail[需要密碼] ��.5Google 新聞 ��.6orkut [需要密碼] ��.7Froogle 購物清單 ��.8Google 使用您的語言 任何未完成的金融交易, 還是會透過信用卡等方式, 繼續完成它。 4. 網站管理員 網站就是媒體, 網站管理員祗有一個責任, 讓每個潛在的各戶都能看到網站的資訊。讓搜尋引擎 找到是首要目標, 並且藉著搜尋引擎幫忙管理網站。 4a. 提交網頁 網站建好後, 首要工作是讓搜尋引擎可以找到, 藉以被世界知曉。採用正確的方法, 主動出擊, 很 快就有成效; 否則, 就祗好等待搜尋引擎來找。 最古老、最沒效率、最被動的方法是向各大搜索引擎, 逐一提交。可能兩個月之後, 也排不進 Google 的資料庫。 向 dmoz.org 等公開的網頁目錄提交, 是不錯的點子, 可惜公開的網頁目錄不被搜尋引擎列入優先 擷取的對象, 祗能等著, 慢慢被收錄。 最快、最好的方法是盡可能獲得較多的外部連接。連接至網站的首頁或其內頁, 具有相同的成 效。應找網頁級別值高於 6 的網頁, Google 每天造訪這些網頁, 並更新其數據庫。當 Google 造訪 這些網頁時, 發現了新的網址, 就會順著它爬梳該網址。 在網頁級別較高的網頁裡, 置入自己的網址, 並不太困難。幾乎每個網站都有論壇或接受讀者的 評論, 主動寫點評論, 在內文或簽名檔裡置入網址就行了。當然, 這種網址本身必須是可以點選 的。Google 在網頁級別值較高的網頁爬梳到網址後, 當天, 就會順著該網址爬梳下去, 一兩天後, 就會列入其資料庫, 首次列入的祗是首頁。 首次爬梳後, 祗把首頁列入資料庫, 若有較多的網頁級別值高的網頁有該連結, 每當 Google 爬梳 到該網站時, 就會再次過來爬梳該網站, 爬梳的次數越頻繁, 就會加深爬梳該網站的深度, 收錄更 多的網頁, 使 Google 在較短的時間內, 收錄更多的網頁。 4b. 我的網站(Sitemaps) 有了 Google 我的網站(Google Sitemaps), 就可以輕鬆地將整個網站提交至 Google 索引, 並且取得 在 Google 的曝光率報告。使用我的網站後, Google 可掌握用戶的所有網頁, 得知何時對這些網頁 進行變更, 改善在 Google 搜尋中的涵蓋範圍。
  21. 21. Google 我的網站可以協助網站管理員: • 更好的搜尋涵蓋範圍和較新的搜尋結果, 以協助人們找到更多用戶的網頁。 • 有了智慧型的搜尋, 就可以告訴 Google, 網頁修改的時間或網頁變更的頻率等。 • 詳細的報告會說明 Google 將流量導向網站的方式, 以及 Googlebot 如何讀取網站資訊。 5. 服務類型 Google 的本業為搜尋, 從所有網頁的搜尋開始, 至 2006 年中, 已有數十種搜尋服務, 同時併購多項 5a. 最受歡迎的服務 5b.最常被搜尋的字詞 Google 按週公佈最常被搜尋的字詞。2006 年 5 月 15 日全球的 Google 用戶最常搜尋字詞的前 15 個是: ��.1maggie q ��.2mission impossible 3 [不可能的任務 3] ��.3kentucky derby ��.4radiohead ��.5tori spelling ��.6pamela rogers ��.7michelle wie ��.8whitney houston [惠妮‧休士頓] ��.9oscar de la hoya ��.10kaavya viswanathan ��.11heather locklear ��.12danica patrick ��.13manuel uribe ��.14vince young ��.15patrick kennedy 2005 年全球的 Google 用戶在所有網頁、新聞及 Froogle[購物清單]最常搜尋字詞的前 10 個, 分別 是: • Google.com ��.1Myspace ��.2res
  22. 22. ��.3Baidu [百度網站] ��.4wikipedia [維基百科] ��.5orkut ��.6iTunes ��.7Sky News ��.8World of Warcraft ��.9Green Day ��.10Leonardo da Vinci • Google News ��.1Janet Jackson ��.2Hurricane Katrina ��.3tsunami ��.4xbox 360 ��.5Brad Pitt ��.6Michael Jackson ��.7American Idol ��.8Britney Spears ��.9Angelina Jolie ��.10Harry Potter [哈利‧波特] • Froogle ��.1ipod ��.2digital camera ��.3mp3 player ��.4ipod mini ��.5psp ��.6laptop ��.7xbox ��.8ipod shuffle ��.9computer desk ��.10ipod nano 按月公佈全球 19 個國家用戶的搜尋字詞, 2005 年 3 月中國的用戶, 最常搜尋的前 15 個字詞, 如 下: ��.1李宇春(singer's name) ��.2迅雷(name of software) ��.3金山词霸(a software name) ��.4心理测试(psychological test) ��.5劲舞团(dance club)
  23. 23. ��.6中国移动(China mobile) ��.7刀光传奇(a game's name) ��.8火影忍者(a game's name) ��.9驱动之家(an IT website) ��.10吉祥三宝(a song's name) ��.11魔兽世界(a game's name) ��.12冒险岛(a game's name) ��.13周杰伦(a singer's name) ��.14断仇谷(a TV series' name) ��.15网络电视宝(a new gadget's name) 沒錯, 李宇春最火, 周杰倫是台灣文化之光。 • Creative Commons Search, http://search.creativecommons.org/ Search only pages that are free to use or share 1. 排名 網站在我們搜尋結果中的排名,是根據幾個要素來自動決定的,這些要素在下列網址有詳細說 明:http://www.google.com/technology/index.html 。 我們不會手動指派關鍵字給網站,我們也不 會操控搜尋結果中任何網站的排名。 一般而言,網站管理員可以增加高品質網站連結到他們網頁的連結數,以改善他們網站的排 名。 如需關於改善您的網站在 Google 搜尋結果中曝光率的詳細資訊,我們建議您詳閱我們的 網 站管理員指南 。指南說明了維護友善 Google 網站的核心概念。 如您所知,我們的搜尋結果會隨著我們更新索引時定期變更。 當我們加入新的網站,以及將更 新併入現有網頁時,搜尋結果內的網頁就會變動。 其中某些關鍵字可能因此排名比之前高,其 他則可能較低。 這些變更完全是自動化執行的。 我們也努力地讓網際網路的內容能公平正確地呈現。 若要瞭解 關於 Google 如何決定搜尋結果中的網站排名資訊,請參閱 http://www.google.com/technology/index.html 偶而會有排名上的變動,可能是因為我們的資料中心有所差異而致。 當您執行 Google 搜尋, 您的查詢是傳送到一個 Google 資料中心,以便擷取搜尋結果。 我們有很多資料中心,還有許
  24. 24. 多因素 (像是地理位置和搜尋流量) 決定查詢會送到哪裡。 因為我們所有資料中心並不是同步更 新,有可能會因哪個資料中心處理您的查詢,導致搜尋結果有些微出入。 儘管我們無法保證任何網頁在搜尋結果內的排名將保持不變,或者將網頁納入所有適用的搜尋 結果中,但是我們的網 站管理員指南對於維護一個友善 Google 網站提供了有用的提示。 一般 而言,網站管理員可以藉由增加高品質網站連結到他們網頁的連結數,來改善他們在搜尋結果 中的曝光率。 如果 Google 檢索某網頁時,發現連結至該網頁的網站非常少,則 Google 可能會指派該網頁的 排名值為零。 此外,最近才新增到 Google 索引中的網頁也會顯示分數為零的 PageRank,因為 它們尚未由 Googlebot 檢索,也尚未排名。 一個網頁的 PageRank 分數可能會因為隨後的檢索而 自然地增加,因此不用太過擔心。 若要瞭解更多關於 PageRank 的資訊,請參閱 http://www.google.com/technology/ 2. 搜尋引擎優化(Search Engine Optimization, SEO) SEO 是「搜尋引擎最佳化專員」(search engine optimizer) 的縮寫。許多 SEO 為網站擁有者提供有用的服務,例如 為網站結構撰寫複本到給予建議,以及協助尋找該網站可以提交的相關目錄。 但是,有少數的惡意 SEO 會透過他 們過度地侵略性行銷策略和嘗試不公平地操控搜尋引擎結果,給企業造成傷害。 雖然 Google 和任何 SEO 沒有關係也無法提供推薦人選,但是我們可以給予一些提示來協助您區別哪些 SEO 可以 改善您的網站,以及哪些 SEO 只會讓您從搜尋引擎結果「跌跌不休」。 • 當心那些發送不請自來的郵件給您的 SEO 公司。 令人驚訝的是,我們也有收到這些垃圾郵件: 「google.com 您好: 我們造訪您的網站,並注意到您沒有列在多數的主要搜尋引擎和目錄中......」 對那些不請自來關於搜尋引擎的電子郵件,就像那些宣稱「一夜見效」的減肥藥丸或者請您協助罷免獨裁者轉帳 的要求一樣, 您都需要保持相同的懷疑態度。 • 沒有人可以保證在 Google 上第 1 名的排名位置。 當心某些宣稱可以保證排名的 SEO,或是宣稱和 Google 有「特殊關係」以及宣傳在 Google 擁有「優先提交權」 的 SEO。 事實上在 Google 並沒有優先提交此等待遇。 事實上,直接提交網站到 Google 的唯一方法是透過我們的 新增 URL 網頁或透過 Google Sitemaps (Beta) 計劃,且您可以自行執行此免費的服務。 • 請注意一些神秘的公司或是不願清楚地說明他們意圖的公司。 如果您對某事不甚清楚,務必要求對方說明。 如果某 SEO 以您的名義建立詐騙或誤導的內容,例如入口網頁或 「廣告傳單」網域,如此將導致您的網站徹底地從 Google 索引中移除。 最後,您必須對您所僱用的任何夥伴的行 動負責,因此您最好能確實瞭解他們將如何「協助」您。 • 您完全不需要連結至 SEO。
  25. 25. 避開那些指稱利用「完全免費」連結來連結熱門配置的 SEO,或是那些指稱能送出您的網站至上千個搜尋引擎的 SEO。 這些通常是白費工夫,它們不會影響您在主要搜尋引擎結果中的排名 -- 至少,它們沒有您想像中的正面效 果。 • 一些 SEO 可能會嘗試向您銷售直接在瀏覽器的網址列輸入關鍵字的功能。 多數此類的提案會要求使用者安裝額外的軟體,但只有極少數的使用者會這麼做。 評估此類的提案需要格外謹慎 和保持懷疑的態度,特別是對於他們自己報告之已下載所需應用程式的使用者數量。 • 明智地選擇。 在您考慮是否要和某 SEO 合作時,您可以針對該公司進行一些研究。 當然,藉助 Google 的力量是其中一個選 擇。 您也許可從過去的新聞找到一些富警惕意味的報導,包含此篇描述某位別具侵略性的 SEO 文章: http://seattletimes.nwsource.com/html/businesstechnology/2002002970_nwbizbriefs12.html 。 雖然 Google 對特定的公 司無法置評,但是我們碰過一些自稱是 SEO 的公司,它們明顯地超出企業行為可接受的運作範疇。 。 請您當 心。 • 務必瞭解金錢的流向。 雖然 Google 從未在我們的搜尋結果銷售較好的排名位置,但一些其他搜尋引擎將每次點擊付費 (pay-per-click) 或 涵蓋付費 (pay-for-inclusion) 結果與它們的一般網頁搜尋結果相結合。 一些 SEO 會允諾讓您高居搜尋引擎的排名, 但實際上是將您放在廣告的部分,而不是搜尋結果中。 少數 SEO 甚至會即時變更他們的競標價格來建立他們「控 制」其他搜尋引擎的假象,然後將他們自己置於選擇中的位置。 此種騙局在 Google 行不通,因為我們的廣告皆清 楚地標示且與搜尋結果分開,但是請務必詢問您意欲合作的 SEO,瞭解哪些費用可以讓您永久維持在結果中,而 哪些費用是花在暫時的廣告用途。 • 與多位 SEO 交談,並詢問其他的 SEO 是否會建議您和您正在考慮的那間 SEO 合作。 集思廣益是個好的開始,但是他們不會道出事情全貌。 您應該詢問該公司已經營運多久的時間,且僱用了多少全 職的員工。 如果您覺得有壓力或不安心,跟著您的直覺走並且步步為營: 在您找到能夠信賴的公司以前先按兵不 動。 詢問您的 SEO 公司是否使用我們在下列網址的垃圾郵件申訴表單,向 Google 呈報其所發現的每封垃圾郵件 濫用情形:http://www.google.com/contact/spamreport.html 。 有道德的 SEO 公司會呈報違反 Google 垃圾郵件指南的 詐騙網站。 • 確保您受到合法地保護。 為了您自身的安全,您應該堅持全額和無條件的金錢退還保證。 如果您因為任何原因覺得不滿,或如果 SEO 的動 作導致您的網域從搜尋引擎的索引中被移除,不要害怕要求退款。 確認您有一張包含價格的書面契約。 此契約也 應該要求 SEO 遵守每個搜尋引擎在網站涵蓋方面的建議指南。 網站擁有者可能遇到的最常見濫用情形為何? 其中一種常見的騙局是建立「影子」網域,其會使用欺詐的重新導向將使用者導往網站。 這些影子網域通常為一 些 SEO 所擁有且宣稱是以客戶的名義運作。 但是,如果雙方的關係惡化,SEO 可能會將網域指向不同的網站,甚 至是競爭對手的網域。 如果事情演變至此,客戶等於是付錢發展一個完全由 SEO 所擁有的競爭網站。 另一個嚴禁的行為是放置「入口」網頁,它會根據客戶網站某些地方的關鍵字來載入。 SEO 承諾這樣會讓網頁與 更多的查詢有更高的關聯性。 這根本是無稽之談,因為個別網頁很少會與大範圍的關鍵字相關。 不過,更狡詐的 是這些入口網頁通常包含隱藏的連結會連至 SEO 的其他客戶。 這些入口網頁會減弱網站的連結人氣,並會將其路 由至 SEO 與其客戶的網站上,而這些網站可能包含令人鄙棄或非法的內容。 還有其他要注意的事項嗎? 在您和無賴的 SEO 交涉時,有一些警告跡象不可不知。 這裡的資訊還稱不上是完整的清單,所以如果您有一絲懷 疑,請相信您的直覺吧。 如果 SEO 有下列情形,請隨時準備離開: • 擁有影子網域 • 在入口網頁放置他們其他客戶的連結 • 在網址列提供銷售關鍵字
  26. 26. • 在搜尋結果中無法區別哪些是真正的搜尋結果和廣告 • 保證排名位置,但是只侷限在那些模糊冗長的關鍵字 • 以多重別名或偽造的 WHOIS 資訊操作 • 從「假造的」搜尋引擎、間諜軟體或變臉軟體 (Scumware) 獲取流量 • 擁有已從 Google 索引移除的網域,或其本身並未列在 Google 索引中 如果您在某些方面受到 SEO 的欺騙,您可以檢舉該 SEO。 聯邦交易委員會 (Federal Trade Commission,FTC) 可受理有關詐欺或不公平商業手段的申訴。 若要提出申訴,請 造訪 http://www.ftc.gov/ 並按一下 [線上提出申訴],或致電 1-877-FTC-HELP,或寫信至: Federal Trade Commission CRC-240 Washington, D.C. 20580 如果您要對其他國家的公司提出申訴,請於 http://www.econsumer.gov/ 提出申訴。 如果您變換主機公司或 IP 位址,只要您的 URL 保持相同,您的網站在 Google 中的結果應該不 會受到影響。 我們建議以下列步驟移轉網站到新的 IP 位址: 1. 準備一份您網站的副本到新的 IP 位址。 2. 更新您的名稱伺服器以指向新的 IP 位址。 3. 一旦您看到搜尋引擎的自動尋檢程式開始抓取新 IP 位址的網頁時 (一般在 24-48 小時內),即 表示您可以將舊 IP 位址的網站副本移開了。

×