Chedong Why Search Engines Like Blog

Loading...

Flash Player 9 (or above) is needed to view presentations.
We have detected that you do not have it on your computer. To install it, go here.

1 comments

Comments 1 - 1 of 1 previous next Post a comment

Post a comment
Embed Video
Edit your comment Cancel

2 Favorites

Chedong Why Search Engines Like Blog - Presentation Transcript

  1. 为什么搜索引擎喜欢 Blog http://chedong.com/blog/ 车东
  2. 搜索引擎做为互联网的“路由器”
    • 搜索引擎是网民的上网主要入口之一;
    • 搜索引擎每天给其他网站带去 4-6 亿流量(相当于搜索引擎自身流量的 1-2 倍);
    • 在内容网站的外网来源流量中:
      • 搜索引擎占 80%-90% ;
      • 超过传统的友情链接等推介方式一个数量级以上;
  3. 从搜索获益最多网站之一维基百科
    • 维基百科每天从 Google 获得数百万用户流量;
  4. 内容管理系统( CMS )比较
    • 同样是:标题,时间,作者,内容这几个因素的组合,为什么 blog/wiki/ 新闻组归档往往比 BBS 更容易被搜索引擎搜到?
    • 为什么同样的内容:大网站的转载往往比原文出处排名更靠前?
    • 什么样的网站对蜘蛛比较友好? (Spider Friendly)
  5. 比较成功的几个 Blog 发布系统:
    • 几年前第一次找 Blog 发布系统:
      • WordPress (php) 便于架设,插件丰富,管理简单
      • MovableType (活字印刷的系统) 性能较好;
    • 比较流行的 BSP 发布商:
      • LiveJournal;
      • Blogger;
  6. 这些 Blog 发布系统的特点
    • 链接稳定;
    • 蜘蛛抓取方便;
    • 按时间归档;
    • RSS 输出;
    • Trackback ping/ 留言反馈机制;
    • 分类归档;
  7. 搜索引擎的职能: 重现
    • 点击搜索结果链接地址,却无法返回期望的结果,用户会很失望;
      • 服务器无法访问;
      • 页面不存在;
      • 内容已经变更;
  8. 搜索引擎的重要职能:重现
    • Blog 内容:
      • 单条目永久链接:
        • PermaLink 每个条目都是永久链接
      • 个人按月归档:
        • 条目数量仍然控制在几十条之内,不用分页;
      • 按类目归档:
        • 即使有内容更新,旧内容仍然保留
    • BBS/ 论坛的内容:
      • 由于内容量过多,旧内容往往会被删除;
      • index.php?page=12
        • 这样的链接几天后内容全部变化;
      • &PHPSESSION=l85skdj23w4qq2sw3w42
        • 每个蜘蛛识别为不同链接;
  9. 网页快照可以解决一部分问题
    • 但是用户得到的内容可能是过时的;
    • 原网站丢失了原本可以获得的用户;
  10. 搜索引擎的负担:除重
    • Blog 内容:
      • 内容页相对稳定;
      • 归档链接规则稳定;
      • 类似的:邮件列表归档也是搜索引擎比较容易收录的内容;
    • BBS 内容:
      • Foo.php?a=1&b=2 与 foo.php?b=2&a=1 内容是一样的
      • index.html?from=foo 与 index.html?from=bar 内容是一样的
  11. 不同地址标记相同内容的危害
    • 会损失其他地址带来的链接;
    • 大量使用转向进行统计也为搜索引擎识别链接的别名带来负担;
    • 访问日志中的 referer 可以代替标记跟踪来源;
  12. 帧结构 : frame 不利于蜘蛛抓取
    • BLOG 大部分为平板式页面浏览;
    • BBS 的左导航 / 右侧内容模式,不利于蜘蛛抓取,也不利于重现;
  13. 性能因素:缓存机制
    • 静态归档更容易缓存性能更高
      • MT 的静态页面归档;
      • LJ 的 memcache 动态缓存模式;
    • 动态页面生成:
      • 过大压力下容易造成服务器宕机;
      • 结构化数据库往往是瓶颈;
  14. Tips : Cache Friendly ~= SEO
    • 使用稳定的连接:避免经常变化;
    • 避免使用动态参数来进行点击来源跟踪
      • index.html?source=foo
      • Index.html?source=bar
      • 有更简单的方法:基于 referer 进行来源识别;
    • 增加 Last-Modify/Expires 等缓存控制 Header ;
    • 链接 / 域名更换:
      • 要保留原地址可访问,
      • 设置 301 转向;
  15. Blog 内容的特点
    • 作者对内容 / 回复完全控制;
    • 个人版权声明: CC ;
    • 时效性;
    • 归档机制;
  16. 主贴和回复是天生不平等的
    • 文章发布者是文章条目的所有人;
      • 可以控制回复的数量和质量、排序等因素;
      • 可以控制文章;
    • 主贴作者甚至无法控制低质量的回复;
    • 回复内容展现大量的噪音:
      • 回复者的信息,排名,签名等噪音
      • 回复和主贴存储在同一空间中,严重降低效率;
  17. 私有内容:利于内容长期维护
    • Blog 内容是私有的;
    • 面向归档,备忘的;
    • 内容可重用度较高;
    • 是个人的在线虚拟资产;
    • 原创内容相对多;
    • 不同搜索引擎对于新发现内容有一定的加权,一般 2 周后,或者 1 个月后内容会回到同其他内容一样的权重;
    • BBS 内容则无法承诺长期保存;
    • 内容实效性较强;
    • 缺乏搜索引擎来源的反馈,影响面有限;
    • 转载多,原创少;
  18. 引用发现和用户交互
    • 可视化编辑器在 blog 发布系统中广泛使用:
      • 内容来源链接地址:内部 / 外部都较多;
      • BBS 为防止 XSS ,往往禁用可视化编辑器或使用 BBCODE ;
    • 如何方便转载者主动标记原文出处:
      • 再次推销一下 [chedong copyright 模板 ]
      • 便于用户 Copy/Paster 并能有效链接的模板
      • 为用户做正确的事情提供方便;
  19. RSS : 低成本新内容发现机制
    • 节省带宽: 不遍历网站内容而发现最新内容;
    • Ping 机制可以进一步提高发现新条目的效率;
    • 部分自动镜像产生反向链接;
  20. 结论:良好结构,良好引用,良好导航
    • 学习一下 MovableType 和 WordPress Wiki 内容发布的优点;
    • 对原有 BBS/FAQ 等发布系统规划注意以下事项:
      • 搜索引擎蜘蛛抓取 friendly :
        • 新内容发现:对 RSS/Sitemaps 协议的支持;
        • 旧内容遍历: 3 跳之内遍历完网站所有内容;
      • 链接归档:
        • 稳定和统一的归档机制;
      • 良好引用:
        • 对非本站原创内容标明出处引用;
        • 内部关联发现:通过关键词 /TAG 站内检索;
      • 对旧内容的重构可以获得和 blog/wiki 发布系统一样的 SEO 效果;

+ YuanchengYuancheng, 3 years ago

custom

3091 views, 2 favs, 0 embeds more stats

More info about this document

© All Rights Reserved

Go to text version

  • Total Views 3091
    • 3091 on SlideShare
    • 0 from embeds
  • Comments 1
  • Favorites 2
  • Downloads 110
Most viewed embeds

more

All embeds

less

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate. If needed, use the feedback form to let us know more details.

Cancel
File a copyright complaint
Having problems? Go to our helpdesk?