SOSO 访问速度优化
Calvinli
2007-12-04
SOSO 产品线简单介绍
综合搜索
问问
看看我们都优化了哪些部分
• 服务器布局优化
• 减少页面 HTTP 请求
• 启用服务器端压缩
• 调整 DNS TTL
• CDN 外包
• 第三方评测服务
• … …
服务器布局优化
• SOSO 用户分布
通过对用户来源的统
计分析, soso 用户主
要分布在南方沿海省
份及人口大省,南北
方分布比例大致为
7 : 3 ,其中广东超过
200 万独立用户,江
苏、浙江分别超过
100 万独立用户。
服务器布局优化
• SOSO 理想服务器布局
服务器布局优化
• 按照用户的运营商及地域分布, SOSO 用户大致可以分
为五个区域:
服务器布局优化
服务器布局优化
• 根据用户数据分析及公司对 IDC 的建设重点, SOSO 最
终部署的 IDC 为:
– 天津  北京(北方用户)
– 西安(西南、西北用户)
– 深圳(南方用户)
– 上海  南京(华东、华南用户)
服务器布局优化
• 案例 一
www.soso.com网页搜索频道
网页搜索之前仅在天津和深圳部署服务器,调整后网页搜
索前台分布在北京、上海、深圳、成都。
这样的分布照顾了各地用户的体验,尤其可以改善北京、
上海、江浙一带、四川等地的用户,这...
最大限度的减少 HTTP 请求
• 用户装载页面过程中 85% 以上的时间花费在装载图像、
CSS 、 JS 等,而浏览器在同一个域名下默认只支持两个
并发请求,所以最大限度的减少 HTTP 请求是网页快速装
载的关键。
最大限度的减少 HTTP 请求
• 在不影响产品表现的情况下尽量精简页面元素
• 使用 CSS 图像拼合技术
• 将原有页面中由 JS 实现的部分功能迁移到后台实现,页
面中只保留必要的 JS
• 页面大小尽量在控制在 MTU 的整数倍,充分利...
最大限度的减少 HTTP 请求
• 案例 二
• SOSO 音乐搜索首页应用了 css 图像拼合技术,将页面中
用到的小图片拼合成一张大图片在 css 中调用
• 图像拼合前需要 7 次 http 请求才可以将图片下载完,拼合
后只需要 1 次...
最大限度的减少 HTTP 请求
启用服务器端压缩
• 针对 apache 1.3 + mod_gzip 和 apache-2.0.59 +
mod_deflate 等多种配置进行响应时间、压缩率、服务器负载
的测试。
• 测试结果表明在压缩率基本相同的情况下,由于
mod_d...
启用服务器端压缩
• 案例三
• Apache 打开 mod_deflate 后流量较之前节省了 30-40%.
以 12 月 22 日和 12 月 19 日流量数据对比,打开 mod_deflate 后流量较
之前节省了约 35%.
调整 DNS TTL
• DNS TTL
通过对用户访问过程的监测,发现在用户访问过程
中, DNS 解析时间占用了较大的比例,通过与管工的沟通
,将 DNS TTL 由 10 分钟修改为 30 分钟。
延长 DNS TTL 时间可以减少用户到...
CDN 外包
• 今年 4 月初,公司启动了 CDN 外包项目, SOSO 对各厂
商进行测试,在对试点数据进行了多次测试和分析的基础
上, 5 月底开始逐步将线上内容切换至 CDN ,虽然 CDN
的推进带来了一些额外的工作,但是静态内容切换...
第三方评测服务
• 为了客观得到用户访问的体验数据,我们在部门自己架设
监测服务器的基础上,引入了第三方评测服务, 5 月初购
买了 gomez 评测服务,通过 gomez 在全国的节点对现有
服务进行监测,可以知道不同地区、不同接入带宽的最终...
第三方评测服务
• Gomez 测试数据展示。
可以通过最终用户的访问纪
录到用户请求每一个页面元
素的
DNS 、 Connect 、 1stByte
、 Download 等时间
• 还可以看到按省份、运营商
等分类的统计数据。
优化成果
• 2007 年 14 期《互联网周刊》刊登了一篇名为《中国热门
网站用户体验排行榜》的文章,文中 SOSO 在响应时间
、可靠性、稳定性三个方面分列第三、第二和第三;在国
内搜索类网站中排名第二。
• 这个排行榜是《互联网周刊》与网...
后续的性能优化相关工作
• 利用 toolbar 客户端优势,搭建产品测速平台。
• 网页搜索结果页静态化。
谢谢大家
Upcoming SlideShare
Loading in …5
×

腾讯大讲堂13 soso访问速度优化

429
-1

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
429
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
14
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • SOSO从开始运营起,速度性能优化工作一直在持续不断的进行,看看我们都做了哪些工作。
  • 按照用户分布,按理想状态做服务器的布属,在独立用户超过50万的地区部署服务器。右图为chinacache在全国的服务器分布,目前chinacache在国内拥有350个节点,可服务的互联网用户超过全国总数的95%。(2006年全国上网人数为1.23亿)
  • 由于运营成本等诸多问题,我们不可能按照理想分布部署服务器,所以我们按照用户的分布,把全国分为四个区域,既北方用户(指北方十省)、华东华南用户(主要指江浙、福建等东南沿海省份)、南方用户(指广东等南方省份)、西北西南用户(主要指西部省份)。其他用户约占全部用户的10.16%。*其他用户为教育网、铁通、移动、联通或未知地域、运营商的用户。
  • 全国的四个区域,这个区域的划分参考了SOSO的用户分布以及公司的IDC测速平台对现有IDC的速度测试数据。
  • 上述全国四个区域的划分正好符合了公司对全国IDC的建设重点,既北方用户(天津、北京)、西南、西北用户(西安)、南方用户(深圳)、华东、华南用户(南京、上海)
  • A:apache 1.3 + mod_gzip
    C:apache-2.0.59 + mod_deflate
    D:apache-2.0.59 + mod_defalte + mod_file_cache
    Aapche 2.0.59中开启mod_file_cache后,对访问成功率、总消耗时间、服务器端负载均稍有改善,但改善幅度很小。同时,由于目前标准mod_file_cache配置是通过配置文件中的文件列表完成,不够灵活,如果启用,会增加内容发布更新的难度,所以未选用。
  • 国内没有DNS根服务器,所有根域的查询要到国外的根服务器进行,增加了出错的几率及解析时间。浏览器在域名解析完成前无法下载任何内容。
  • 腾讯大讲堂13 soso访问速度优化

    1. 1. SOSO 访问速度优化 Calvinli 2007-12-04
    2. 2. SOSO 产品线简单介绍
    3. 3. 综合搜索
    4. 4. 问问
    5. 5. 看看我们都优化了哪些部分 • 服务器布局优化 • 减少页面 HTTP 请求 • 启用服务器端压缩 • 调整 DNS TTL • CDN 外包 • 第三方评测服务 • … …
    6. 6. 服务器布局优化 • SOSO 用户分布 通过对用户来源的统 计分析, soso 用户主 要分布在南方沿海省 份及人口大省,南北 方分布比例大致为 7 : 3 ,其中广东超过 200 万独立用户,江 苏、浙江分别超过 100 万独立用户。
    7. 7. 服务器布局优化 • SOSO 理想服务器布局
    8. 8. 服务器布局优化 • 按照用户的运营商及地域分布, SOSO 用户大致可以分 为五个区域:
    9. 9. 服务器布局优化
    10. 10. 服务器布局优化 • 根据用户数据分析及公司对 IDC 的建设重点, SOSO 最 终部署的 IDC 为: – 天津 北京(北方用户) – 西安(西南、西北用户) – 深圳(南方用户) – 上海 南京(华东、华南用户)
    11. 11. 服务器布局优化 • 案例 一 www.soso.com网页搜索频道 网页搜索之前仅在天津和深圳部署服务器,调整后网页搜 索前台分布在北京、上海、深圳、成都。 这样的分布照顾了各地用户的体验,尤其可以改善北京、 上海、江浙一带、四川等地的用户,这些地区用户数超过 SOSO 用户的 30% 。 网页前台从天津迁移至北京后,北京用户访问速度提升 29% , 增加上海服务器部署后,上海用户访问速度提升 25% , 增加成都服务器部署后,四川用户访问速度提升 27% 。
    12. 12. 最大限度的减少 HTTP 请求 • 用户装载页面过程中 85% 以上的时间花费在装载图像、 CSS 、 JS 等,而浏览器在同一个域名下默认只支持两个 并发请求,所以最大限度的减少 HTTP 请求是网页快速装 载的关键。
    13. 13. 最大限度的减少 HTTP 请求 • 在不影响产品表现的情况下尽量精简页面元素 • 使用 CSS 图像拼合技术 • 将原有页面中由 JS 实现的部分功能迁移到后台实现,页 面中只保留必要的 JS • 页面大小尽量在控制在 MTU 的整数倍,充分利用每一次 包传输
    14. 14. 最大限度的减少 HTTP 请求 • 案例 二 • SOSO 音乐搜索首页应用了 css 图像拼合技术,将页面中 用到的小图片拼合成一张大图片在 css 中调用 • 图像拼合前需要 7 次 http 请求才可以将图片下载完,拼合 后只需要 1 次 • 图像拼合后减少了页面代码中的重复部分
    15. 15. 最大限度的减少 HTTP 请求
    16. 16. 启用服务器端压缩 • 针对 apache 1.3 + mod_gzip 和 apache-2.0.59 + mod_deflate 等多种配置进行响应时间、压缩率、服务器负载 的测试。 • 测试结果表明在压缩率基本相同的情况下,由于 mod_deflate ( C )模块造成的负载远低于 mod_gzip ( A ) , 最终选定 apache2.0.59+mod_deflate
    17. 17. 启用服务器端压缩 • 案例三 • Apache 打开 mod_deflate 后流量较之前节省了 30-40%. 以 12 月 22 日和 12 月 19 日流量数据对比,打开 mod_deflate 后流量较 之前节省了约 35%.
    18. 18. 调整 DNS TTL • DNS TTL 通过对用户访问过程的监测,发现在用户访问过程 中, DNS 解析时间占用了较大的比例,通过与管工的沟通 ,将 DNS TTL 由 10 分钟修改为 30 分钟。 延长 DNS TTL 时间可以减少用户到根服务器解析 A 纪录 的次数,从而减少 DNS 解析时间,同时也降低了用户到 DNS 访问出错的几率,提高服务可用性。 TTL 修改后每天的根域查询量降低了 40% 。
    19. 19. CDN 外包 • 今年 4 月初,公司启动了 CDN 外包项目, SOSO 对各厂 商进行测试,在对试点数据进行了多次测试和分析的基础 上, 5 月底开始逐步将线上内容切换至 CDN ,虽然 CDN 的推进带来了一些额外的工作,但是静态内容切换至 CDN 后,速度较切换前提升 15% ,同时节省了大量服 务器和运营管理的成本。
    20. 20. 第三方评测服务 • 为了客观得到用户访问的体验数据,我们在部门自己架设 监测服务器的基础上,引入了第三方评测服务, 5 月初购 买了 gomez 评测服务,通过 gomez 在全国的节点对现有 服务进行监测,可以知道不同地区、不同接入带宽的最终 用户实际访问效果,对业务的改进很有帮助。
    21. 21. 第三方评测服务 • Gomez 测试数据展示。 可以通过最终用户的访问纪 录到用户请求每一个页面元 素的 DNS 、 Connect 、 1stByte 、 Download 等时间 • 还可以看到按省份、运营商 等分类的统计数据。
    22. 22. 优化成果 • 2007 年 14 期《互联网周刊》刊登了一篇名为《中国热门 网站用户体验排行榜》的文章,文中 SOSO 在响应时间 、可靠性、稳定性三个方面分列第三、第二和第三;在国 内搜索类网站中排名第二。 • 这个排行榜是《互联网周刊》与网络服务机构 gomez 共同 推出的, 5 月底,测试方根据中国互联网协会( http:// www.chinarank.org.cn/)上热门网站的排行,通过部署在 北京、上海、广州的测试节点对热门网站进行了为期一个 月的监测。
    23. 23. 后续的性能优化相关工作 • 利用 toolbar 客户端优势,搭建产品测速平台。 • 网页搜索结果页静态化。
    24. 24. 谢谢大家
    1. A particular slide catching your eye?

      Clipping is a handy way to collect important slides you want to go back to later.

    ×