SlideShare a Scribd company logo
1 of 17
Остросюжетный блокбастер
“VS” Технологии
Выбор технологий,
что бы в дальнейшем вас не “нагнули”
Обзор технологий популярных
онлайн ресурсов
●
Facebook
●
Twitter
●
Instagram
●
Wikipedia
Facebook
– Linux — операционная система
– PHP с HipHop — код на PHP компилируется в C++
– memcached — агрессивное кэширование объектов
– MySQL — используется как хранилище пар ключ-
значение, никаких join'ов
– Thrift — интерфейс взаимодействия между сервисами,
написанными на разных языках программирования
– Scribe — универсальная система сбора и агрегации
данных с рабочих серверов
Facebook - Статистика
- Более 200 миллиардов просмотров страниц в месяц
- Более 150 миллионов обращений к кэшу в секунду; 2 триллиона
объектов в кэше
- Более 200 миллиардов просмотров страниц в месяц
- До 1.2 миллиона фотографий в секунду
- 20 миллиардов фотографий в 4 разрешениях = 80 миллиардов
фотографий, их бы хватило чтобы покрыть поверхность земли в 10
слоев
- Более миллиарда сообщений в чате каждый день
- Десятки тысяч серверов, десятки гигабит трафика
Данные на 2011 год
Twitter
Платформа
●
Apache + mod_proxy
●
Unicorn
●
Ruby + Ruby on Rails, Scala
●
memcached
●
Kestrel
●
MySQL, Hadoop, HBase и Pig
Оборудование
●
Более двух тысяч серверов
Статистика - Twitter
- Миллиард твитов за неделю
- 175 миллионов зарегистрированных пользователей на сентябрь 2010
года
- 460 000 новых регистраций пользователей в день
- 9й сайт в мире по популярности (по данным Alexa, год назад был на 12
месте)
- 600 миллионов поисков в день
- Лишь 25% трафика приходится на веб сайт, остальное идет через API
- 6 миллиардов запросов к API в день, около 70 тысяч в секунду
http://blog.twitter.com/2011/03/numbers.html
Instagram
●
Ubuntu Linux 11.04
●
Python, Django
●
Memcached
●
PostgreSQL
●
Fabric
●
xfs
Instagram - Статистика
Начало:
●
1 слабый сервер
●
25к регистраций в первый день
●
2 разработчика
Instagram - Статистика
Сегодня:
●
100+ миллионов пользователей
●
40 миллионов фотографий в день
●
8500 Лайков в секунду
●
1000 Комментариев в секунду
●
Миллион регистраций за 12 часов после запуска Android-
версии
●
5 разработчиков
Wikipedia
●
Apache
●
Linux
●
MySQL, PHP
●
Squid
●
LVS
●
Lucene
●
Memcached
●
lighttpd
Wikipedia - Статистика
●
8 миллионов статей распределены по сотням языковых
подпроектов
●
В десятке самых высоконагруженных проектов по
данным Alexa
●
Удвоение трафика происходит каждые 4-6 месяцев
●
30000 HTTP запросов в секунду в периоды пиковой
нагрузки
●
3 GBps трафик данных
●
350 серверов, конфигурации варьируются от
однопроцессорных Pentium 4 до двухпроцессорных Xeon.
●
Управляется ~6 людьми
Что у них общего ?
Они не самые бедные
и все они
исспользуют Open Source
свободно распростаняемое ПО !
(сервера, базы данных и тд...)
Критерии выбора ПО и
платформы
●
Производительность
●
Отказоустойчивость
●
Безопасность
●
Стоимость масштабирования
●
Стоимость обслуживания
Для массовых проектов с большим
количеством пользователей более
выгодны
Операционные системы:
Linux, FreeBSD
Языки программирования:
Python, Ruby, Java, C/C++, Mono C#
Базы данных и хранилища:
PostgreSQL, MySQL, MongoDB, Redis
Вопросы, мнения, пожелания,
проклятия...
Спасибо за внимание!
Gaik@Zakarian.eu
Marketing, Business dev.
Online services and media
http://www.facebook.com/gaik.zakarian
http://www.linkedin.com/in/gaikzakarian

More Related Content

Similar to Гайк Закарян Выбор платформ на основе анализа крупных интернет проектов

«Облачная платформа Windows Azure для высоконагруженных проектов»
«Облачная платформа Windows Azure для высоконагруженных проектов»«Облачная платформа Windows Azure для высоконагруженных проектов»
«Облачная платформа Windows Azure для высоконагруженных проектов»Nata_Churda
 
AVITO. Решаем проблемы по мере их поступления. Стачка 2013
AVITO. Решаем проблемы по мере их поступления. Стачка 2013AVITO. Решаем проблемы по мере их поступления. Стачка 2013
AVITO. Решаем проблемы по мере их поступления. Стачка 2013Roman Pavlushko
 
Электронная коммерция: от Hadoop к Spark Scala
Электронная коммерция: от Hadoop к Spark ScalaЭлектронная коммерция: от Hadoop к Spark Scala
Электронная коммерция: от Hadoop к Spark ScalaRoman Zykov
 
Hivext – облачная платформа для быстрой разработки интернет приложений
Hivext – облачная платформа для быстрой разработки  интернет приложений Hivext – облачная платформа для быстрой разработки  интернет приложений
Hivext – облачная платформа для быстрой разработки интернет приложений guest800050
 
Владимир Русинов "Яндекс.Диск. Полет нормальный"
Владимир Русинов "Яндекс.Диск. Полет нормальный"Владимир Русинов "Яндекс.Диск. Полет нормальный"
Владимир Русинов "Яндекс.Диск. Полет нормальный"Yandex
 
[JAM 1.0] CMS. Обзор. (Alexei Yanochkin)
[JAM 1.0] CMS. Обзор. (Alexei Yanochkin)[JAM 1.0] CMS. Обзор. (Alexei Yanochkin)
[JAM 1.0] CMS. Обзор. (Alexei Yanochkin)Evgeny Kaziak
 
Tagconf 12 - SphinxSearch - 1
Tagconf 12 - SphinxSearch - 1Tagconf 12 - SphinxSearch - 1
Tagconf 12 - SphinxSearch - 1Roman Kudlay
 
Мониторинг быстродействия web-проекта / Владимир Буянов (Ultimate Guitar)
Мониторинг быстродействия web-проекта / Владимир Буянов (Ultimate Guitar)Мониторинг быстродействия web-проекта / Владимир Буянов (Ultimate Guitar)
Мониторинг быстродействия web-проекта / Владимир Буянов (Ultimate Guitar)Ontico
 
CodeFest 2012. Лихтер К, Таратухин И. — Коктейль «Skydive» или как мы делали ...
CodeFest 2012. Лихтер К, Таратухин И. — Коктейль «Skydive» или как мы делали ...CodeFest 2012. Лихтер К, Таратухин И. — Коктейль «Skydive» или как мы делали ...
CodeFest 2012. Лихтер К, Таратухин И. — Коктейль «Skydive» или как мы делали ...CodeFest
 
Коктейль Skydive или как мы мы делали 2ГИС-Онлайн
Коктейль Skydive или как мы мы делали 2ГИС-ОнлайнКоктейль Skydive или как мы мы делали 2ГИС-Онлайн
Коктейль Skydive или как мы мы делали 2ГИС-ОнлайнKonstantin Likhter
 
Почему стоит выбрать PHP
Почему стоит выбрать PHPПочему стоит выбрать PHP
Почему стоит выбрать PHPMaxim Sivokon
 
Thumbtack Expertise Days # 5 - Dataset
Thumbtack Expertise Days # 5 - DatasetThumbtack Expertise Days # 5 - Dataset
Thumbtack Expertise Days # 5 - DatasetAlexey Remnev
 
особенности разработки универсальных Cms кирилл хряпин
особенности разработки универсальных Cms   кирилл хряпинособенности разработки универсальных Cms   кирилл хряпин
особенности разработки универсальных Cms кирилл хряпинMedia Gorod
 
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...Vitaly Yushkevich
 
Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...
Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...
Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...SQALab
 
Инфраструктура социального проекта
Инфраструктура социального проектаИнфраструктура социального проекта
Инфраструктура социального проектаMedia Gorod
 

Similar to Гайк Закарян Выбор платформ на основе анализа крупных интернет проектов (20)

«Облачная платформа Windows Azure для высоконагруженных проектов»
«Облачная платформа Windows Azure для высоконагруженных проектов»«Облачная платформа Windows Azure для высоконагруженных проектов»
«Облачная платформа Windows Azure для высоконагруженных проектов»
 
AVITO. Решаем проблемы по мере их поступления. Стачка 2013
AVITO. Решаем проблемы по мере их поступления. Стачка 2013AVITO. Решаем проблемы по мере их поступления. Стачка 2013
AVITO. Решаем проблемы по мере их поступления. Стачка 2013
 
Электронная коммерция: от Hadoop к Spark Scala
Электронная коммерция: от Hadoop к Spark ScalaЭлектронная коммерция: от Hadoop к Spark Scala
Электронная коммерция: от Hadoop к Spark Scala
 
Hivext 04.2010
Hivext 04.2010Hivext 04.2010
Hivext 04.2010
 
Hivext – облачная платформа для быстрой разработки интернет приложений
Hivext – облачная платформа для быстрой разработки  интернет приложений Hivext – облачная платформа для быстрой разработки  интернет приложений
Hivext – облачная платформа для быстрой разработки интернет приложений
 
Владимир Русинов "Яндекс.Диск. Полет нормальный"
Владимир Русинов "Яндекс.Диск. Полет нормальный"Владимир Русинов "Яндекс.Диск. Полет нормальный"
Владимир Русинов "Яндекс.Диск. Полет нормальный"
 
[JAM 1.0] CMS. Обзор. (Alexei Yanochkin)
[JAM 1.0] CMS. Обзор. (Alexei Yanochkin)[JAM 1.0] CMS. Обзор. (Alexei Yanochkin)
[JAM 1.0] CMS. Обзор. (Alexei Yanochkin)
 
Tagconf 12 - SphinxSearch - 1
Tagconf 12 - SphinxSearch - 1Tagconf 12 - SphinxSearch - 1
Tagconf 12 - SphinxSearch - 1
 
Мониторинг быстродействия web-проекта / Владимир Буянов (Ultimate Guitar)
Мониторинг быстродействия web-проекта / Владимир Буянов (Ultimate Guitar)Мониторинг быстродействия web-проекта / Владимир Буянов (Ultimate Guitar)
Мониторинг быстродействия web-проекта / Владимир Буянов (Ultimate Guitar)
 
YaC 2013 Notes
YaC 2013 NotesYaC 2013 Notes
YaC 2013 Notes
 
Present.pps
Present.ppsPresent.pps
Present.pps
 
Present.pps
Present.ppsPresent.pps
Present.pps
 
CodeFest 2012. Лихтер К, Таратухин И. — Коктейль «Skydive» или как мы делали ...
CodeFest 2012. Лихтер К, Таратухин И. — Коктейль «Skydive» или как мы делали ...CodeFest 2012. Лихтер К, Таратухин И. — Коктейль «Skydive» или как мы делали ...
CodeFest 2012. Лихтер К, Таратухин И. — Коктейль «Skydive» или как мы делали ...
 
Коктейль Skydive или как мы мы делали 2ГИС-Онлайн
Коктейль Skydive или как мы мы делали 2ГИС-ОнлайнКоктейль Skydive или как мы мы делали 2ГИС-Онлайн
Коктейль Skydive или как мы мы делали 2ГИС-Онлайн
 
Почему стоит выбрать PHP
Почему стоит выбрать PHPПочему стоит выбрать PHP
Почему стоит выбрать PHP
 
Thumbtack Expertise Days # 5 - Dataset
Thumbtack Expertise Days # 5 - DatasetThumbtack Expertise Days # 5 - Dataset
Thumbtack Expertise Days # 5 - Dataset
 
особенности разработки универсальных Cms кирилл хряпин
особенности разработки универсальных Cms   кирилл хряпинособенности разработки универсальных Cms   кирилл хряпин
особенности разработки универсальных Cms кирилл хряпин
 
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
 
Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...
Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...
Badoo в облаках. Решение для запуска cli-скриптов в облаке собственной разраб...
 
Инфраструктура социального проекта
Инфраструктура социального проектаИнфраструктура социального проекта
Инфраструктура социального проекта
 

Гайк Закарян Выбор платформ на основе анализа крупных интернет проектов

  • 2. “VS” Технологии Выбор технологий, что бы в дальнейшем вас не “нагнули”
  • 3. Обзор технологий популярных онлайн ресурсов ● Facebook ● Twitter ● Instagram ● Wikipedia
  • 4. Facebook – Linux — операционная система – PHP с HipHop — код на PHP компилируется в C++ – memcached — агрессивное кэширование объектов – MySQL — используется как хранилище пар ключ- значение, никаких join'ов – Thrift — интерфейс взаимодействия между сервисами, написанными на разных языках программирования – Scribe — универсальная система сбора и агрегации данных с рабочих серверов
  • 5. Facebook - Статистика - Более 200 миллиардов просмотров страниц в месяц - Более 150 миллионов обращений к кэшу в секунду; 2 триллиона объектов в кэше - Более 200 миллиардов просмотров страниц в месяц - До 1.2 миллиона фотографий в секунду - 20 миллиардов фотографий в 4 разрешениях = 80 миллиардов фотографий, их бы хватило чтобы покрыть поверхность земли в 10 слоев - Более миллиарда сообщений в чате каждый день - Десятки тысяч серверов, десятки гигабит трафика Данные на 2011 год
  • 6. Twitter Платформа ● Apache + mod_proxy ● Unicorn ● Ruby + Ruby on Rails, Scala ● memcached ● Kestrel ● MySQL, Hadoop, HBase и Pig Оборудование ● Более двух тысяч серверов
  • 7. Статистика - Twitter - Миллиард твитов за неделю - 175 миллионов зарегистрированных пользователей на сентябрь 2010 года - 460 000 новых регистраций пользователей в день - 9й сайт в мире по популярности (по данным Alexa, год назад был на 12 месте) - 600 миллионов поисков в день - Лишь 25% трафика приходится на веб сайт, остальное идет через API - 6 миллиардов запросов к API в день, около 70 тысяч в секунду http://blog.twitter.com/2011/03/numbers.html
  • 8. Instagram ● Ubuntu Linux 11.04 ● Python, Django ● Memcached ● PostgreSQL ● Fabric ● xfs
  • 9. Instagram - Статистика Начало: ● 1 слабый сервер ● 25к регистраций в первый день ● 2 разработчика
  • 10. Instagram - Статистика Сегодня: ● 100+ миллионов пользователей ● 40 миллионов фотографий в день ● 8500 Лайков в секунду ● 1000 Комментариев в секунду ● Миллион регистраций за 12 часов после запуска Android- версии ● 5 разработчиков
  • 12. Wikipedia - Статистика ● 8 миллионов статей распределены по сотням языковых подпроектов ● В десятке самых высоконагруженных проектов по данным Alexa ● Удвоение трафика происходит каждые 4-6 месяцев ● 30000 HTTP запросов в секунду в периоды пиковой нагрузки ● 3 GBps трафик данных ● 350 серверов, конфигурации варьируются от однопроцессорных Pentium 4 до двухпроцессорных Xeon. ● Управляется ~6 людьми
  • 13. Что у них общего ? Они не самые бедные и все они исспользуют Open Source свободно распростаняемое ПО ! (сервера, базы данных и тд...)
  • 14. Критерии выбора ПО и платформы ● Производительность ● Отказоустойчивость ● Безопасность ● Стоимость масштабирования ● Стоимость обслуживания
  • 15. Для массовых проектов с большим количеством пользователей более выгодны Операционные системы: Linux, FreeBSD Языки программирования: Python, Ruby, Java, C/C++, Mono C# Базы данных и хранилища: PostgreSQL, MySQL, MongoDB, Redis
  • 17. Спасибо за внимание! Gaik@Zakarian.eu Marketing, Business dev. Online services and media http://www.facebook.com/gaik.zakarian http://www.linkedin.com/in/gaikzakarian