QA Fest 2015. Станислав Трубин. Интервью: Как успешные зарубежные компании на...QAFest
Создание сильных команд разработчиков и построение правильной культуры компании сегодня являются ключевыми моментами роста и успеха динамичной IT компании. Но как грамотно построить собеседования чтобы выбрать лучших кандидатов? На что обратить внимание? Как сделать это быстро и эффективно?
Этот доклад, основанный на собственном опыте, рассказывает о том, как проводят интервью такие успешные компании как Google, Facebook, Amazon, LinkedIn и Redfin.
QA Fest 2015. Станислав Трубин. Интервью: Как успешные зарубежные компании на...QAFest
Создание сильных команд разработчиков и построение правильной культуры компании сегодня являются ключевыми моментами роста и успеха динамичной IT компании. Но как грамотно построить собеседования чтобы выбрать лучших кандидатов? На что обратить внимание? Как сделать это быстро и эффективно?
Этот доклад, основанный на собственном опыте, рассказывает о том, как проводят интервью такие успешные компании как Google, Facebook, Amazon, LinkedIn и Redfin.
Применение машинного обучения для генерации структурированных сниппетов в пои...Ontico
РИТ++ 2017, секция ML + IoT + ИБ
Зал Белу-Оризонти, 6 июня, 17:00
Тезисы:
http://ritfest.ru/2017/abstracts/2768.html
Идеальная поисковая система должна возвращать упорядоченный по убыванию релевантности список результатов. Однако, это не всегда получается из-за сложности естественного языка, неоднозначности в запросах, вариативности личных предпочтений пользователей. Как следствие, релевантный результат может находиться на любой позиции на странице поисковой выдачи.
...
Как попасть на следующий уровень карьеры и зарплаты в C#geekfamilyrussia
Есть ли потолок заработной платы? Что делать, если Вы уперлись в него. Как преодолевать уровни сопротивления и избегать в ловушек в карьере .net разработчика. Результат анализа более 6.000 резюме C# разработчиков в Москве.
Восемь подводных камней на пути к внедрению аналитики Больших данныхElizaveta Alekseeva
Приручить Большие данные, аналитику и искусственный интеллект и добиться от них пользы для бизнеса не так-то просто. Узнайте, какие «подводные камни» ожидают тех, кто решил внедрять аналитику Больших данных, и – главное – как их преодолеть.
Применение машинного обучения для генерации структурированных сниппетов в пои...Nik Spirin
Идеальная поисковая система должна возвращать упорядоченный по убыванию релевантности список результатов. Однако, это не всегда получается из-за сложности естественного языка, неоднозначности в запросах, вариативности личных предпочтений пользователей. Как следствие, релевантный результат может находиться на любой позиции на странице поисковой выдачи.
Чтобы помочь пользователям быстрее находить релевантные результаты, поисковые системы показывают на странице результатов ссылки и краткие описания результатов (2-3 строчки), называемые сниппетами. Сниппеты позволяют различать результаты друг от друга, таким образом помогая минимизировать просмотры повторяющейся информации, и определять релевантность каждого отдельного результата. Если же сниппеты неинформативны, пользователи вынуждены просматривать все результаты один за другим и терять ценное время. Например, таковыми являются сниппеты многих ведущих поисковиков работы --- они содержат лишь должность и место работы, опуская важную информацию о требованиях, обязанностях, навыках и др.
В данном докладе мы представим новый расширенный структурированный формат сниппетов для поисковиков работы и расскажем о подходе к генерации таких сниппетов методами машинного обучения. Мы опишем весь процесс от возникновения идеи до внедрения. В частности, мы начнем с юзер-исследования, направленного на выявление важных для соискателей атрибутов о работе. Далее, мы разберем дешевый и простой способ порождения обучающего множества для машинного обучения, основанный на наблюдении о структуре вакансий, а также опишем непосредственно сам процесс машинного обучения, модель алгоритмов, и уникальные "хаки". В заключение, мы представим результаты оффлайн эксперимента и онлайн A/B-теста.
Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...Vlad Linnik
В данном докладе мы бы хотели поделиться тем, как именно с точки зрения Бизнеса мы
- Превращаем бизнес-проблему в осязаемый план Big Data проекта
- Как запускаем его реализацию
Также, на верхнем уровне рассказать, что происходит “под капотом” во время реализации.
И как мы оцениваем результаты всего проекта.
Применение машинного обучения для генерации структурированных сниппетов в пои...Ontico
РИТ++ 2017, секция ML + IoT + ИБ
Зал Белу-Оризонти, 6 июня, 17:00
Тезисы:
http://ritfest.ru/2017/abstracts/2768.html
Идеальная поисковая система должна возвращать упорядоченный по убыванию релевантности список результатов. Однако, это не всегда получается из-за сложности естественного языка, неоднозначности в запросах, вариативности личных предпочтений пользователей. Как следствие, релевантный результат может находиться на любой позиции на странице поисковой выдачи.
...
Как попасть на следующий уровень карьеры и зарплаты в C#geekfamilyrussia
Есть ли потолок заработной платы? Что делать, если Вы уперлись в него. Как преодолевать уровни сопротивления и избегать в ловушек в карьере .net разработчика. Результат анализа более 6.000 резюме C# разработчиков в Москве.
Восемь подводных камней на пути к внедрению аналитики Больших данныхElizaveta Alekseeva
Приручить Большие данные, аналитику и искусственный интеллект и добиться от них пользы для бизнеса не так-то просто. Узнайте, какие «подводные камни» ожидают тех, кто решил внедрять аналитику Больших данных, и – главное – как их преодолеть.
Применение машинного обучения для генерации структурированных сниппетов в пои...Nik Spirin
Идеальная поисковая система должна возвращать упорядоченный по убыванию релевантности список результатов. Однако, это не всегда получается из-за сложности естественного языка, неоднозначности в запросах, вариативности личных предпочтений пользователей. Как следствие, релевантный результат может находиться на любой позиции на странице поисковой выдачи.
Чтобы помочь пользователям быстрее находить релевантные результаты, поисковые системы показывают на странице результатов ссылки и краткие описания результатов (2-3 строчки), называемые сниппетами. Сниппеты позволяют различать результаты друг от друга, таким образом помогая минимизировать просмотры повторяющейся информации, и определять релевантность каждого отдельного результата. Если же сниппеты неинформативны, пользователи вынуждены просматривать все результаты один за другим и терять ценное время. Например, таковыми являются сниппеты многих ведущих поисковиков работы --- они содержат лишь должность и место работы, опуская важную информацию о требованиях, обязанностях, навыках и др.
В данном докладе мы представим новый расширенный структурированный формат сниппетов для поисковиков работы и расскажем о подходе к генерации таких сниппетов методами машинного обучения. Мы опишем весь процесс от возникновения идеи до внедрения. В частности, мы начнем с юзер-исследования, направленного на выявление важных для соискателей атрибутов о работе. Далее, мы разберем дешевый и простой способ порождения обучающего множества для машинного обучения, основанный на наблюдении о структуре вакансий, а также опишем непосредственно сам процесс машинного обучения, модель алгоритмов, и уникальные "хаки". В заключение, мы представим результаты оффлайн эксперимента и онлайн A/B-теста.
Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...Vlad Linnik
В данном докладе мы бы хотели поделиться тем, как именно с точки зрения Бизнеса мы
- Превращаем бизнес-проблему в осязаемый план Big Data проекта
- Как запускаем его реализацию
Также, на верхнем уровне рассказать, что происходит “под капотом” во время реализации.
И как мы оцениваем результаты всего проекта.
2. Гузенко Дмитрий
Инструктор IT Education Academy
Аналитик Luxoft
Специалист по проектированию, разработке и
внедрению IT проектов
24 года в ИТ
15 лет БA
КОНТАКТНЫЕ ДАННЫЕ
fb.com/dmitry.guzenko
d.guzenko@outlook.com
10. Specialized knowledge
Understanding theoretical concepts of statistics/probability, data mining, machine learning
Understanding how these theoretical concepts could be applied to real world problems
Ability to understand the nature of business problems and see the place of analytical models in the
solution
Knowledge and hands-on experience with one or more of the following: Matlab/Octave, R, Python
Familiarity with the concept of HPC, parallel computing
Knowledge and hands-on experience with one or more of the following for data analytics:
Spark/Theano/TensorFlow/Caffee
11. Skills and abilities
Strong English verbal and written communication
skills
Deep analytical skills
Self-organization, self-management
Ability to work independently with limited
supervision
Ability to handle multi-tasking activities
Ability to learn quickly
Following academic research and trends as a
habit
Initiative and pro-active skills and flexibility
Experience
•Track record in data analysis, data science,
artificial intelligence
Personal characteristics
•Passion for learning and education
•Business orientation
•Result orientation
Job Context
•Customer facing role
•Sole responsibility over the analytical project
•High level of responsibility
•Simultaneous handling and fast processing of
multiple tasks
•Lots of educational and self-educational
activities
•Culture of knowledge sharing
30. На какие вопросы отвечает Data Science?
Это A или B?
Является ли это странным?
Сколько?
Как это организовано?
Что делать дальше?
Classification
Anomaly Detection
Regression
Clustering
Recommendation
1
2
3
4
5
31. На какие вопросы отвечает Data Science?
Сколько? Regression
Пример 2-х мерного пространства
Характеристик много, реальное
пространство многомерное
32. На какие вопросы отвечает Data Science?
Сколько? Regression
•Какой доход принесет клиент?
•Какой возраст у клиента?
•Сколько стоит этот объект (недвижимости)?
33. На какие вопросы отвечает Data Science?
Сколько? Regression
•Какой объем продаж будет в следующем месяце?
•Сколько сотрудников уволится в следующем
месяце?
•Прогноз прибыли или убытков по
филиалам/направлениями/продуктам/менеджерам?
35. На какие вопросы отвечает Data Science?
Как это организовано? Clustering
36. Bank & Finances
Николай Щербина
Попасть в девяточку: как с
помощью сегментации увеличить
конверсию на 473%
Персонализация коммуникаций:
как достучаться до каждого
Поток: CRM & Лояльность
37.
38. На какие вопросы отвечает Data Science?
Это A или B? Classification
•Какой категории этот клиент?
•Сотрудник уволится в следующем месяце?
•Вернет ли этот клиент кредит банку: Да или Нет?
1
•Какой пол клиента?
39. На какие вопросы отвечает Data Science?
Является ли это странным? Anomaly Detection2
Нормально ли это сообщение внутри интернет трафика?
Могли ли вы рассчитаться кредитной картой одновременно
из двух разных мест?
Нормально ли то, что клиент летит в Египет но заказал
экскурсию в Турции?
42. На какие вопросы отвечает Data Science?
Что добавить еще? Recommendation
•Какой товар можно еще докупить
•Какой контент можно просмотреть еще?
•Каким клиентам еще можно предложить эту услугу?
•Рекомендация друзей, специалистов (FB, LinkedIn)?
47. Challenges
Фокус не на алгоритм а на результат
Эксперты не хотят терять монополию на
экспертизу
Размерность спринта иногда большая
Отсутствие данных