Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
from heuristics to dozens
production models in proptech
Vova Kubytskyi
LUN
1
2
3
4
в числах
5
10 000
сайтов индексируем
6
6 000 000
объявлений в сутки
7
100 000 000
посещений в год
8
1 200 000 000
9
изображений храним
175 000
ГБ классифицируем в год
20 190 000 000
рекламок откручено
10
11
12
13
14
15
группировка
изображений
16
17
18
19
20
Hamming distance to subsample size
12 14 16 18
22,648
21
3,934
632167
ORB – Oriented FAST(kp) &
Rotated BRIEF (des)
pHash
HEngine C++
22
результат – 0.97
F1 score
23
24
классификация
изображений
25
26
27
28
29
30
caffe (2014)
31
“LeNet” from Berkeley
5000 images
34 класса
изображений
32
результат – 0.96
F1 score
33
56%
67%
78%
89%
100%
вклад подсистем в группировщик объявлений
34
группировка
объявлений
35
36
37
результат – 0.99
F1 score
38
39
40
41
42
43
44
45
46
47
48
49
50
значимый
эффект
51
количество жалоб на посредников
52
53
54
55
внедрение
и поддержка
56
• гипотеза
• сверхбыстрая проверка нужности
• сбор выборки
• построение алгоритма
• создание модуля
• обработка данных
• в...
привет
58
59
60
61
62
63
64
наружная
реклама
65
66
67
68
а что, если
бы мы могли
69
70
OpenCV
TensorFlow (fine-tuned
faster_rcnn_inception_v2)
+ custom tracker
+ custom post-processor71
flatfy & lun artificial intelligence
researchers
72
a special or instinctive aptitude or ability
for doing something well
73
74
Cпасибо
75
за внимание
fb.com/kubytskyi
Upcoming SlideShare
Loading in …5
×

.NET Fest 2018. Владимир Кубицкий. Создание и использование алгоритмов машинного обучения в проектах ЛУН

30 views

Published on

Есть ли место машинному обучению в продукте по недвижимости? Я расскажу о том, как, начиная с нескольних простых эвристических модулей, которые определяли, является ли контактное лицо брокером или владецьцем недвижимости, мы перешли к использованию десятков ML моделей, в результате чего смогли существенно уменьшить количество жалоб от наших клиентов.

Published in: Education
  • Be the first to comment

  • Be the first to like this

.NET Fest 2018. Владимир Кубицкий. Создание и использование алгоритмов машинного обучения в проектах ЛУН

  1. 1. from heuristics to dozens production models in proptech Vova Kubytskyi LUN 1
  2. 2. 2
  3. 3. 3
  4. 4. 4
  5. 5. в числах 5
  6. 6. 10 000 сайтов индексируем 6
  7. 7. 6 000 000 объявлений в сутки 7
  8. 8. 100 000 000 посещений в год 8
  9. 9. 1 200 000 000 9 изображений храним 175 000 ГБ классифицируем в год
  10. 10. 20 190 000 000 рекламок откручено 10
  11. 11. 11
  12. 12. 12
  13. 13. 13
  14. 14. 14
  15. 15. 15
  16. 16. группировка изображений 16
  17. 17. 17
  18. 18. 18
  19. 19. 19
  20. 20. 20
  21. 21. Hamming distance to subsample size 12 14 16 18 22,648 21 3,934 632167
  22. 22. ORB – Oriented FAST(kp) & Rotated BRIEF (des) pHash HEngine C++ 22
  23. 23. результат – 0.97 F1 score 23
  24. 24. 24
  25. 25. классификация изображений 25
  26. 26. 26
  27. 27. 27
  28. 28. 28
  29. 29. 29
  30. 30. 30
  31. 31. caffe (2014) 31 “LeNet” from Berkeley 5000 images
  32. 32. 34 класса изображений 32
  33. 33. результат – 0.96 F1 score 33
  34. 34. 56% 67% 78% 89% 100% вклад подсистем в группировщик объявлений 34
  35. 35. группировка объявлений 35
  36. 36. 36
  37. 37. 37
  38. 38. результат – 0.99 F1 score 38
  39. 39. 39
  40. 40. 40
  41. 41. 41
  42. 42. 42
  43. 43. 43
  44. 44. 44
  45. 45. 45
  46. 46. 46
  47. 47. 47
  48. 48. 48
  49. 49. 49
  50. 50. 50
  51. 51. значимый эффект 51
  52. 52. количество жалоб на посредников 52
  53. 53. 53
  54. 54. 54
  55. 55. 55
  56. 56. внедрение и поддержка 56
  57. 57. • гипотеза • сверхбыстрая проверка нужности • сбор выборки • построение алгоритма • создание модуля • обработка данных • вывод ветки в А/В тест • продакшн / улучшение / утилизация 57
  58. 58. привет 58
  59. 59. 59
  60. 60. 60
  61. 61. 61
  62. 62. 62
  63. 63. 63
  64. 64. 64
  65. 65. наружная реклама 65
  66. 66. 66
  67. 67. 67
  68. 68. 68
  69. 69. а что, если бы мы могли 69
  70. 70. 70
  71. 71. OpenCV TensorFlow (fine-tuned faster_rcnn_inception_v2) + custom tracker + custom post-processor71
  72. 72. flatfy & lun artificial intelligence researchers 72
  73. 73. a special or instinctive aptitude or ability for doing something well 73
  74. 74. 74
  75. 75. Cпасибо 75 за внимание fb.com/kubytskyi

×