Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Дата расследования в России.

80 views

Published on

Расследования основанные на данных. Примеры расследований по госконтрактам, латинице в госзакупках, использованию пиратского ПО в госорганах и утечкам персональных данных из общедоступных информационных систем. Реальные истории о том как проводятся дата расследования.

Published in: Government & Nonprofit
  • DOWNLOAD THIS BOOKS INTO AVAILABLE FORMAT (2019 Update) ......................................................................................................................... ......................................................................................................................... Download Full PDF EBOOK here { https://soo.gd/irt2 } ......................................................................................................................... Download Full EPUB Ebook here { https://soo.gd/irt2 } ......................................................................................................................... Download Full doc Ebook here { https://soo.gd/irt2 } ......................................................................................................................... Download PDF EBOOK here { https://soo.gd/irt2 } ......................................................................................................................... Download EPUB Ebook here { https://soo.gd/irt2 } ......................................................................................................................... Download doc Ebook here { https://soo.gd/irt2 } ......................................................................................................................... ......................................................................................................................... ................................................................................................................................... eBook is an electronic version of a traditional print book THIS can be read by using a personal computer or by using an eBook reader. (An eBook reader can be a software application for use on a computer such as Microsoft's free Reader application, or a book-sized computer THIS is used solely as a reading device such as Nuvomedia's Rocket eBook.) Users can purchase an eBook on diskette or CD, but the most popular method of getting an eBook is to purchase a downloadable file of the eBook (or other reading material) from a Web site (such as Barnes and Noble) to be read from the user's computer or reading device. Generally, an eBook can be downloaded in five minutes or less ......................................................................................................................... .............. Browse by Genre Available eBooks .............................................................................................................................. Art, Biography, Business, Chick Lit, Children's, Christian, Classics, Comics, Contemporary, Cookbooks, Manga, Memoir, Music, Mystery, Non Fiction, Paranormal, Philosophy, Poetry, Psychology, Religion, Romance, Science, Science Fiction, Self Help, Suspense, Spirituality, Sports, Thriller, Travel, Young Adult, Crime, Ebooks, Fantasy, Fiction, Graphic Novels, Historical Fiction, History, Horror, Humor And Comedy, ......................................................................................................................... ......................................................................................................................... .....BEST SELLER FOR EBOOK RECOMMEND............................................................. ......................................................................................................................... Blowout: Corrupted Democracy, Rogue State Russia, and the Richest, Most Destructive Industry on Earth,-- The Ride of a Lifetime: Lessons Learned from 15 Years as CEO of the Walt Disney Company,-- Call Sign Chaos: Learning to Lead,-- StrengthsFinder 2.0,-- Stillness Is the Key,-- She Said: Breaking the Sexual Harassment Story THIS Helped Ignite a Movement,-- Atomic Habits: An Easy & Proven Way to Build Good Habits & Break Bad Ones,-- Everything Is Figureoutable,-- What It Takes: Lessons in the Pursuit of Excellence,-- Rich Dad Poor Dad: What the Rich Teach Their Kids About Money THIS the Poor and Middle Class Do Not!,-- The Total Money Makeover: Classic Edition: A Proven Plan for Financial Fitness,-- Shut Up and Listen!: Hard Business Truths THIS Will Help You Succeed, ......................................................................................................................... .........................................................................................................................
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • Be the first to like this

Дата расследования в России.

  1. 1. Дата расследования Иван Бегтин
  2. 2. Кто я и почему об этом рассказываю ГосзатратыАНО Информационная культура База госконтрактов и субсидий Проект по просвещению в госфинансах Создание проектов на открытых данных Взаимодействие с гражданами Исследования в области использования данных Хакатоны, конкурсы и лектории
  3. 3. Расследование 1. Латиница в госзакупках как пример “слепых закупок”
  4. 4. Искажения текстов для сокрытия закупок
  5. 5. Откуда всё это возникло Искажения текстов для сокрытия закупок 1. Единый портал zakupki.gov.ru дал удобные инструменты поиска заказов для поставщиков 2. На сайте отсутствовал контроль качества информации (форматно-логический контроль) 3. Госзаказчики использовали трюки с описанием предметов закупки, чтобы ограничивать возможности поставщиков найти информацию
  6. 6. Способы искажения информации Искажения текстов для сокрытия закупок - “латиница”: замена кириллических букв на похожие по написанию латинские; - опечатки и ошибки - отсутствие ключевых слов - замена букв на похожие цифры - использование тире в корне слова - разделение букв пробелами
  7. 7. “Латиница” Искажения текстов для сокрытия закупок «латиница»–замена кириллических букв на аналогичные по написанию латинские. Например, «окон» и «окoн» Латинская “o”, код U+006F Кириллическая “о”, код U+043E
  8. 8. Опечатки и грамматические ошибки Искажения текстов для сокрытия закупок Опечатки и грамматические ошибки – использование опечаток, а также грамматических ошибок, в том числе, в ключевых словах, определяющих предмет закупки. Например, «поставка мсяо (гавядина)» или «поставку автамобиля»;
  9. 9. Отсутствие ключевых слов Искажения текстов для сокрытия закупок Отсутствие ключевых слов – в наименовании закупки используются только общие слова, не позволяющие однозначно определить предмет закупки. Например,«Лот N15» или «закупка товаров»;
  10. 10. Замена букв на похожие по написанию цифры Искажения текстов для сокрытия закупок Замена букв на похожие по написанию цифры –в этом случае буквы «о» и «б» могут заменяться на цифры «0»(ноль) и«6»(шесть). Например, «поставка ме6ели»
  11. 11. Использование тире в корне слова Искажения текстов для сокрытия закупок Использование тире в корне слова – в этом случае знак тире размещается в корне слова, как при переносе текста по правилам русского языка. Например, «поставка мо-лочных про-дуктов»;
  12. 12. Разделение букв в составе слова пробелами или иными знаками Искажения текстов для сокрытия закупок Разделение букв в составе слова пробелами или иными знаками –в этом случае каждая буква или часть слова отделена от другой пробелом. Например, «работ п о и з г о т о в л е н и ю п р о д у к ц и и ( п о л и г р а ф и ч е с к а я )»
  13. 13. Как это было в 2012 году ИСКАЖЕНИЯ ТЕКСТОВ ДЛЯ СОКРЫТИЯ ЗАКУПОК
  14. 14. Каждое слово красным шрифтом с латиницей ИСКАЖЕНИЯ ТЕКСТОВ ДЛЯ СОКРЫТИЯ ЗАКУПОК
  15. 15. Как проводилось исследование Искажения текстов для сокрытия закупок - Разработана методика выявления закупок с искажениями названий - Собрана база всех искажений за 2012 год - Вручную проведена проверка на намеренность искажений в названиях - Разработана методика оценки ограничения доступа к участию в государственных закупках - Оценен ущерб от ограничений к участию в государственных закупках
  16. 16. В цифрах за 2012 год Искажения текстов для сокрытия закупок - несколько миллионов - извещений о закупках - около 13 тысяч закупок выявлено с искажениями - 662 закупки с признаками умышленного сокрытия информации - около 2500 закупок требующих внимания - около 9000 закупок с единичными нарушениями
  17. 17. А что сейчас?
  18. 18. Опечатки ИСКАЖЕНИЯ ТЕКСТОВ ДЛЯ СОКРЫТИЯ ЗАКУПОК Пример http://zakupki.gov.ru/223/purchase/public/purchase/info/common- info.html?regNumber=31300563078
  19. 19. Отсутствие смысловых слов ИСКАЖЕНИЯ ТЕКСТОВ ДЛЯ СОКРЫТИЯ ЗАКУПОК Пример http://zakupki.gov.ru/223/purchase/public/purchase/info/common- info.html?regNumber=31908212779
  20. 20. Технические аспекты
  21. 21. Открытый код https://code.ach.gov.ru/labs/blindprocurement Искажения текстов для сокрытия закупок
  22. 22. Поиски аномалий в наименованиях Искажения текстов для сокрытия закупок ● нет никаких смысловых слов ● есть слишком длинные слова, более 20 символов ● слова разных кодовых таблиц вперемешку: кириллица и латиница ● спецсимволы и разделители внутри слов (тире, пробелы и тд) ● опечатки, их частота и локализация
  23. 23. Частотный словарь Искажения текстов для сокрытия закупок Что Словарь из всех слов использованных когда-либо в наименовании закупок. На выходе словарь из 749544 слов Как Обработка наименований более 2 миллионов закупок Зачем Для последующего выявления аномалий
  24. 24. Словарь опечаток Искажения текстов для сокрытия закупок Что Словарь всех встречающихся опечаток в базе Как Автоматический расчёт расстояния Левенштейна для всех слов и отсев редко встречающихся слов как опечаток https://ru.wikipedia.org/wiki/Расстояние_Левенштейна Зачем Для идентификации опечаток
  25. 25. Список вспомогательных слов Искажения текстов для сокрытия закупок Что Словарь из 150 вспомогательных слов Пример: поставка, закупка, аукцион, ГБУЗ, лот и тд. Как Ручная выборка из 5000 наиболее часто употребляемых слов Зачем Для выявления закупок где нет ни одного смыслового слова
  26. 26. Незавершённое
  27. 27. Планировалось, но не завершено Искажения текстов для сокрытия закупок - Ежегодная проверка данных ЕИС на искажение - Выявление склееных слов - Идентификация отсутствия содержания в описании предмета закупки (текст предмета закупки идентичен классификационному коду) - сопоставление текста предмета закупки и классификационного кода: выявление несоответствий
  28. 28. Расследование 2 “Легальные” утечки персональных данных
  29. 29. Глубинная причина всех проблем РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Обработка персональных данных допускается в случае осуществления обработки персональных данных, подлежащих опубликованию или обязательному раскрытию в соответствии с федеральным законом. Пункт 11 части 1 статьи 6 Федерального закона от 27 июля 2006 г. N 152-ФЗ "О персональных данных”
  30. 30. Глубинная причина всех проблем РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ А так ли хороши наши законы?
  31. 31. Предыстория. Случайные находки перс. данных • Паспортные данные встречались в контрактах на портале zakupki.gov.ru • Паспортные данные попадались в реестре субсидий Единого портала бюджетной системы • Паспортные данные обнаруживались в отчётах НКО на сайте Минюста • Паспортные данные выявлялись в соглашениях о крупных сделках на сайтах электронных торговых площадок • СНИЛС и другие идентификаторы “засветились” в реестре сертификатов Арбитражного суда РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  32. 32. 2016 год. Реестр отчётов НКО в Минюсте • Случайно обнаружили утечку большого объёма, более 30 тысяч записей в реестре отчётов Минюст, включая персональные данные особо защищаемых лиц • Передали Минюсту материалы • Минюст удалил все отчёты до 2016 года и, частично, исправил проблему • … но не удалил публикацию отчётов в Excel формате где утечка осталась • Среди тех о чьи паспортные данные публиковались: министры, главы госкорпораций и другие публичные лица РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  33. 33. 2016 год. Реестр отчётов НКО в Минюсте РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  34. 34. 3 стратегии Извлекать из сканов документов • Найти реестры документов • Скачать все документы • Распознать сканы • Использовать алгоритмы выявления шаблонов перс. данных Находить в поисковых системах • Создать список шаблонов перс. данных • Проверить по поисковым системам находимость шаблонов Извлекать из специальных форматов файлов • Определить специальные файлы • Провести анализ систем в которых они содержаться РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  35. 35. Поиск персональных данных через поиск РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  36. 36. Поиск персональных данных через поиск РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ 1. Локализация запросов до сайта и поддоменов командой “site:” 2. Перебор поиска по запросам: “паспорт серия”, “паспортные данные”, “паспорт номер” 3. Уточнения в виде первых цифр серии для снижения ложных срабатываний. Например: “паспорт серии 4502” 4. После обнаружения – тотальная проверка всех страниц и документов
  37. 37. Удостоверяющие центры РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ 1. Открытые реестры сертификатов 2. Публикация метаданных сертификатов в открытом доступе 3. Публикация сертификатов в открытом доступе (специальные форматы файлов) 4. Раскрывают: СНИЛС, ФИО, место работы, должность, email
  38. 38. Удостоверяющие центры РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Действующих удостоверяющих центров 444 Из них проверено 200 Найдено с раскрытием персональных данных 17
  39. 39. Удостоверяющие центры РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  40. 40. Удостоверяющие центры. Причины проблем РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Отсутствие надзора регулятора: ○ Мониторинга правоприменения нет ○ План проверок УЦ отсутствует (http://e-trust.gosuslugi.ru/CAChecks) ○ Проверки не проводились Ошибки (халатность?) операторов УЦ o Неверная трактовка раздела IV Приказа Министерства связи и массовых коммуникаций РФ от 22 августа 2017 г. N 436"Об утверждении Порядка формирования и ведения реестров выданных аккредитованными удостоверяющими центрами квалифицированных сертификатов ключей проверки электронной подписи, а также предоставления информации из таких реестров”
  41. 41. Приказ Минкомсвязи N436 от 22 августа 2017 г. РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ • уникальный номер сертификата; • даты начала и окончания действия сертификата; • ФИО • СНИЛС • документы полномочий физ лица • ограничения использования квалифицированного сертификата Раздел II Структура реестра квалифицированных сертификатов • Безвозмездно • Любому лицу по запросу в течении 24 часов • Запрет на раскрытие всего реестра отсутствует • Если нет ФЗ или другого НПА ограничивающих доступ Раздел IV Предоставление сведений из реестра квалифицированных сертификатов
  42. 42. Удостоверяющие центры. Итоги РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ 1. Государство (Минкомсвязь России) обязало владельцев информационных систем раскрывать персональные данные о квалифицированных сертификатах. 2. Регламент раскрытия не запрещал раскрытие всего реестра сертификатов в открытом доступе. 3. Значительная часть операторов раскрывала реестры сертификатов в открытом доступе для снижения издержек и удобства эксплуатации систем
  43. 43. Государственные информационные системы ● Реестр субсидий федерального бюджета ● Реестр отчётов некоммерческих организаций (Минюст России) ● Обращения граждан на портале Онлайн Инспектор ● База правовых решений на портале ФАС России ● Портал торгов по госимуществу ● Портал управления многоквартирными домами г. Москвы ● Портал поставщиков г. Москвы ● Портал государственного и муниципального заказа РФ (zakupki.gov.ru) РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  44. 44. Реестр субсидий. Особенности РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - общедоступен по адресу rs.budget.gov.ru - большая часть документов в виде сканов - не индексируется поисковыми системами - много договоров: высокая вероятность наличия персональных данных - есть API и открытые данные (ускоряет обработку реестра)
  45. 45. Реестр субсидий. Как проверялось РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ 1. Все документы реестра были выгружены 2. Каждый документ автоматически распознан (OCR Tesseract) 3. Скрипт на Python по поиску по ключевым словам: паспортные данные, паспорт серия, СНИЛС и др 4. Обязательная ручная перепроверка всех автоматически найденных документов.
  46. 46. Реестр субсидий РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Всего документов Более 400 тысяч Из них проверено документов 99 тысяч Найдено с раскрытием персональных данных 1,6 тысяч
  47. 47. Реестр субсидий. Где утечки перс. данных РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - сканы доверенностей сотрудников, заключающих соглашения о субсидиях; - договора с физическими лицами, приложенные к договорам о субсидиях юридическим лицам; - договора с авиакомпаниями о компенсации им льготной перевозки ветеранов ВоВ и инвалидов с сопровождающими лицами (содержат паспортные данные всех перевезенных за период); - договора о компенсации затрат на размещение беженцев Украины заключённые ФМС России с органами власти субъектов федерации: содержат паспортные данные каждого беженца; - денежные компенсации физическим лицам разных групп граждан;
  48. 48. Реестр субсидий. Итоги РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ 11721 подтверждённое минимальное число записей публикуемых паспортных данных по результатам оценки около 25% документов реестра
  49. 49. ОнлайнИнспекция.РФ. Особенности РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - состоит из жалоб граждан - жалобы публикуются онлайн - жалобы слабо модерировались и часто содержат паспортные данные заявителя
  50. 50. ОнлайнИнспекция.РФ. В поисковых системах РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  51. 51. ОнлайнИнспекция.РФ. На страницах сайта РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  52. 52. ОнлайнИнспекция.РФ. Как проверялось РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ 1. Скрипт на Python для выгрузки всех страниц 2. Все страницы жалоб были выгружены 3. Скрипт на Python по поиску по ключевым словам: паспортные данные, паспорт серия, СНИЛС и др 4. Обязательная ручная перепроверка всех автоматически найденных документов.
  53. 53. ОнлайнИнспекция.РФ. РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Всего документов 631 тысяча Из них проверено документов 230 тысяч Найдено с раскрытием персональных данных 1 тысяча
  54. 54. ОнлайнИнспекция.РФ. Итоги РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ около 1000 подтверждённое минимальное число записей публикуемых паспортных данных по результатам оценки около 33% документов жалоб
  55. 55. Портал zakupki.gov.ru. Особенности РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - подтверждённые разовые факты публикации перс. данных в сканах договоров с физ. лицами - огромный объём документов, сотни терабайт - обязательное использование цифровых подписей
  56. 56. Портал zakupki.gov.ru. Цифровые подписи РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  57. 57. Портал zakupki.gov.ru. Цифровые подписи РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  58. 58. Портал zakupki.gov.ru. Цифровые подписи РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - используются всеми заказчиками, представителями ФАС и Федерального казначейства - присутствуют приложением к каждому документу - выглядят как нечитаемый, типа зашифрованный, набор букв - декодируются с помощью утилиты certutil идущей в стандартной поставке всех ОС Windows - содержат все метаданные сертификата подписанта
  59. 59. Портал zakupki.gov.ru. Утечки через цифровые подписи РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Всего зарегистрировано заказчиков Более 300 тысяч Из них проверено Более 300 тысяч Найдено с раскрытием персональных данных Более 300 тысяч
  60. 60. Портал zakupki.gov.ru. Итоги РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ не менее 300 тысяч подтверждённое минимальное число записей публикуемых данных из цифровых подписей
  61. 61. Электронные торговые площадки по 44-ФЗ РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - Сбербанк АСТ - ZakazRF - РТС Тендер - Росэльторг - Национальная электронная торговая площадк - ЭТП РАД
  62. 62. Электронные торговые площадки. Особенности РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Требования 44-ФЗ и подзаконных актов устанавливают обязанность площадки: ▪ вести реестр аккредитованных участников; ▪ публиковать решения об одобрении крупных сделок для всех участников поставщиков; ▪ обязывать поставщиков использовать квалифицированную цифровую подпись при публикации документов; ▪ обязывать заказчиков подписывать итоговые протоколы процедур квалифицированной электронной подписью.
  63. 63. Сбербанк АСТ. Цифровая подпись РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  64. 64. ZakazRF. Цифровая подпись РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  65. 65. ЭТП . Цифровые подписи РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - Используется на ВСЕХ площадках - используются всеми поставщиками - присутствуют приложением к документам поставщиков - выглядят как нечитаемый, типа зашифрованный, набор букв в файле с расширением .sig - декодируются с помощью утилиты certutil идущей в стандартной поставке всех ОС Windows - содержат все метаданные сертификата подписанта
  66. 66. Сбербанк АСТ. Одобрение крупных сделок РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  67. 67. Росэльторг. Одобрение крупных сделок РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  68. 68. ЭТП . Одобрение крупных сделок РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - Используется на ВСЕХ площадках - используются всеми поставщиками - присутствуют приложением к документам поставщиков - выглядят как нечитаемый, типа зашифрованный, набор букв в файле с расширением .sig - декодируются с помощью утилиты certutil идущей в стандартной поставке всех ОС Windows - содержат все метаданные сертификата подписанта
  69. 69. Электронные торговые площадки. Итоги РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ 2,25 миллиона подтверждённое минимальное число записей публикуемых данных из цифровых подписей и паспортных данных одобрения крупных сделок
  70. 70. Общие итоги РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Подробное расследование в августе 2018 года. Передача результатов расследования в Роскомнадзор (через Генпрокуратуру) Отсутствие адекватной реакции от Роскомнадзора (непризнание данных утечек значимыми) Ожидание 8 месяцев Передача результатов исследования РБК в качестве эксклюзивного материала в апреле 2019 года Оперативная реакция Роскомнадзора после публикаций в СМИ Большая часть каналов утечек закрыты после публикации … но системная работа даже не началась
  71. 71. Расследование 3 Пиратский MS Office в органах власти
  72. 72. Тезисы ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ - огромное число людей по всему миру пользуется пиратским ПО в том числе MS Office - среди этих пользователей есть сотрудники органов власти - и использование пиратского ПО не проходит незамеченным
  73. 73. http://minsport.gov.ru/fextovanie14.doc
  74. 74. Команды публикующие пиратский MS Office ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ Krokoz, WareZ Provider, RePack by SPecialiST, NhT, MoBIL GROUP, Grizli777, Reanimator Extreme Edition, WolfishLair, SE7EN TEAMS
  75. 75. Следы ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ - при установке по умолчанию MS Office прописывал в свойства документа в атрибут “Company” название пиратской группы - это можно исправить в настройках, но многих забывают это сделать - чтобы найти несколько таких документов с такими свойствами надо переработать десятки и сотни тысяч документов.
  76. 76. Исследование 2018 года ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ - 22 318 документов 25 органов федеральных органов исполнительной власти - у 5 органов власти более 20% всех опубликованных документов имели метки пиратского MS Office
  77. 77. Исследование 2018 года ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ 1. Были использованы архивы сайтов органов власти из национального цифрового архива, все они также доступны через Хаб открытых данных 2. Из архивов сайтов были извлечены все документы в формате .DOC (формат MS Word), их вышло чуть менее 23 тысяч документов. 3. Из каждого документа с помощью библиотеки hachoir были извлечены его метаданные: название, дата создания, дата последнего изменения, автор, компания. 4. Для 5 органов власти в архиве нашлось менее 100 документов поэтому они были выбраны из итоговой выборки из-за возможной неточности оценки 5. Для всех остальных документов на основе их метаданных в поле "comments.Company" было идентифицировано сделан ли документ в пиратском ПО MS Office или же нет. 6. Алгоритм распознавания использовал следующие значения в этом поле для идентификации ПО: RePack by SPecialiST, MoBIL GROUP, WareZ Provider, Dnsoft, SPecialiST RePack, NhT, Grizli777, DG Win&Soft, Reanimator Extreme Edition, DreamLair, DrAGoN CorP, Krokoz™, MultiDVD Team, SamForum.ws, diakov.net 7. В результате из 22318 документов у 1483 документов (6.64%) найдены пометки того что они сделаны с помощью пиратского ПО.
  78. 78. https://udprf.ru/sites/default/files/IC_Skachki-internet.doc
  79. 79. Ограничения ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ 1. Не анализировались документы в формате Open Office XML (.docx, .xlsx, .pptx и др.) 2. Не все сайты органов власти можно автоматически анализировать из-за объёмов и иных ограничений. 3. Очень сложно доказать умысел. Можно всего сослаться что документ готовился на личном компьютере.
  80. 80. Вопросы? Иван Бегтин, ibegtin@infoculture.ru Председатель Ассоциации участников рынка данных Директор АНО “Информационная культура”

×