SlideShare a Scribd company logo
1 of 82
Download to read offline
Дата
расследования
Иван Бегтин
Кто я и почему об этом рассказываю
ГосзатратыАНО Информационная
культура
База госконтрактов и субсидий
Проект по просвещению в
госфинансах
Создание проектов на открытых
данных
Взаимодействие с гражданами
Исследования в области
использования данных
Хакатоны, конкурсы и лектории
Расследование 1.
Латиница в госзакупках как пример
“слепых закупок”
Искажения текстов для сокрытия
закупок
Откуда всё это возникло
Искажения текстов для сокрытия
закупок
1. Единый портал zakupki.gov.ru дал удобные
инструменты поиска заказов для поставщиков
2. На сайте отсутствовал контроль качества
информации (форматно-логический контроль)
3. Госзаказчики использовали трюки с описанием
предметов закупки, чтобы ограничивать
возможности поставщиков найти информацию
Способы искажения информации
Искажения текстов для сокрытия
закупок
- “латиница”: замена кириллических букв на
похожие по написанию латинские;
- опечатки и ошибки
- отсутствие ключевых слов
- замена букв на похожие цифры
- использование тире в корне слова
- разделение букв пробелами
“Латиница”
Искажения текстов для сокрытия
закупок
«латиница»–замена кириллических букв на
аналогичные по написанию латинские.
Например, «окон» и «окoн»
Латинская “o”, код U+006F
Кириллическая “о”, код U+043E
Опечатки и грамматические ошибки
Искажения текстов для сокрытия
закупок
Опечатки и грамматические ошибки – использование
опечаток, а также грамматических ошибок, в том
числе, в ключевых словах, определяющих предмет
закупки.
Например, «поставка мсяо (гавядина)» или
«поставку автамобиля»;
Отсутствие ключевых слов
Искажения текстов для сокрытия
закупок
Отсутствие ключевых слов – в наименовании закупки
используются только общие слова, не позволяющие
однозначно определить предмет закупки.
Например,«Лот N15» или «закупка товаров»;
Замена букв на похожие по написанию цифры
Искажения текстов для сокрытия
закупок
Замена букв на похожие по написанию цифры –в
этом случае буквы «о» и «б» могут заменяться на
цифры «0»(ноль) и«6»(шесть).
Например, «поставка ме6ели»
Использование тире в корне слова
Искажения текстов для сокрытия
закупок
Использование тире в корне слова – в этом случае
знак тире размещается в корне слова, как при
переносе текста по правилам русского языка.
Например, «поставка мо-лочных про-дуктов»;
Разделение букв в составе слова пробелами или
иными знаками
Искажения текстов для сокрытия
закупок
Разделение букв в составе слова пробелами или
иными знаками –в этом случае каждая буква или
часть слова отделена от другой пробелом.
Например, «работ п о и з г о т о в л е н и ю п р о д
у к ц и и ( п о л и г р а ф и ч е с к а я )»
Как это было в 2012 году
ИСКАЖЕНИЯ ТЕКСТОВ ДЛЯ
СОКРЫТИЯ ЗАКУПОК
Каждое слово красным шрифтом с латиницей
ИСКАЖЕНИЯ ТЕКСТОВ ДЛЯ
СОКРЫТИЯ ЗАКУПОК
Как проводилось исследование
Искажения текстов для сокрытия
закупок
- Разработана методика выявления закупок с искажениями названий
- Собрана база всех искажений за 2012 год
- Вручную проведена проверка на намеренность искажений в
названиях
- Разработана методика оценки ограничения доступа к участию в
государственных закупках
- Оценен ущерб от ограничений к участию в государственных закупках
В цифрах за 2012 год
Искажения текстов для сокрытия
закупок
- несколько миллионов - извещений о закупках
- около 13 тысяч закупок выявлено с искажениями
- 662 закупки с признаками умышленного сокрытия
информации
- около 2500 закупок требующих внимания
- около 9000 закупок с единичными нарушениями
А что сейчас?
Опечатки
ИСКАЖЕНИЯ ТЕКСТОВ ДЛЯ
СОКРЫТИЯ ЗАКУПОК
Пример
http://zakupki.gov.ru/223/purchase/public/purchase/info/common-
info.html?regNumber=31300563078
Отсутствие смысловых слов
ИСКАЖЕНИЯ ТЕКСТОВ ДЛЯ
СОКРЫТИЯ ЗАКУПОК
Пример
http://zakupki.gov.ru/223/purchase/public/purchase/info/common-
info.html?regNumber=31908212779
Технические аспекты
Открытый код
https://code.ach.gov.ru/labs/blindprocurement
Искажения текстов для сокрытия
закупок
Поиски аномалий в наименованиях
Искажения текстов для сокрытия
закупок
● нет никаких смысловых слов
● есть слишком длинные слова, более 20 символов
● слова разных кодовых таблиц вперемешку: кириллица и
латиница
● спецсимволы и разделители внутри слов (тире, пробелы и тд)
● опечатки, их частота и локализация
Частотный словарь
Искажения текстов для сокрытия
закупок
Что
Словарь из всех слов использованных когда-либо в наименовании
закупок. На выходе словарь из 749544 слов
Как
Обработка наименований более 2 миллионов закупок
Зачем
Для последующего выявления аномалий
Словарь опечаток
Искажения текстов для сокрытия
закупок
Что
Словарь всех встречающихся опечаток в базе
Как
Автоматический расчёт расстояния Левенштейна для всех слов и отсев
редко встречающихся слов как опечаток
https://ru.wikipedia.org/wiki/Расстояние_Левенштейна
Зачем
Для идентификации опечаток
Список вспомогательных слов
Искажения текстов для сокрытия
закупок
Что
Словарь из 150 вспомогательных слов
Пример: поставка, закупка, аукцион, ГБУЗ, лот и тд.
Как
Ручная выборка из 5000 наиболее часто употребляемых слов
Зачем
Для выявления закупок где нет ни одного смыслового слова
Незавершённое
Планировалось, но не завершено
Искажения текстов для сокрытия
закупок
- Ежегодная проверка данных ЕИС на искажение
- Выявление склееных слов
- Идентификация отсутствия содержания в описании
предмета закупки (текст предмета закупки
идентичен классификационному коду)
- сопоставление текста предмета закупки и
классификационного кода: выявление
несоответствий
Расследование 2
“Легальные” утечки персональных
данных
Глубинная причина всех проблем
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
Обработка персональных данных допускается в
случае осуществления обработки персональных
данных, подлежащих опубликованию или
обязательному раскрытию в соответствии с
федеральным законом.
Пункт 11 части 1 статьи 6 Федерального закона от 27 июля 2006 г. N 152-ФЗ
"О персональных данных”
Глубинная причина всех проблем
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
А так ли хороши наши
законы?
Предыстория. Случайные находки перс. данных
• Паспортные данные встречались в контрактах на портале
zakupki.gov.ru
• Паспортные данные попадались в реестре субсидий Единого портала
бюджетной системы
• Паспортные данные обнаруживались в отчётах НКО на сайте
Минюста
• Паспортные данные выявлялись в соглашениях о крупных сделках на
сайтах электронных торговых площадок
• СНИЛС и другие идентификаторы “засветились” в реестре
сертификатов Арбитражного суда
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
2016 год. Реестр отчётов НКО в Минюсте
• Случайно обнаружили утечку большого объёма, более 30 тысяч
записей в реестре отчётов Минюст, включая персональные данные
особо защищаемых лиц
• Передали Минюсту материалы
• Минюст удалил все отчёты до 2016 года и, частично, исправил
проблему
• … но не удалил публикацию отчётов в Excel формате где утечка
осталась
• Среди тех о чьи паспортные данные публиковались: министры, главы
госкорпораций и другие публичные лица
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
2016 год. Реестр отчётов НКО в Минюсте
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
3 стратегии
Извлекать из сканов
документов
• Найти реестры
документов
• Скачать все
документы
• Распознать сканы
• Использовать
алгоритмы
выявления
шаблонов перс.
данных
Находить в поисковых
системах
• Создать список
шаблонов перс.
данных
• Проверить по
поисковым системам
находимость
шаблонов
Извлекать из
специальных
форматов файлов
• Определить
специальные файлы
• Провести анализ
систем в которых
они содержаться
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
Поиск персональных данных через поиск
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
Поиск персональных данных через поиск
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
1. Локализация запросов до сайта и поддоменов командой “site:”
2. Перебор поиска по запросам: “паспорт серия”, “паспортные данные”,
“паспорт номер”
3. Уточнения в виде первых цифр серии для снижения ложных
срабатываний. Например: “паспорт серии 4502”
4. После обнаружения – тотальная проверка всех страниц и документов
Удостоверяющие центры
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
1. Открытые реестры сертификатов
2. Публикация метаданных сертификатов в открытом
доступе
3. Публикация сертификатов в открытом доступе
(специальные форматы файлов)
4. Раскрывают: СНИЛС, ФИО, место работы, должность,
email
Удостоверяющие центры
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
Действующих
удостоверяющих
центров 444
Из них
проверено 200
Найдено с
раскрытием
персональных
данных
17
Удостоверяющие центры
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
Удостоверяющие центры. Причины проблем
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
Отсутствие надзора регулятора:
○ Мониторинга правоприменения нет
○ План проверок УЦ отсутствует (http://e-trust.gosuslugi.ru/CAChecks)
○ Проверки не проводились
Ошибки (халатность?) операторов УЦ
o Неверная трактовка раздела IV Приказа Министерства связи и массовых коммуникаций РФ от
22 августа 2017 г. N 436"Об утверждении Порядка формирования и ведения реестров выданных
аккредитованными удостоверяющими центрами квалифицированных сертификатов ключей
проверки электронной подписи, а также предоставления информации из таких реестров”
Приказ Минкомсвязи N436 от 22 августа 2017 г.
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
• уникальный номер сертификата;
• даты начала и окончания действия сертификата;
• ФИО
• СНИЛС
• документы полномочий физ лица
• ограничения использования квалифицированного сертификата
Раздел II Структура
реестра
квалифицированных
сертификатов
• Безвозмездно
• Любому лицу по запросу в течении 24 часов
• Запрет на раскрытие всего реестра отсутствует
• Если нет ФЗ или другого НПА ограничивающих доступ
Раздел IV
Предоставление
сведений из реестра
квалифицированных
сертификатов
Удостоверяющие центры. Итоги
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
1. Государство (Минкомсвязь России) обязало владельцев информационных
систем раскрывать персональные данные о квалифицированных
сертификатах.
2. Регламент раскрытия не запрещал раскрытие всего реестра сертификатов
в открытом доступе.
3. Значительная часть операторов раскрывала реестры сертификатов в
открытом доступе для снижения издержек и удобства эксплуатации
систем
Государственные информационные системы
● Реестр субсидий федерального бюджета
● Реестр отчётов некоммерческих организаций (Минюст России)
● Обращения граждан на портале Онлайн Инспектор
● База правовых решений на портале ФАС России
● Портал торгов по госимуществу
● Портал управления многоквартирными домами г. Москвы
● Портал поставщиков г. Москвы
● Портал государственного и муниципального заказа РФ
(zakupki.gov.ru)
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
Реестр субсидий. Особенности
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
- общедоступен по адресу rs.budget.gov.ru
- большая часть документов в виде сканов
- не индексируется поисковыми системами
- много договоров: высокая вероятность наличия
персональных данных
- есть API и открытые данные (ускоряет обработку
реестра)
Реестр субсидий. Как проверялось
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
1. Все документы реестра были выгружены
2. Каждый документ автоматически распознан (OCR
Tesseract)
3. Скрипт на Python по поиску по ключевым словам:
паспортные данные, паспорт серия, СНИЛС и др
4. Обязательная ручная перепроверка всех
автоматически найденных документов.
Реестр субсидий
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
Всего
документов
Более
400 тысяч
Из них
проверено
документов
99 тысяч
Найдено с
раскрытием
персональных
данных
1,6 тысяч
Реестр субсидий. Где утечки перс. данных
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
- сканы доверенностей сотрудников, заключающих соглашения о
субсидиях;
- договора с физическими лицами, приложенные к договорам о субсидиях
юридическим лицам;
- договора с авиакомпаниями о компенсации им льготной перевозки
ветеранов ВоВ и инвалидов с сопровождающими лицами (содержат
паспортные данные всех перевезенных за период);
- договора о компенсации затрат на размещение беженцев Украины
заключённые ФМС России с органами власти субъектов федерации:
содержат паспортные данные каждого беженца;
- денежные компенсации физическим лицам разных групп граждан;
Реестр субсидий. Итоги
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
11721
подтверждённое минимальное число записей
публикуемых паспортных данных по результатам оценки
около 25% документов реестра
ОнлайнИнспекция.РФ. Особенности
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
- состоит из жалоб граждан
- жалобы публикуются онлайн
- жалобы слабо модерировались и часто содержат
паспортные данные заявителя
ОнлайнИнспекция.РФ. В поисковых системах
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
ОнлайнИнспекция.РФ. На страницах сайта
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
ОнлайнИнспекция.РФ. Как проверялось
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
1. Скрипт на Python для выгрузки всех страниц
2. Все страницы жалоб были выгружены
3. Скрипт на Python по поиску по ключевым словам:
паспортные данные, паспорт серия, СНИЛС и др
4. Обязательная ручная перепроверка всех
автоматически найденных документов.
ОнлайнИнспекция.РФ.
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
Всего
документов
631
тысяча
Из них
проверено
документов
230
тысяч
Найдено с
раскрытием
персональных
данных
1
тысяча
ОнлайнИнспекция.РФ. Итоги
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
около 1000
подтверждённое минимальное число записей
публикуемых паспортных данных по результатам оценки
около 33% документов жалоб
Портал zakupki.gov.ru. Особенности
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
- подтверждённые разовые факты публикации перс.
данных в сканах договоров с физ. лицами
- огромный объём документов, сотни терабайт
- обязательное использование цифровых подписей
Портал zakupki.gov.ru. Цифровые подписи
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
Портал zakupki.gov.ru. Цифровые подписи
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
Портал zakupki.gov.ru. Цифровые подписи
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
- используются всеми заказчиками, представителями
ФАС и Федерального казначейства
- присутствуют приложением к каждому документу
- выглядят как нечитаемый, типа зашифрованный, набор
букв
- декодируются с помощью утилиты certutil идущей в
стандартной поставке всех ОС Windows
- содержат все метаданные сертификата подписанта
Портал zakupki.gov.ru. Утечки через цифровые
подписи
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
Всего
зарегистрировано
заказчиков
Более
300 тысяч
Из них проверено
Более
300 тысяч
Найдено с
раскрытием
персональных
данных
Более
300 тысяч
Портал zakupki.gov.ru. Итоги
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
не менее 300 тысяч
подтверждённое минимальное число записей
публикуемых данных из цифровых подписей
Электронные торговые площадки по 44-ФЗ
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
- Сбербанк АСТ
- ZakazRF
- РТС Тендер
- Росэльторг
- Национальная электронная торговая площадк
- ЭТП РАД
Электронные торговые площадки. Особенности
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
Требования 44-ФЗ и подзаконных актов устанавливают
обязанность площадки:
▪ вести реестр аккредитованных участников;
▪ публиковать решения об одобрении крупных сделок для всех
участников поставщиков;
▪ обязывать поставщиков использовать квалифицированную
цифровую подпись при публикации документов;
▪ обязывать заказчиков подписывать итоговые протоколы
процедур квалифицированной электронной подписью.
Сбербанк АСТ. Цифровая подпись
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
ZakazRF. Цифровая подпись
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
ЭТП . Цифровые подписи
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
- Используется на ВСЕХ площадках
- используются всеми поставщиками
- присутствуют приложением к документам поставщиков
- выглядят как нечитаемый, типа зашифрованный, набор
букв в файле с расширением .sig
- декодируются с помощью утилиты certutil идущей в
стандартной поставке всех ОС Windows
- содержат все метаданные сертификата подписанта
Сбербанк АСТ. Одобрение крупных сделок
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
Росэльторг. Одобрение крупных сделок
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
ЭТП . Одобрение крупных сделок
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
- Используется на ВСЕХ площадках
- используются всеми поставщиками
- присутствуют приложением к документам поставщиков
- выглядят как нечитаемый, типа зашифрованный, набор
букв в файле с расширением .sig
- декодируются с помощью утилиты certutil идущей в
стандартной поставке всех ОС Windows
- содержат все метаданные сертификата подписанта
Электронные торговые площадки. Итоги
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
2,25 миллиона
подтверждённое минимальное число записей
публикуемых данных из цифровых подписей и
паспортных данных одобрения крупных сделок
Общие итоги
РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ
РОССИЯН В 2018-2019 ГОДАХ
Подробное расследование в августе 2018 года.
Передача результатов расследования в Роскомнадзор (через Генпрокуратуру)
Отсутствие адекватной реакции от Роскомнадзора (непризнание данных утечек значимыми)
Ожидание 8 месяцев
Передача результатов исследования РБК в качестве эксклюзивного материала в апреле 2019 года
Оперативная реакция Роскомнадзора после публикаций в СМИ
Большая часть каналов утечек закрыты после публикации
… но системная работа даже не началась
Расследование 3
Пиратский MS Office в органах
власти
Тезисы
ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ
- огромное число людей по всему миру пользуется
пиратским ПО в том числе MS Office
- среди этих пользователей есть сотрудники органов
власти
- и использование пиратского ПО не проходит
незамеченным
http://minsport.gov.ru/fextovanie14.doc
Команды публикующие пиратский MS Office
ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ
Krokoz, WareZ Provider, RePack by
SPecialiST, NhT, MoBIL GROUP,
Grizli777, Reanimator Extreme
Edition, WolfishLair, SE7EN TEAMS
Следы
ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ
- при установке по умолчанию MS Office прописывал в
свойства документа в атрибут “Company” название
пиратской группы
- это можно исправить в настройках, но многих забывают
это сделать
- чтобы найти несколько таких документов с такими
свойствами надо переработать десятки и сотни тысяч
документов.
Исследование 2018 года
ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ
- 22 318 документов 25 органов федеральных
органов исполнительной власти
- у 5 органов власти более 20% всех
опубликованных документов имели метки
пиратского MS Office
Исследование 2018 года
ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ
1. Были использованы архивы сайтов органов власти из национального цифрового
архива, все они также доступны через Хаб открытых данных
2. Из архивов сайтов были извлечены все документы в формате .DOC (формат MS Word),
их вышло чуть менее 23 тысяч документов.
3. Из каждого документа с помощью библиотеки hachoir были извлечены его метаданные:
название, дата создания, дата последнего изменения, автор, компания.
4. Для 5 органов власти в архиве нашлось менее 100 документов поэтому они были
выбраны из итоговой выборки из-за возможной неточности оценки
5. Для всех остальных документов на основе их метаданных в поле "comments.Company"
было идентифицировано сделан ли документ в пиратском ПО MS Office или же нет.
6. Алгоритм распознавания использовал следующие значения в этом поле для
идентификации ПО: RePack by SPecialiST, MoBIL GROUP, WareZ Provider, Dnsoft,
SPecialiST RePack, NhT, Grizli777, DG Win&Soft, Reanimator Extreme Edition, DreamLair,
DrAGoN CorP, Krokoz™, MultiDVD Team, SamForum.ws, diakov.net
7. В результате из 22318 документов у 1483 документов (6.64%) найдены пометки того что
они сделаны с помощью пиратского ПО.
https://udprf.ru/sites/default/files/IC_Skachki-internet.doc
Ограничения
ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ
1. Не анализировались документы в формате Open
Office XML (.docx, .xlsx, .pptx и др.)
2. Не все сайты органов власти можно
автоматически анализировать из-за объёмов и
иных ограничений.
3. Очень сложно доказать умысел. Можно всего
сослаться что документ готовился на личном
компьютере.
Вопросы?
Иван Бегтин, ibegtin@infoculture.ru
Председатель Ассоциации участников рынка данных
Директор АНО “Информационная культура”

More Related Content

What's hot

деловая разведка
деловая разведкаделовая разведка
деловая разведкаypokalyuk
 
Bi prezentation урок безопасного интернета окончательный вариант
Bi prezentation урок безопасного интернета окончательный вариантBi prezentation урок безопасного интернета окончательный вариант
Bi prezentation урок безопасного интернета окончательный вариантandrira63
 
Виталий Недельский – Семантик Хаб – ICBDA 2016
Виталий Недельский – Семантик Хаб – ICBDA 2016Виталий Недельский – Семантик Хаб – ICBDA 2016
Виталий Недельский – Семантик Хаб – ICBDA 2016rusbase
 
"Современное SEO" и "Многорукие бандиты", Optimization 2015
"Современное SEO" и "Многорукие бандиты", Optimization 2015"Современное SEO" и "Многорукие бандиты", Optimization 2015
"Современное SEO" и "Многорукие бандиты", Optimization 2015mikeslivinsky
 
РосКомСвобода. Законодательный каток по Рунету
РосКомСвобода. Законодательный каток по РунетуРосКомСвобода. Законодательный каток по Рунету
РосКомСвобода. Законодательный каток по РунетуArtem Kozlyuk
 
яндекс новости
яндекс новостияндекс новости
яндекс новостиDimaTopExpert
 
Обзор российского законодательства по интернет-регулированию и рекомендации п...
Обзор российского законодательства по интернет-регулированию и рекомендации п...Обзор российского законодательства по интернет-регулированию и рекомендации п...
Обзор российского законодательства по интернет-регулированию и рекомендации п...Artem Kozlyuk
 
Журналист и право, день 1
Журналист и право, день 1Журналист и право, день 1
Журналист и право, день 1EcoMangystau
 
Антипиратская практика в России
Антипиратская практика в России Антипиратская практика в России
Антипиратская практика в России Evgeniy Kozlov
 
Boundless informant
Boundless informantBoundless informant
Boundless informantMax Rev
 
Что вы знаете о своем seo? @seoconference,2014
Что вы знаете о своем seo? @seoconference,2014Что вы знаете о своем seo? @seoconference,2014
Что вы знаете о своем seo? @seoconference,2014mikeslivinsky
 
Prognonaya analitika v_poiskovom_marketige
Prognonaya analitika v_poiskovom_marketigePrognonaya analitika v_poiskovom_marketige
Prognonaya analitika v_poiskovom_marketigeUkrop Media
 
Р. Фадеев. Сайт, контент и право
Р. Фадеев. Сайт, контент и правоР. Фадеев. Сайт, контент и право
Р. Фадеев. Сайт, контент и правоit-people
 
Сказ о том, как Кремль Трампа выбирал
Сказ о том, как Кремль Трампа выбиралСказ о том, как Кремль Трампа выбирал
Сказ о том, как Кремль Трампа выбиралMike Waizman
 
Открытая регистрация в домене РФ. Кириллические адреса
Открытая регистрация в домене РФ. Кириллические адресаОткрытая регистрация в домене РФ. Кириллические адреса
Открытая регистрация в домене РФ. Кириллические адресаendikastro
 
Предотвращение утечки конфиденциальной информации в электронном документообороте
Предотвращение утечки конфиденциальной информации в электронном документооборотеПредотвращение утечки конфиденциальной информации в электронном документообороте
Предотвращение утечки конфиденциальной информации в электронном документооборотеDocsvision
 
White paper: Защита информации в финансовом секторе
White paper: Защита информации в финансовом сектореWhite paper: Защита информации в финансовом секторе
White paper: Защита информации в финансовом сектореМФИ Софт
 

What's hot (18)

деловая разведка
деловая разведкаделовая разведка
деловая разведка
 
Bi prezentation урок безопасного интернета окончательный вариант
Bi prezentation урок безопасного интернета окончательный вариантBi prezentation урок безопасного интернета окончательный вариант
Bi prezentation урок безопасного интернета окончательный вариант
 
Виталий Недельский – Семантик Хаб – ICBDA 2016
Виталий Недельский – Семантик Хаб – ICBDA 2016Виталий Недельский – Семантик Хаб – ICBDA 2016
Виталий Недельский – Семантик Хаб – ICBDA 2016
 
"Современное SEO" и "Многорукие бандиты", Optimization 2015
"Современное SEO" и "Многорукие бандиты", Optimization 2015"Современное SEO" и "Многорукие бандиты", Optimization 2015
"Современное SEO" и "Многорукие бандиты", Optimization 2015
 
РосКомСвобода. Законодательный каток по Рунету
РосКомСвобода. Законодательный каток по РунетуРосКомСвобода. Законодательный каток по Рунету
РосКомСвобода. Законодательный каток по Рунету
 
яндекс новости
яндекс новостияндекс новости
яндекс новости
 
Обзор российского законодательства по интернет-регулированию и рекомендации п...
Обзор российского законодательства по интернет-регулированию и рекомендации п...Обзор российского законодательства по интернет-регулированию и рекомендации п...
Обзор российского законодательства по интернет-регулированию и рекомендации п...
 
Журналист и право, день 1
Журналист и право, день 1Журналист и право, день 1
Журналист и право, день 1
 
Антипиратская практика в России
Антипиратская практика в России Антипиратская практика в России
Антипиратская практика в России
 
Movebо Foxsmart SEO 24/7
Movebо Foxsmart SEO 24/7Movebо Foxsmart SEO 24/7
Movebо Foxsmart SEO 24/7
 
Boundless informant
Boundless informantBoundless informant
Boundless informant
 
Что вы знаете о своем seo? @seoconference,2014
Что вы знаете о своем seo? @seoconference,2014Что вы знаете о своем seo? @seoconference,2014
Что вы знаете о своем seo? @seoconference,2014
 
Prognonaya analitika v_poiskovom_marketige
Prognonaya analitika v_poiskovom_marketigePrognonaya analitika v_poiskovom_marketige
Prognonaya analitika v_poiskovom_marketige
 
Р. Фадеев. Сайт, контент и право
Р. Фадеев. Сайт, контент и правоР. Фадеев. Сайт, контент и право
Р. Фадеев. Сайт, контент и право
 
Сказ о том, как Кремль Трампа выбирал
Сказ о том, как Кремль Трампа выбиралСказ о том, как Кремль Трампа выбирал
Сказ о том, как Кремль Трампа выбирал
 
Открытая регистрация в домене РФ. Кириллические адреса
Открытая регистрация в домене РФ. Кириллические адресаОткрытая регистрация в домене РФ. Кириллические адреса
Открытая регистрация в домене РФ. Кириллические адреса
 
Предотвращение утечки конфиденциальной информации в электронном документообороте
Предотвращение утечки конфиденциальной информации в электронном документооборотеПредотвращение утечки конфиденциальной информации в электронном документообороте
Предотвращение утечки конфиденциальной информации в электронном документообороте
 
White paper: Защита информации в финансовом секторе
White paper: Защита информации в финансовом сектореWhite paper: Защита информации в финансовом секторе
White paper: Защита информации в финансовом секторе
 

Similar to Дата расследования в России.

РИФ 2016, «Эквалайзер желаний» в социальных сетях для решения комплекса бизне...
РИФ 2016, «Эквалайзер желаний» в социальных сетях для решения комплекса бизне...РИФ 2016, «Эквалайзер желаний» в социальных сетях для решения комплекса бизне...
РИФ 2016, «Эквалайзер желаний» в социальных сетях для решения комплекса бизне...Тарасов Константин
 
10 уязвимостей в ваших данных: методы взлома
10 уязвимостей в ваших данных: методы взлома10 уязвимостей в ваших данных: методы взлома
10 уязвимостей в ваших данных: методы взломаSkillFactory
 
Russian Personal Data Legislation: Localization Requirement
Russian Personal Data Legislation: Localization RequirementRussian Personal Data Legislation: Localization Requirement
Russian Personal Data Legislation: Localization RequirementVladislav Arkhipov
 
2013 05 phd масалович
2013 05 phd масалович2013 05 phd масалович
2013 05 phd масаловичPositive Hack Days
 
Aндрей Mасалович. Конкурентная разведка в Интернете.
Aндрей Mасалович. Конкурентная разведка в Интернете.Aндрей Mасалович. Конкурентная разведка в Интернете.
Aндрей Mасалович. Конкурентная разведка в Интернете.Positive Hack Days
 
Как наводить справки о компаниях и работе с государством
Как наводить справки о компаниях и работе с государствомКак наводить справки о компаниях и работе с государством
Как наводить справки о компаниях и работе с государствомInformational Culture
 
Открытые финансовые данные: потребность, доступность, использование
Открытые финансовые данные: потребность, доступность, использованиеОткрытые финансовые данные: потребность, доступность, использование
Открытые финансовые данные: потребность, доступность, использованиеIvan Begtin
 
Открытые данные как основа проектов гражданского контроля/Иван Бегтин
Открытые данные как основа проектов гражданского контроля/Иван БегтинОткрытые данные как основа проектов гражданского контроля/Иван Бегтин
Открытые данные как основа проектов гражданского контроля/Иван Бегтинsocamp2011
 
Oracle. Олег Файницкий. "Безопасность в публичном облаке. Юридические аспекты"
Oracle. Олег Файницкий. "Безопасность в публичном облаке. Юридические аспекты"Oracle. Олег Файницкий. "Безопасность в публичном облаке. Юридические аспекты"
Oracle. Олег Файницкий. "Безопасность в публичном облаке. Юридические аспекты"Expolink
 
Взломать за 60 секунд
Взломать за 60 секундВзломать за 60 секунд
Взломать за 60 секундSkillFactory
 
Семинар-совещание 16.05.2014. Анализ российского рынка программных средств об...
Семинар-совещание 16.05.2014. Анализ российского рынка программных средств об...Семинар-совещание 16.05.2014. Анализ российского рынка программных средств об...
Семинар-совещание 16.05.2014. Анализ российского рынка программных средств об...Anastasia Khuraskina
 
Многорукие бандиты Яндекса (Optimization-15)
Многорукие бандиты Яндекса (Optimization-15)Многорукие бандиты Яндекса (Optimization-15)
Многорукие бандиты Яндекса (Optimization-15)Стас Поломарь
 
Многорукие биндиты Яндекса
Многорукие биндиты ЯндексаМногорукие биндиты Яндекса
Многорукие биндиты ЯндексаWebit
 
Презентация Seldon
Презентация SeldonПрезентация Seldon
Презентация SeldonEgor Sulkin
 
Скрытые данные. Какие данные спрятаны на госсайтах
Скрытые данные. Какие данные спрятаны на госсайтахСкрытые данные. Какие данные спрятаны на госсайтах
Скрытые данные. Какие данные спрятаны на госсайтахIvan Begtin
 
Watch list screening
Watch list screeningWatch list screening
Watch list screeningcrm2life
 
Semantic archive for economic security servecis
Semantic archive for economic security servecisSemantic archive for economic security servecis
Semantic archive for economic security servecisssuser0170f41
 
Alternative data by Ivan Begtin
Alternative data by Ivan BegtinAlternative data by Ivan Begtin
Alternative data by Ivan BegtinIvan Begtin
 

Similar to Дата расследования в России. (20)

РИФ 2016, «Эквалайзер желаний» в социальных сетях для решения комплекса бизне...
РИФ 2016, «Эквалайзер желаний» в социальных сетях для решения комплекса бизне...РИФ 2016, «Эквалайзер желаний» в социальных сетях для решения комплекса бизне...
РИФ 2016, «Эквалайзер желаний» в социальных сетях для решения комплекса бизне...
 
10 уязвимостей в ваших данных: методы взлома
10 уязвимостей в ваших данных: методы взлома10 уязвимостей в ваших данных: методы взлома
10 уязвимостей в ваших данных: методы взлома
 
Russian Personal Data Legislation: Localization Requirement
Russian Personal Data Legislation: Localization RequirementRussian Personal Data Legislation: Localization Requirement
Russian Personal Data Legislation: Localization Requirement
 
2013 05 phd масалович
2013 05 phd масалович2013 05 phd масалович
2013 05 phd масалович
 
Aндрей Mасалович. Конкурентная разведка в Интернете.
Aндрей Mасалович. Конкурентная разведка в Интернете.Aндрей Mасалович. Конкурентная разведка в Интернете.
Aндрей Mасалович. Конкурентная разведка в Интернете.
 
Как наводить справки о компаниях и работе с государством
Как наводить справки о компаниях и работе с государствомКак наводить справки о компаниях и работе с государством
Как наводить справки о компаниях и работе с государством
 
Открытые финансовые данные: потребность, доступность, использование
Открытые финансовые данные: потребность, доступность, использованиеОткрытые финансовые данные: потребность, доступность, использование
Открытые финансовые данные: потребность, доступность, использование
 
Открытые данные как основа проектов гражданского контроля/Иван Бегтин
Открытые данные как основа проектов гражданского контроля/Иван БегтинОткрытые данные как основа проектов гражданского контроля/Иван Бегтин
Открытые данные как основа проектов гражданского контроля/Иван Бегтин
 
Серая книга
Серая книгаСерая книга
Серая книга
 
Oracle. Олег Файницкий. "Безопасность в публичном облаке. Юридические аспекты"
Oracle. Олег Файницкий. "Безопасность в публичном облаке. Юридические аспекты"Oracle. Олег Файницкий. "Безопасность в публичном облаке. Юридические аспекты"
Oracle. Олег Файницкий. "Безопасность в публичном облаке. Юридические аспекты"
 
Prezentacia
PrezentaciaPrezentacia
Prezentacia
 
Взломать за 60 секунд
Взломать за 60 секундВзломать за 60 секунд
Взломать за 60 секунд
 
Семинар-совещание 16.05.2014. Анализ российского рынка программных средств об...
Семинар-совещание 16.05.2014. Анализ российского рынка программных средств об...Семинар-совещание 16.05.2014. Анализ российского рынка программных средств об...
Семинар-совещание 16.05.2014. Анализ российского рынка программных средств об...
 
Многорукие бандиты Яндекса (Optimization-15)
Многорукие бандиты Яндекса (Optimization-15)Многорукие бандиты Яндекса (Optimization-15)
Многорукие бандиты Яндекса (Optimization-15)
 
Многорукие биндиты Яндекса
Многорукие биндиты ЯндексаМногорукие биндиты Яндекса
Многорукие биндиты Яндекса
 
Презентация Seldon
Презентация SeldonПрезентация Seldon
Презентация Seldon
 
Скрытые данные. Какие данные спрятаны на госсайтах
Скрытые данные. Какие данные спрятаны на госсайтахСкрытые данные. Какие данные спрятаны на госсайтах
Скрытые данные. Какие данные спрятаны на госсайтах
 
Watch list screening
Watch list screeningWatch list screening
Watch list screening
 
Semantic archive for economic security servecis
Semantic archive for economic security servecisSemantic archive for economic security servecis
Semantic archive for economic security servecis
 
Alternative data by Ivan Begtin
Alternative data by Ivan BegtinAlternative data by Ivan Begtin
Alternative data by Ivan Begtin
 

More from Ivan Begtin

Сервисы инфраструктуры данных для исследователей
Сервисы инфраструктуры данных для исследователейСервисы инфраструктуры данных для исследователей
Сервисы инфраструктуры данных для исследователейIvan Begtin
 
API в проектах Инфокультуры
API в проектах ИнфокультурыAPI в проектах Инфокультуры
API в проектах ИнфокультурыIvan Begtin
 
Цифровое культурное наследие
Цифровое культурное наследиеЦифровое культурное наследие
Цифровое культурное наследиеIvan Begtin
 
Основные источники информации о госфинансах в России (обзор систем)
Основные источники информации о госфинансах в России (обзор систем)Основные источники информации о госфинансах в России (обзор систем)
Основные источники информации о госфинансах в России (обзор систем)Ivan Begtin
 
Как не запутаться в справочниках и классификаторах бюджетной системы
Как не запутаться в справочниках и классификаторах бюджетной системыКак не запутаться в справочниках и классификаторах бюджетной системы
Как не запутаться в справочниках и классификаторах бюджетной системыIvan Begtin
 
Как устроена бюджетная система России (обзор данных и структуры)
Как устроена бюджетная система России (обзор данных и структуры)Как устроена бюджетная система России (обзор данных и структуры)
Как устроена бюджетная система России (обзор данных и структуры)Ivan Begtin
 
Проекты на данных криминальной статистики в России и в мире
Проекты на данных криминальной статистики в России и в миреПроекты на данных криминальной статистики в России и в мире
Проекты на данных криминальной статистики в России и в миреIvan Begtin
 
Простой и понятный русский язык (plainrussian.ru)
Простой и понятный русский язык (plainrussian.ru)Простой и понятный русский язык (plainrussian.ru)
Простой и понятный русский язык (plainrussian.ru)Ivan Begtin
 
Бизнес модели на открытых данных
Бизнес модели на открытых данныхБизнес модели на открытых данных
Бизнес модели на открытых данныхIvan Begtin
 
Государство как платформа. Обзор и практика
Государство как платформа. Обзор и практикаГосударство как платформа. Обзор и практика
Государство как платформа. Обзор и практикаIvan Begtin
 
Открытые государственные финансовые исторические данные
Открытые государственные финансовые исторические данныеОткрытые государственные финансовые исторические данные
Открытые государственные финансовые исторические данныеIvan Begtin
 
Государственные субсидии (федеральный уровень)
Государственные субсидии (федеральный уровень) Государственные субсидии (федеральный уровень)
Государственные субсидии (федеральный уровень) Ivan Begtin
 
Международные проекты по открытости расходов государства
Международные проекты по открытости расходов государстваМеждународные проекты по открытости расходов государства
Международные проекты по открытости расходов государстваIvan Begtin
 
Где взять данные дата-журналисту?
Где взять данные дата-журналисту?Где взять данные дата-журналисту?
Где взять данные дата-журналисту?Ivan Begtin
 
Иван Бегтин "Цифровые архивы"
Иван Бегтин "Цифровые архивы"Иван Бегтин "Цифровые архивы"
Иван Бегтин "Цифровые архивы"Ivan Begtin
 
Умное государство. Миф или антиутопия?
Умное государство. Миф или антиутопия?Умное государство. Миф или антиутопия?
Умное государство. Миф или антиутопия?Ivan Begtin
 
Открытые и большие государственные данные и их практическая применимость
Открытые и большие государственные данные и их практическая применимостьОткрытые и большие государственные данные и их практическая применимость
Открытые и большие государственные данные и их практическая применимостьIvan Begtin
 
Карты преступности и обзор сайтов МВД/ОВД России
Карты преступности и обзор сайтов МВД/ОВД РоссииКарты преступности и обзор сайтов МВД/ОВД России
Карты преступности и обзор сайтов МВД/ОВД РоссииIvan Begtin
 
Opendataschool budgets
Opendataschool budgetsOpendataschool budgets
Opendataschool budgetsIvan Begtin
 
Opendata practice for Global Editors Hackathon
Opendata practice for Global Editors HackathonOpendata practice for Global Editors Hackathon
Opendata practice for Global Editors HackathonIvan Begtin
 

More from Ivan Begtin (20)

Сервисы инфраструктуры данных для исследователей
Сервисы инфраструктуры данных для исследователейСервисы инфраструктуры данных для исследователей
Сервисы инфраструктуры данных для исследователей
 
API в проектах Инфокультуры
API в проектах ИнфокультурыAPI в проектах Инфокультуры
API в проектах Инфокультуры
 
Цифровое культурное наследие
Цифровое культурное наследиеЦифровое культурное наследие
Цифровое культурное наследие
 
Основные источники информации о госфинансах в России (обзор систем)
Основные источники информации о госфинансах в России (обзор систем)Основные источники информации о госфинансах в России (обзор систем)
Основные источники информации о госфинансах в России (обзор систем)
 
Как не запутаться в справочниках и классификаторах бюджетной системы
Как не запутаться в справочниках и классификаторах бюджетной системыКак не запутаться в справочниках и классификаторах бюджетной системы
Как не запутаться в справочниках и классификаторах бюджетной системы
 
Как устроена бюджетная система России (обзор данных и структуры)
Как устроена бюджетная система России (обзор данных и структуры)Как устроена бюджетная система России (обзор данных и структуры)
Как устроена бюджетная система России (обзор данных и структуры)
 
Проекты на данных криминальной статистики в России и в мире
Проекты на данных криминальной статистики в России и в миреПроекты на данных криминальной статистики в России и в мире
Проекты на данных криминальной статистики в России и в мире
 
Простой и понятный русский язык (plainrussian.ru)
Простой и понятный русский язык (plainrussian.ru)Простой и понятный русский язык (plainrussian.ru)
Простой и понятный русский язык (plainrussian.ru)
 
Бизнес модели на открытых данных
Бизнес модели на открытых данныхБизнес модели на открытых данных
Бизнес модели на открытых данных
 
Государство как платформа. Обзор и практика
Государство как платформа. Обзор и практикаГосударство как платформа. Обзор и практика
Государство как платформа. Обзор и практика
 
Открытые государственные финансовые исторические данные
Открытые государственные финансовые исторические данныеОткрытые государственные финансовые исторические данные
Открытые государственные финансовые исторические данные
 
Государственные субсидии (федеральный уровень)
Государственные субсидии (федеральный уровень) Государственные субсидии (федеральный уровень)
Государственные субсидии (федеральный уровень)
 
Международные проекты по открытости расходов государства
Международные проекты по открытости расходов государстваМеждународные проекты по открытости расходов государства
Международные проекты по открытости расходов государства
 
Где взять данные дата-журналисту?
Где взять данные дата-журналисту?Где взять данные дата-журналисту?
Где взять данные дата-журналисту?
 
Иван Бегтин "Цифровые архивы"
Иван Бегтин "Цифровые архивы"Иван Бегтин "Цифровые архивы"
Иван Бегтин "Цифровые архивы"
 
Умное государство. Миф или антиутопия?
Умное государство. Миф или антиутопия?Умное государство. Миф или антиутопия?
Умное государство. Миф или антиутопия?
 
Открытые и большие государственные данные и их практическая применимость
Открытые и большие государственные данные и их практическая применимостьОткрытые и большие государственные данные и их практическая применимость
Открытые и большие государственные данные и их практическая применимость
 
Карты преступности и обзор сайтов МВД/ОВД России
Карты преступности и обзор сайтов МВД/ОВД РоссииКарты преступности и обзор сайтов МВД/ОВД России
Карты преступности и обзор сайтов МВД/ОВД России
 
Opendataschool budgets
Opendataschool budgetsOpendataschool budgets
Opendataschool budgets
 
Opendata practice for Global Editors Hackathon
Opendata practice for Global Editors HackathonOpendata practice for Global Editors Hackathon
Opendata practice for Global Editors Hackathon
 

Дата расследования в России.

  • 2. Кто я и почему об этом рассказываю ГосзатратыАНО Информационная культура База госконтрактов и субсидий Проект по просвещению в госфинансах Создание проектов на открытых данных Взаимодействие с гражданами Исследования в области использования данных Хакатоны, конкурсы и лектории
  • 3. Расследование 1. Латиница в госзакупках как пример “слепых закупок”
  • 4. Искажения текстов для сокрытия закупок
  • 5. Откуда всё это возникло Искажения текстов для сокрытия закупок 1. Единый портал zakupki.gov.ru дал удобные инструменты поиска заказов для поставщиков 2. На сайте отсутствовал контроль качества информации (форматно-логический контроль) 3. Госзаказчики использовали трюки с описанием предметов закупки, чтобы ограничивать возможности поставщиков найти информацию
  • 6. Способы искажения информации Искажения текстов для сокрытия закупок - “латиница”: замена кириллических букв на похожие по написанию латинские; - опечатки и ошибки - отсутствие ключевых слов - замена букв на похожие цифры - использование тире в корне слова - разделение букв пробелами
  • 7. “Латиница” Искажения текстов для сокрытия закупок «латиница»–замена кириллических букв на аналогичные по написанию латинские. Например, «окон» и «окoн» Латинская “o”, код U+006F Кириллическая “о”, код U+043E
  • 8. Опечатки и грамматические ошибки Искажения текстов для сокрытия закупок Опечатки и грамматические ошибки – использование опечаток, а также грамматических ошибок, в том числе, в ключевых словах, определяющих предмет закупки. Например, «поставка мсяо (гавядина)» или «поставку автамобиля»;
  • 9. Отсутствие ключевых слов Искажения текстов для сокрытия закупок Отсутствие ключевых слов – в наименовании закупки используются только общие слова, не позволяющие однозначно определить предмет закупки. Например,«Лот N15» или «закупка товаров»;
  • 10. Замена букв на похожие по написанию цифры Искажения текстов для сокрытия закупок Замена букв на похожие по написанию цифры –в этом случае буквы «о» и «б» могут заменяться на цифры «0»(ноль) и«6»(шесть). Например, «поставка ме6ели»
  • 11. Использование тире в корне слова Искажения текстов для сокрытия закупок Использование тире в корне слова – в этом случае знак тире размещается в корне слова, как при переносе текста по правилам русского языка. Например, «поставка мо-лочных про-дуктов»;
  • 12. Разделение букв в составе слова пробелами или иными знаками Искажения текстов для сокрытия закупок Разделение букв в составе слова пробелами или иными знаками –в этом случае каждая буква или часть слова отделена от другой пробелом. Например, «работ п о и з г о т о в л е н и ю п р о д у к ц и и ( п о л и г р а ф и ч е с к а я )»
  • 13. Как это было в 2012 году ИСКАЖЕНИЯ ТЕКСТОВ ДЛЯ СОКРЫТИЯ ЗАКУПОК
  • 14. Каждое слово красным шрифтом с латиницей ИСКАЖЕНИЯ ТЕКСТОВ ДЛЯ СОКРЫТИЯ ЗАКУПОК
  • 15. Как проводилось исследование Искажения текстов для сокрытия закупок - Разработана методика выявления закупок с искажениями названий - Собрана база всех искажений за 2012 год - Вручную проведена проверка на намеренность искажений в названиях - Разработана методика оценки ограничения доступа к участию в государственных закупках - Оценен ущерб от ограничений к участию в государственных закупках
  • 16. В цифрах за 2012 год Искажения текстов для сокрытия закупок - несколько миллионов - извещений о закупках - около 13 тысяч закупок выявлено с искажениями - 662 закупки с признаками умышленного сокрытия информации - около 2500 закупок требующих внимания - около 9000 закупок с единичными нарушениями
  • 18. Опечатки ИСКАЖЕНИЯ ТЕКСТОВ ДЛЯ СОКРЫТИЯ ЗАКУПОК Пример http://zakupki.gov.ru/223/purchase/public/purchase/info/common- info.html?regNumber=31300563078
  • 19. Отсутствие смысловых слов ИСКАЖЕНИЯ ТЕКСТОВ ДЛЯ СОКРЫТИЯ ЗАКУПОК Пример http://zakupki.gov.ru/223/purchase/public/purchase/info/common- info.html?regNumber=31908212779
  • 22. Поиски аномалий в наименованиях Искажения текстов для сокрытия закупок ● нет никаких смысловых слов ● есть слишком длинные слова, более 20 символов ● слова разных кодовых таблиц вперемешку: кириллица и латиница ● спецсимволы и разделители внутри слов (тире, пробелы и тд) ● опечатки, их частота и локализация
  • 23. Частотный словарь Искажения текстов для сокрытия закупок Что Словарь из всех слов использованных когда-либо в наименовании закупок. На выходе словарь из 749544 слов Как Обработка наименований более 2 миллионов закупок Зачем Для последующего выявления аномалий
  • 24. Словарь опечаток Искажения текстов для сокрытия закупок Что Словарь всех встречающихся опечаток в базе Как Автоматический расчёт расстояния Левенштейна для всех слов и отсев редко встречающихся слов как опечаток https://ru.wikipedia.org/wiki/Расстояние_Левенштейна Зачем Для идентификации опечаток
  • 25. Список вспомогательных слов Искажения текстов для сокрытия закупок Что Словарь из 150 вспомогательных слов Пример: поставка, закупка, аукцион, ГБУЗ, лот и тд. Как Ручная выборка из 5000 наиболее часто употребляемых слов Зачем Для выявления закупок где нет ни одного смыслового слова
  • 27. Планировалось, но не завершено Искажения текстов для сокрытия закупок - Ежегодная проверка данных ЕИС на искажение - Выявление склееных слов - Идентификация отсутствия содержания в описании предмета закупки (текст предмета закупки идентичен классификационному коду) - сопоставление текста предмета закупки и классификационного кода: выявление несоответствий
  • 29. Глубинная причина всех проблем РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Обработка персональных данных допускается в случае осуществления обработки персональных данных, подлежащих опубликованию или обязательному раскрытию в соответствии с федеральным законом. Пункт 11 части 1 статьи 6 Федерального закона от 27 июля 2006 г. N 152-ФЗ "О персональных данных”
  • 30. Глубинная причина всех проблем РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ А так ли хороши наши законы?
  • 31. Предыстория. Случайные находки перс. данных • Паспортные данные встречались в контрактах на портале zakupki.gov.ru • Паспортные данные попадались в реестре субсидий Единого портала бюджетной системы • Паспортные данные обнаруживались в отчётах НКО на сайте Минюста • Паспортные данные выявлялись в соглашениях о крупных сделках на сайтах электронных торговых площадок • СНИЛС и другие идентификаторы “засветились” в реестре сертификатов Арбитражного суда РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  • 32. 2016 год. Реестр отчётов НКО в Минюсте • Случайно обнаружили утечку большого объёма, более 30 тысяч записей в реестре отчётов Минюст, включая персональные данные особо защищаемых лиц • Передали Минюсту материалы • Минюст удалил все отчёты до 2016 года и, частично, исправил проблему • … но не удалил публикацию отчётов в Excel формате где утечка осталась • Среди тех о чьи паспортные данные публиковались: министры, главы госкорпораций и другие публичные лица РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  • 33. 2016 год. Реестр отчётов НКО в Минюсте РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  • 34. 3 стратегии Извлекать из сканов документов • Найти реестры документов • Скачать все документы • Распознать сканы • Использовать алгоритмы выявления шаблонов перс. данных Находить в поисковых системах • Создать список шаблонов перс. данных • Проверить по поисковым системам находимость шаблонов Извлекать из специальных форматов файлов • Определить специальные файлы • Провести анализ систем в которых они содержаться РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  • 35. Поиск персональных данных через поиск РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  • 36. Поиск персональных данных через поиск РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ 1. Локализация запросов до сайта и поддоменов командой “site:” 2. Перебор поиска по запросам: “паспорт серия”, “паспортные данные”, “паспорт номер” 3. Уточнения в виде первых цифр серии для снижения ложных срабатываний. Например: “паспорт серии 4502” 4. После обнаружения – тотальная проверка всех страниц и документов
  • 37. Удостоверяющие центры РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ 1. Открытые реестры сертификатов 2. Публикация метаданных сертификатов в открытом доступе 3. Публикация сертификатов в открытом доступе (специальные форматы файлов) 4. Раскрывают: СНИЛС, ФИО, место работы, должность, email
  • 38. Удостоверяющие центры РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Действующих удостоверяющих центров 444 Из них проверено 200 Найдено с раскрытием персональных данных 17
  • 39. Удостоверяющие центры РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  • 40. Удостоверяющие центры. Причины проблем РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Отсутствие надзора регулятора: ○ Мониторинга правоприменения нет ○ План проверок УЦ отсутствует (http://e-trust.gosuslugi.ru/CAChecks) ○ Проверки не проводились Ошибки (халатность?) операторов УЦ o Неверная трактовка раздела IV Приказа Министерства связи и массовых коммуникаций РФ от 22 августа 2017 г. N 436"Об утверждении Порядка формирования и ведения реестров выданных аккредитованными удостоверяющими центрами квалифицированных сертификатов ключей проверки электронной подписи, а также предоставления информации из таких реестров”
  • 41. Приказ Минкомсвязи N436 от 22 августа 2017 г. РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ • уникальный номер сертификата; • даты начала и окончания действия сертификата; • ФИО • СНИЛС • документы полномочий физ лица • ограничения использования квалифицированного сертификата Раздел II Структура реестра квалифицированных сертификатов • Безвозмездно • Любому лицу по запросу в течении 24 часов • Запрет на раскрытие всего реестра отсутствует • Если нет ФЗ или другого НПА ограничивающих доступ Раздел IV Предоставление сведений из реестра квалифицированных сертификатов
  • 42. Удостоверяющие центры. Итоги РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ 1. Государство (Минкомсвязь России) обязало владельцев информационных систем раскрывать персональные данные о квалифицированных сертификатах. 2. Регламент раскрытия не запрещал раскрытие всего реестра сертификатов в открытом доступе. 3. Значительная часть операторов раскрывала реестры сертификатов в открытом доступе для снижения издержек и удобства эксплуатации систем
  • 43. Государственные информационные системы ● Реестр субсидий федерального бюджета ● Реестр отчётов некоммерческих организаций (Минюст России) ● Обращения граждан на портале Онлайн Инспектор ● База правовых решений на портале ФАС России ● Портал торгов по госимуществу ● Портал управления многоквартирными домами г. Москвы ● Портал поставщиков г. Москвы ● Портал государственного и муниципального заказа РФ (zakupki.gov.ru) РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  • 44. Реестр субсидий. Особенности РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - общедоступен по адресу rs.budget.gov.ru - большая часть документов в виде сканов - не индексируется поисковыми системами - много договоров: высокая вероятность наличия персональных данных - есть API и открытые данные (ускоряет обработку реестра)
  • 45. Реестр субсидий. Как проверялось РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ 1. Все документы реестра были выгружены 2. Каждый документ автоматически распознан (OCR Tesseract) 3. Скрипт на Python по поиску по ключевым словам: паспортные данные, паспорт серия, СНИЛС и др 4. Обязательная ручная перепроверка всех автоматически найденных документов.
  • 46. Реестр субсидий РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Всего документов Более 400 тысяч Из них проверено документов 99 тысяч Найдено с раскрытием персональных данных 1,6 тысяч
  • 47. Реестр субсидий. Где утечки перс. данных РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - сканы доверенностей сотрудников, заключающих соглашения о субсидиях; - договора с физическими лицами, приложенные к договорам о субсидиях юридическим лицам; - договора с авиакомпаниями о компенсации им льготной перевозки ветеранов ВоВ и инвалидов с сопровождающими лицами (содержат паспортные данные всех перевезенных за период); - договора о компенсации затрат на размещение беженцев Украины заключённые ФМС России с органами власти субъектов федерации: содержат паспортные данные каждого беженца; - денежные компенсации физическим лицам разных групп граждан;
  • 48. Реестр субсидий. Итоги РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ 11721 подтверждённое минимальное число записей публикуемых паспортных данных по результатам оценки около 25% документов реестра
  • 49. ОнлайнИнспекция.РФ. Особенности РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - состоит из жалоб граждан - жалобы публикуются онлайн - жалобы слабо модерировались и часто содержат паспортные данные заявителя
  • 50. ОнлайнИнспекция.РФ. В поисковых системах РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  • 51. ОнлайнИнспекция.РФ. На страницах сайта РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  • 52. ОнлайнИнспекция.РФ. Как проверялось РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ 1. Скрипт на Python для выгрузки всех страниц 2. Все страницы жалоб были выгружены 3. Скрипт на Python по поиску по ключевым словам: паспортные данные, паспорт серия, СНИЛС и др 4. Обязательная ручная перепроверка всех автоматически найденных документов.
  • 53. ОнлайнИнспекция.РФ. РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Всего документов 631 тысяча Из них проверено документов 230 тысяч Найдено с раскрытием персональных данных 1 тысяча
  • 54. ОнлайнИнспекция.РФ. Итоги РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ около 1000 подтверждённое минимальное число записей публикуемых паспортных данных по результатам оценки около 33% документов жалоб
  • 55. Портал zakupki.gov.ru. Особенности РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - подтверждённые разовые факты публикации перс. данных в сканах договоров с физ. лицами - огромный объём документов, сотни терабайт - обязательное использование цифровых подписей
  • 56. Портал zakupki.gov.ru. Цифровые подписи РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  • 57. Портал zakupki.gov.ru. Цифровые подписи РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  • 58. Портал zakupki.gov.ru. Цифровые подписи РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - используются всеми заказчиками, представителями ФАС и Федерального казначейства - присутствуют приложением к каждому документу - выглядят как нечитаемый, типа зашифрованный, набор букв - декодируются с помощью утилиты certutil идущей в стандартной поставке всех ОС Windows - содержат все метаданные сертификата подписанта
  • 59. Портал zakupki.gov.ru. Утечки через цифровые подписи РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Всего зарегистрировано заказчиков Более 300 тысяч Из них проверено Более 300 тысяч Найдено с раскрытием персональных данных Более 300 тысяч
  • 60. Портал zakupki.gov.ru. Итоги РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ не менее 300 тысяч подтверждённое минимальное число записей публикуемых данных из цифровых подписей
  • 61. Электронные торговые площадки по 44-ФЗ РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - Сбербанк АСТ - ZakazRF - РТС Тендер - Росэльторг - Национальная электронная торговая площадк - ЭТП РАД
  • 62. Электронные торговые площадки. Особенности РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Требования 44-ФЗ и подзаконных актов устанавливают обязанность площадки: ▪ вести реестр аккредитованных участников; ▪ публиковать решения об одобрении крупных сделок для всех участников поставщиков; ▪ обязывать поставщиков использовать квалифицированную цифровую подпись при публикации документов; ▪ обязывать заказчиков подписывать итоговые протоколы процедур квалифицированной электронной подписью.
  • 63. Сбербанк АСТ. Цифровая подпись РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  • 64. ZakazRF. Цифровая подпись РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  • 65. ЭТП . Цифровые подписи РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - Используется на ВСЕХ площадках - используются всеми поставщиками - присутствуют приложением к документам поставщиков - выглядят как нечитаемый, типа зашифрованный, набор букв в файле с расширением .sig - декодируются с помощью утилиты certutil идущей в стандартной поставке всех ОС Windows - содержат все метаданные сертификата подписанта
  • 66. Сбербанк АСТ. Одобрение крупных сделок РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  • 67. Росэльторг. Одобрение крупных сделок РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ
  • 68. ЭТП . Одобрение крупных сделок РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ - Используется на ВСЕХ площадках - используются всеми поставщиками - присутствуют приложением к документам поставщиков - выглядят как нечитаемый, типа зашифрованный, набор букв в файле с расширением .sig - декодируются с помощью утилиты certutil идущей в стандартной поставке всех ОС Windows - содержат все метаданные сертификата подписанта
  • 69. Электронные торговые площадки. Итоги РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ 2,25 миллиона подтверждённое минимальное число записей публикуемых данных из цифровых подписей и паспортных данных одобрения крупных сделок
  • 70. Общие итоги РАССЛЕДОВАНИЕ УТЕЧЕК ПЕРС. ДАННЫХ РОССИЯН В 2018-2019 ГОДАХ Подробное расследование в августе 2018 года. Передача результатов расследования в Роскомнадзор (через Генпрокуратуру) Отсутствие адекватной реакции от Роскомнадзора (непризнание данных утечек значимыми) Ожидание 8 месяцев Передача результатов исследования РБК в качестве эксклюзивного материала в апреле 2019 года Оперативная реакция Роскомнадзора после публикаций в СМИ Большая часть каналов утечек закрыты после публикации … но системная работа даже не началась
  • 71. Расследование 3 Пиратский MS Office в органах власти
  • 72. Тезисы ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ - огромное число людей по всему миру пользуется пиратским ПО в том числе MS Office - среди этих пользователей есть сотрудники органов власти - и использование пиратского ПО не проходит незамеченным
  • 74. Команды публикующие пиратский MS Office ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ Krokoz, WareZ Provider, RePack by SPecialiST, NhT, MoBIL GROUP, Grizli777, Reanimator Extreme Edition, WolfishLair, SE7EN TEAMS
  • 75. Следы ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ - при установке по умолчанию MS Office прописывал в свойства документа в атрибут “Company” название пиратской группы - это можно исправить в настройках, но многих забывают это сделать - чтобы найти несколько таких документов с такими свойствами надо переработать десятки и сотни тысяч документов.
  • 76. Исследование 2018 года ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ - 22 318 документов 25 органов федеральных органов исполнительной власти - у 5 органов власти более 20% всех опубликованных документов имели метки пиратского MS Office
  • 77. Исследование 2018 года ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ 1. Были использованы архивы сайтов органов власти из национального цифрового архива, все они также доступны через Хаб открытых данных 2. Из архивов сайтов были извлечены все документы в формате .DOC (формат MS Word), их вышло чуть менее 23 тысяч документов. 3. Из каждого документа с помощью библиотеки hachoir были извлечены его метаданные: название, дата создания, дата последнего изменения, автор, компания. 4. Для 5 органов власти в архиве нашлось менее 100 документов поэтому они были выбраны из итоговой выборки из-за возможной неточности оценки 5. Для всех остальных документов на основе их метаданных в поле "comments.Company" было идентифицировано сделан ли документ в пиратском ПО MS Office или же нет. 6. Алгоритм распознавания использовал следующие значения в этом поле для идентификации ПО: RePack by SPecialiST, MoBIL GROUP, WareZ Provider, Dnsoft, SPecialiST RePack, NhT, Grizli777, DG Win&Soft, Reanimator Extreme Edition, DreamLair, DrAGoN CorP, Krokoz™, MultiDVD Team, SamForum.ws, diakov.net 7. В результате из 22318 документов у 1483 документов (6.64%) найдены пометки того что они сделаны с помощью пиратского ПО.
  • 79.
  • 80.
  • 81. Ограничения ПИРАТСКИЙ MS OFFICE В ОРГАНАХ ВЛАСТИ 1. Не анализировались документы в формате Open Office XML (.docx, .xlsx, .pptx и др.) 2. Не все сайты органов власти можно автоматически анализировать из-за объёмов и иных ограничений. 3. Очень сложно доказать умысел. Можно всего сослаться что документ готовился на личном компьютере.
  • 82. Вопросы? Иван Бегтин, ibegtin@infoculture.ru Председатель Ассоциации участников рынка данных Директор АНО “Информационная культура”