Технологии контроля доступа к интернет-ресурсам.
Павел Борисович Жданович,
кандидат физико-математических наук,
член-корреспондет Российской Академии информатизации,
системный администратор Волгоградской ОУНБ им. М. Горького
3. Немного о терминах
Ресурс — любая совокупность данных, которой можно присвоить
универсальный идентификатор ресурса. Как правило, это
веб-страница (http://ru.wikipedia.org/wiki),
изображение (http://www.relarn.ru/conf/conf2011/ImgGallery/44.jpg)
программа (http://direct-time.ru/),
мультимедиа-файл
(http://pianosociety.com/protected/chopin-9-2-mar.mp3),
другие объекты. Например, число 5 можно было бы задать
идентификатором:
http://server2/organization1.local/calculators/arithmetic?
a=2,b=3,operation=plus
4. Немного о терминах
Доступ к ресурсу – любое действие по отношению к
ресурсу. Обычно это
чтение (загрузка, просмотр, воспроизведение),
добавление,
изменение,
удаление
5. Немного о терминах
Браузер (Browser,
Интернет-обозреватель) – программа для
воспроизведения содержимого ресурса
6. Немного о терминах
Контроль доступа к Web-ресурсам – процесс принятия решений о
предоставлении пользователю возможности совершить
запрошенное им действие по отношению к ресурсу
8. URI-Фильтрация
Синтаксический подход. Проверка на вхождение
“запрещенных” буквосочетаний.
http://www.goodsite.com/main.html
http://bigsexserver.com/index.html
http://www.goodsite.com/essex.html
Премодерация (в т.ч. колаборативная). Ресурсы
просматриваются экспертами, заносятся в списки по
категориям.
При запросе выполняется проверка принадлежности
идентификатора ресурса одному из черных или белых
списков: алкоголь, онлайн-игры, наркотики, порно, экстремизм
и т.д.
12. Почему URI-фильтрация
ненадежна
URI “хороших” ресурсов могут содержать “плохие”
слова
http://xxx.lanl.gov
“Плохой” сайт не обязан называться плохо
Тематические списки ресурсов неполны
Отнесение ресурса к категории субъективно
Списки ресурсов быстро устаревают. Появляются
новые домены, меняются владельцы старых,
меняется тематика контента, “хороший” контент
переезжает в другие домены, домены прекращают
существование.
13. Откуда берутся... списки?
Автору известны открытые источники
списков в зарубежном Интернете:
− http://www.shallalist.de/
− http://www.urlblacklist.com
Автору неизвестно, существуют ли
аналогичные (платные или бесплатные)
источники списков хотя бы по Рунету.
Но зато!..(см. след. слайд)
14. Черный список
Роскомнадзора №1
ЕДИНЫЙ РЕЕСТР
доменных имен, указателей страниц сайтов в сети
"Интернет"
и сетевых адресов, позволяющих идентифицировать
сайты в сети "Интернет",
содержащие информацию, распространение которой
в Российской Федерации запрещено
http://eais.rkn.gov.ru/
Жаль, что он совершенно непригоден для
автоматизированного контроля ( через Web-сервисы и т.п.)
15. Черный список
Роскомнадзора №2
Реестр
доменных имен, указателей страниц сайтов в сети
«Интернет» и сетевых адресов, позволяющих
идентифицировать сайты в сети «Интернет»,
содержащие информацию, распространяемую с
нарушением авторских и (или) смежных прав
http://nap.rkn.gov.ru/
Жаль, что он также совершенно непригоден для
автоматизированного контроля ( через Web-сервисы и т.п.)
16. Федеральный список
МинЮста
Федеральный список экстремистских материалов
http://minjust.ru/ru/extremist-materials
Информационные материалы признаются
экстремистскими федеральным судом
установлена ответственность за массовое
распространение, производство либо хранение в
целях массового распространения.
17. Белый список Рособразования
и “Информики”
http://edu-top.ru/katalog/
По некоторым признакам, активное развитие
закончилось в 2008 году
Содержит более 1300 ссылок на
“образовательные ресурсы”.
Нуждается в повторной верификации,
содержит ресурсы 18+ (на момент
подготовки данной презентации)
18. Контентная фильтрация
Текстовый контент
− Заранее определяется перечень ключевых фраз,
позволяющих отнести ресурс к некоторой
категории. Каждая фраза снабжена весом
− Загрузка страницы в Интернете
− Поиск ключевых фраз в загруженной странице.
Веса найденных ключевых фраз суммируются
− Если вычисленный вес превышает пороговое
значение по некоторой категории, текст считается
относящимся к ней
− Пороговое значение может быть различным для
разных групп пользователей.
19. Контентная фильтрация
Графический контент
− Используются системы распознавания образов
Музыкальные произведения
− Системы распознавания музыки
Видео
− Искуственный интеллект?..
Программное обеспечение, архивы, зашифрованные
данные...
21. Контентная фильтрация, достоинства
Ресурс анализируется в момент доступа к
нему, а не заранее
Хорошо работает для некоторых категорий
ресурсов (порносайты, соц.сети)
Работает даже при использовании
анонимайзеров
22. Контентная фильтрация, недостатки
Требует много ресурсов
В действительности, рейтинговой оценке
подвергается только текст
Чувствителен к ошибкам в тексте
Не является полностью релевантным
Большие блоки текста могут оцениваться
выше (хуже), чем небольшие страницы
Русский язык сложнее английского
24. Средства контроля доступа
к интернет-ресурсам
Решена ли задача технически?
Нет.
Министр образования РФ Ливанов, 2013 г.:
«Мы сейчас обсуждаем с экспертами, как это сделать. Это,
безусловно, важная задача. Планов конкретных и сроков
нет. Сейчас важно определить технологически, как это
можно сделать»
http://ria.ru/society/20130829/959368589.html#ixzz3puTM455F
25. Средства контроля доступа
к интернет-ресурсам
Решена ли задача технически?
Нет.
Концеция информационной безопасности детей, 2014 г.:
Министерству образования и науки предписывается создание
регламентов и перечня средств контентной фильтрации
http://rkn.gov.ru/docs/Razdel_13_10040214.pdf
28. Законодательство и доступ в Интернет
Федеральный закон N 436-ФЗ «О защите
детей от информации, причиняющей вред их
здоровью и развитию» вступил в силу в 01
сентября 2012 г.
ст.14:Доступ к информации,
распространяемой посредством [...] сети
"Интернет", в местах, доступных для
детей, предоставляется лицом,
организующим доступ к сети "Интернет" в
таких местах [...] при условии применения
административных и организационных
мер, технических, программно-аппаратных
Доступ к информации, распространяемой посредством информационно-телекоммуникационных сетей, в том числе сети "Интернет", в местах, доступных для детей,
предоставляется лицом, организующим доступ к сети "Интернет" в таких местах (за исключением операторов связи, оказывающих эти услуги связи на основании
договоров об оказании услуг связи, заключенных в письменной форме), другим лицам при условии применения административных и организационных мер,
технических, программно-аппаратных средств защиты детей от информации, причиняющей вред их здоровью и (или) развитию.
Доступ к информации, распространяемой посредством информационно-телекоммуникационных сетей, в том числе сети "Интернет", в местах, доступных для детей,
предоставляется лицом, организующим доступ к сети "Интернет" в таких местах (за исключением операторов связи, оказывающих эти услуги связи на основании
договоров об оказании услуг связи, заключенных в письменной форме), другим лицам при условии применения административных и организационных мер,
технических, программно-аппаратных средств защиты детей от информации, причиняющей вред их здоровью и (или) развитию.
29. Законодательство и доступ в Интернет
11 мая 2011 года. “Правила подключения
общеобразовательных учреждений к единой
системе контент-фильтрации доступа к сети
Интернет, реализованной Минобрнауки”
http://skf.edu.ru/
Подписано министром Фурсенко.
Последняя новость на http://skf.edu.ru/ – от
27.03.2012г.
30. О чем договорились “Ростелеком” и минобрнауки
Волгоградской области?
«Ростелеком» и Министерство образования и
науки Волгоградской области подписали
соглашение о сотрудничестве, которое защитит
школьников от доступа к интернет-ресурсам, не
совместимым с задачами образования и
воспитания.
http://www.rostelecom.ru/about/branches/south/press/d248177/
“Образовательные учреждения не могут
самостоятельно добиться стопроцентной
фильтрации, даже используя обновляемые базы
данных по нежелательным ресурсам”.