Item 6: International Center for Biosaline Agriculture
Russian Federation Use of Technology for field data capture and compilation : Technical Session 16c (RU)
1. Региональный Круглый стол по Программе всемирной
сельскохозяйственной переписи 2020 года
Будапешт, Венгрия, 3-7 апреля 2017 года
Использование технологий при сборе и
обработке данных ВСХП-2016 и их
влияние на организацию сбора данных
Техническая сессия 16
К.Э. Лайкам, доктор экономических наук,
Заместитель руководителя Росстата
3. Способы сбора данных ВСХП-2016
• Машиночитаемые документы – заполнение бумажных бланков
переписных листов респондентами/переписчиками
• Электронно-вычислительные формы – самостоятельное заполнение
электронных форм переписных листов (вэб-сбор, спецоператоры)
• Планшеты – заполнение электронных переписных листов
переписчиками с использованием планшетных компьютеров
3
Сельхоз
организации
Крестьянские
(фермерские)
хозяйства и
индивидуальные
предприниматели
Личные
подсобные
хозяйства
Некоммерческие
объединения
Машиночитаемые
документы
+ + + +
Электронно-
вычислительные
формы
+ + - -
Планшеты - - + -
4. 4
• Сельскохозяйственные организации,
• Крестьянские (фермерские) хозяйства и
индивидуальные предприниматели,
• Личные подсобные и другие индивидуальные
хозяйства граждан в сельских поселениях,
• Некоммерческие объединения граждан;
• Личные подсобные и другие индивидуальные
хозяйства граждан в городских поселениях (20%);
• Владельцы участков в некоммерческих
объединениях граждан (10%).
Категории сельскохозяйственных производителей
и методы сбора данных от респондентов
Сплошной
метод
Выборочный
метод
5. Особенности машиночитаемых документов
Преимущества:
• Отлаженная технология, использовавшаяся
в других переписях
• Простота использования – ручка и бумага
• Возможность внести данные, которые не
укладываются в принятую картину
5
Недостатки:
• Невозможность контроля данных в
процессе их сбора
• Необходимость дополнительной
обработки
• Печать, затраты на пересылку, сбор,
хранение бумаги
Трудности:
• Недостаток места в бланках (ограничения по числу строк)
• Сложность в заполнении бланков переписчиком
• Зависимость распознавания от почерка переписчика
• Ошибки «человеческого» фактора
6. Особенности электронно-
вычислительных форм
6
Преимущества:
• Унифицированная технология
• Исключение ошибок, в рамках формально-
логического контроля
• Оперативность получения и обработки данных
• Отсутствие затрат на сбор, хранение, передачу
бумаги
Недостатки:
• Требование к техническому
обеспечению (ПК, канал связи)
• Необходимы навыки работы с ЭВФ
• Срабатывание контролей на
«исключительных» данных
Трудности:
• Изменений правилФЛК на основе вновь обнаруженной
информации
• Невозможность проведения межбланкового контроля
7. Особенности планшета
7
Преимущества:
• Исключение ошибок (250 контролей - в
рамках в ФЛК)
• Оперативность получения и обработки
данных
• Отсутствие затрат на сбор, хранение,
передачу бумаги
• Многоуровневая защита от потери данных
Недостатки:
• Необходимы навыки работы с планшетом
• Опасения в части материальной
ответственности
• Срабатывание контролей на нетипичных
данных
• Невозможность обновления на ходу
• Затраты на приобретение планшетов
Трудности:
• ОшибкиФЛК, выявленные в процессе обследования, пришлось
«обходить»
• Случайная переинициализация планшетных компьютеров
инструкторами
• Возможность технических сбоев
8. Схема сбора сведений
8
МЧД
Единое хранилище
данных переписи
Система сбора
электронной отчетности
Планшет
Интернет
Ввод, кодирование, контроль
Респонденты
МЧД
Электронные
анкеты (ЭВФ)
Электронные
анкеты (планшет)
Перобразование к
единому формату
Преобразование к
единому формату
Перобразование к
единому формату
Электронные
анкеты (ЭВФ)
Электронные
анкеты (МЧД)
Данные
9. Технология обработки данных.
Региональный уровень
9
Машиночитаемые документы Электронные бланки
Выгрузка на Федеральный уровень
Формально-логический контроль
Контроль комплектности
Контроль введенных значений
Кодирование
Минимальный контроль комплектности
Верификация
Сканирование
Выгрузка на
Федеральный уровень
Формально-
логический контроль
Прием электронных
бланков
10. Технология обработки данных.
Федеральный уровень
10
Технологический цикл обработки
База микро данных
Формат открытых данных
Выверка сводов
Расчет сводных показателей
Распространение
Импутация
Автокоррекция
Формально-логический контроль
Консолидация
11. Схема обработки данных
11
Полевой уровень
Районный центр обработки
данных
Региональный центр обработки данных
Федеральный центр обработки данных
Полевой уровень
Сбор и
хранение МЧД
Сбор МЧД
МЧД
Ввод,
кодировка, ФЛК
Сканер Сервер БПД
Сервер файлов ПД Сервер БПД Сервер данных
переписных показателей
Сервер OLAP
Получение итогов
Интернет
Сбор и хранение
электронных анкет
Внешние носители
данных
12. Персонал и техника на
регионального уровня
12
2209 специалистов были привлечены для автоматизированной обработки
данных на региональном уровне в 2016 году
143 специалиста по подведению итогов привлечены в 2017 году
Закуплено техники для выполнения автоматизированной обработки
на РУ:
• Серверов БД (Aquarius T50 D16): 85
• Серверов приложений (Aquarius T50 D16): 85
• Поточных сканеров (Panasonic KV-S 4085CW): 170
• Рабочих станций (Aquarius Pro W60 S89): 2624
• МФУ (HP LaserJet Enterprise V725z): 170
13. Персонал и техника на
федеральном уровне
13
Закуплено техники для выполнения автоматизированной обработки
на ФУ:
• Сервер приложений Aquarius Srv T55 D25 4
• Сервер баз данных Aquarius Srv T55 D25 4
• Коммутатор D-Link DGS-1210-28P 3
• Система хранения данных Aquarius Array FU40 V5200 E4F84-D2251
• ИБП серверный ENTEL SPB-S10CS+D1+S 8
• Серверный шкаф Estap SRV42U8BF1R1 1
• Рабочие станции Aquarius Pro P30 S87 50
14. Результаты сбора сведений
14
Сельхоз
организации
Крестьянские
(фермерские)
хозяйства и
индивидуальные
предприниматели
Личные подсобные
хозяйства
Некоммерческие
организации
МЧД ЭВФ МЧД ЭВФ МЧД Планшеты ОБ Участков
Число
объектов
22 392 13 317 137 159 31 795 8 774 260 8 662 193 76 523 1 086 372
% 62,7% 37,3% 81,2% 18,8% 50,3% 49,7% 100% 100%
Итого: 35 709 168 954 17 436 453
Суммарно были собраны сведения о 18,8 млн. объектов:
• 10,1 млн. МЧД (~54 млн. МЧД листов)
• 45 тыс. ЭВФ
• 8,6 млн. в планшетнах