SlideShare a Scribd company logo
1 of 14
Download to read offline
Цифровые архивы
Иван Бегтин
Директор АНО “Информационная культура”
Что такое “born-digital”?
Термин “рожденный в цифре” относится к
материалам который изначально создаются в
цифровой форме.[1]
[1] https://en.wikipedia.org/wiki/Born-digital
Что такое цифровая архивация?
• Архивация материалов созданных изначально в
цифровом виде
• Долгосрочное хранение материалов по новейшей
истории
• Долгосрочное хранение научных исследований и
данных
Инициативы
Интернет архив (archive.org)
ArchiveTeam
Национальные архивы и библиотеки
• Национальная библиотека Испании
• Национальная библиотека Каталонии
• Национальная библиотека Германии
• Национальная библиотека Эстонии
…
И многие библиотеки члены
IIPC (International Internet Preservation Consortium
Национальный
цифровой архив
России
НЦАР (archive.infoculture.ru)
Основные приоритеты
• Принципы аналогичные ArchiveTeam. Приоритет
“умирающим ресурсам”
• “Консервированное государство”. Архивация всех
государственных сайтов и сайтов сделанных на
государственные средства
• Специализированные проекты:
• Цифровое культурное наследие
• Цифровой научный архив
• и многое другое
Текущий статус
• 8 терабайт сжатых данных
• более 500 сохраненных сайтов
• регулярное пополнение
• подготовка масштабной инфраструктуры для
непрерывной архивации (Nutch + Heritrix)
• расходы: около 10 тысяч рублей в месяц, свои
средства и краудфандинг
• нет удобного интерфейса
• нет непрерывного сохранения
• не охвачены другие цифровые ресурсы
Что дальше?
• Тройное резервирование всего сохраненного
• Непрерывная архивация всех сайтов государства
• Краудфандинговая кампания на хостинг и
резервирование
• Запуск подпроектов по архивации цифрового
культурного наследия, избирательных кампаний и тд.
Как помочь?
• Пожертвовать на проект на archive.infoculture.ru
• Присылать адреса сайтов которые точно надо
сохранить
• Помочь найти бесплатное или дешевое хранилище от
100 терабайт и выше – лучше сразу 1 петабайт
• Помочь в разработке инструментов архивации
соцсетей: Facebook, Twitter, OK, VK, Telegram и тд
• Помогать собирать сайты для кампаний по архивации
Спасибо за
внимание.
Иван Бегтин
Email: ibegtin@infoculture.ru
Сайт: http://infoculture.ru

More Related Content

More from Ivan Begtin

Сервисы инфраструктуры данных для исследователей
Сервисы инфраструктуры данных для исследователейСервисы инфраструктуры данных для исследователей
Сервисы инфраструктуры данных для исследователейIvan Begtin
 
Alternative data by Ivan Begtin
Alternative data by Ivan BegtinAlternative data by Ivan Begtin
Alternative data by Ivan BegtinIvan Begtin
 
Дата расследования в России.
Дата расследования в России.Дата расследования в России.
Дата расследования в России.Ivan Begtin
 
API в проектах Инфокультуры
API в проектах ИнфокультурыAPI в проектах Инфокультуры
API в проектах ИнфокультурыIvan Begtin
 
Цифровое культурное наследие
Цифровое культурное наследиеЦифровое культурное наследие
Цифровое культурное наследиеIvan Begtin
 
Основные источники информации о госфинансах в России (обзор систем)
Основные источники информации о госфинансах в России (обзор систем)Основные источники информации о госфинансах в России (обзор систем)
Основные источники информации о госфинансах в России (обзор систем)Ivan Begtin
 
Как не запутаться в справочниках и классификаторах бюджетной системы
Как не запутаться в справочниках и классификаторах бюджетной системыКак не запутаться в справочниках и классификаторах бюджетной системы
Как не запутаться в справочниках и классификаторах бюджетной системыIvan Begtin
 
Как устроена бюджетная система России (обзор данных и структуры)
Как устроена бюджетная система России (обзор данных и структуры)Как устроена бюджетная система России (обзор данных и структуры)
Как устроена бюджетная система России (обзор данных и структуры)Ivan Begtin
 
Проекты на данных криминальной статистики в России и в мире
Проекты на данных криминальной статистики в России и в миреПроекты на данных криминальной статистики в России и в мире
Проекты на данных криминальной статистики в России и в миреIvan Begtin
 
Простой и понятный русский язык (plainrussian.ru)
Простой и понятный русский язык (plainrussian.ru)Простой и понятный русский язык (plainrussian.ru)
Простой и понятный русский язык (plainrussian.ru)Ivan Begtin
 
Бизнес модели на открытых данных
Бизнес модели на открытых данныхБизнес модели на открытых данных
Бизнес модели на открытых данныхIvan Begtin
 
Государство как платформа. Обзор и практика
Государство как платформа. Обзор и практикаГосударство как платформа. Обзор и практика
Государство как платформа. Обзор и практикаIvan Begtin
 
Открытые государственные финансовые исторические данные
Открытые государственные финансовые исторические данныеОткрытые государственные финансовые исторические данные
Открытые государственные финансовые исторические данныеIvan Begtin
 
Государственные субсидии (федеральный уровень)
Государственные субсидии (федеральный уровень) Государственные субсидии (федеральный уровень)
Государственные субсидии (федеральный уровень) Ivan Begtin
 
Международные проекты по открытости расходов государства
Международные проекты по открытости расходов государстваМеждународные проекты по открытости расходов государства
Международные проекты по открытости расходов государстваIvan Begtin
 
Открытые финансовые данные: потребность, доступность, использование
Открытые финансовые данные: потребность, доступность, использованиеОткрытые финансовые данные: потребность, доступность, использование
Открытые финансовые данные: потребность, доступность, использованиеIvan Begtin
 
Скрытые данные. Какие данные спрятаны на госсайтах
Скрытые данные. Какие данные спрятаны на госсайтахСкрытые данные. Какие данные спрятаны на госсайтах
Скрытые данные. Какие данные спрятаны на госсайтахIvan Begtin
 
Где взять данные дата-журналисту?
Где взять данные дата-журналисту?Где взять данные дата-журналисту?
Где взять данные дата-журналисту?Ivan Begtin
 
Умное государство. Миф или антиутопия?
Умное государство. Миф или антиутопия?Умное государство. Миф или антиутопия?
Умное государство. Миф или антиутопия?Ivan Begtin
 
Открытые и большие государственные данные и их практическая применимость
Открытые и большие государственные данные и их практическая применимостьОткрытые и большие государственные данные и их практическая применимость
Открытые и большие государственные данные и их практическая применимостьIvan Begtin
 

More from Ivan Begtin (20)

Сервисы инфраструктуры данных для исследователей
Сервисы инфраструктуры данных для исследователейСервисы инфраструктуры данных для исследователей
Сервисы инфраструктуры данных для исследователей
 
Alternative data by Ivan Begtin
Alternative data by Ivan BegtinAlternative data by Ivan Begtin
Alternative data by Ivan Begtin
 
Дата расследования в России.
Дата расследования в России.Дата расследования в России.
Дата расследования в России.
 
API в проектах Инфокультуры
API в проектах ИнфокультурыAPI в проектах Инфокультуры
API в проектах Инфокультуры
 
Цифровое культурное наследие
Цифровое культурное наследиеЦифровое культурное наследие
Цифровое культурное наследие
 
Основные источники информации о госфинансах в России (обзор систем)
Основные источники информации о госфинансах в России (обзор систем)Основные источники информации о госфинансах в России (обзор систем)
Основные источники информации о госфинансах в России (обзор систем)
 
Как не запутаться в справочниках и классификаторах бюджетной системы
Как не запутаться в справочниках и классификаторах бюджетной системыКак не запутаться в справочниках и классификаторах бюджетной системы
Как не запутаться в справочниках и классификаторах бюджетной системы
 
Как устроена бюджетная система России (обзор данных и структуры)
Как устроена бюджетная система России (обзор данных и структуры)Как устроена бюджетная система России (обзор данных и структуры)
Как устроена бюджетная система России (обзор данных и структуры)
 
Проекты на данных криминальной статистики в России и в мире
Проекты на данных криминальной статистики в России и в миреПроекты на данных криминальной статистики в России и в мире
Проекты на данных криминальной статистики в России и в мире
 
Простой и понятный русский язык (plainrussian.ru)
Простой и понятный русский язык (plainrussian.ru)Простой и понятный русский язык (plainrussian.ru)
Простой и понятный русский язык (plainrussian.ru)
 
Бизнес модели на открытых данных
Бизнес модели на открытых данныхБизнес модели на открытых данных
Бизнес модели на открытых данных
 
Государство как платформа. Обзор и практика
Государство как платформа. Обзор и практикаГосударство как платформа. Обзор и практика
Государство как платформа. Обзор и практика
 
Открытые государственные финансовые исторические данные
Открытые государственные финансовые исторические данныеОткрытые государственные финансовые исторические данные
Открытые государственные финансовые исторические данные
 
Государственные субсидии (федеральный уровень)
Государственные субсидии (федеральный уровень) Государственные субсидии (федеральный уровень)
Государственные субсидии (федеральный уровень)
 
Международные проекты по открытости расходов государства
Международные проекты по открытости расходов государстваМеждународные проекты по открытости расходов государства
Международные проекты по открытости расходов государства
 
Открытые финансовые данные: потребность, доступность, использование
Открытые финансовые данные: потребность, доступность, использованиеОткрытые финансовые данные: потребность, доступность, использование
Открытые финансовые данные: потребность, доступность, использование
 
Скрытые данные. Какие данные спрятаны на госсайтах
Скрытые данные. Какие данные спрятаны на госсайтахСкрытые данные. Какие данные спрятаны на госсайтах
Скрытые данные. Какие данные спрятаны на госсайтах
 
Где взять данные дата-журналисту?
Где взять данные дата-журналисту?Где взять данные дата-журналисту?
Где взять данные дата-журналисту?
 
Умное государство. Миф или антиутопия?
Умное государство. Миф или антиутопия?Умное государство. Миф или антиутопия?
Умное государство. Миф или антиутопия?
 
Открытые и большие государственные данные и их практическая применимость
Открытые и большие государственные данные и их практическая применимостьОткрытые и большие государственные данные и их практическая применимость
Открытые и большие государственные данные и их практическая применимость
 

Иван Бегтин "Цифровые архивы"

  • 1. Цифровые архивы Иван Бегтин Директор АНО “Информационная культура”
  • 2. Что такое “born-digital”? Термин “рожденный в цифре” относится к материалам который изначально создаются в цифровой форме.[1] [1] https://en.wikipedia.org/wiki/Born-digital
  • 3. Что такое цифровая архивация? • Архивация материалов созданных изначально в цифровом виде • Долгосрочное хранение материалов по новейшей истории • Долгосрочное хранение научных исследований и данных
  • 7. Национальные архивы и библиотеки • Национальная библиотека Испании • Национальная библиотека Каталонии • Национальная библиотека Германии • Национальная библиотека Эстонии … И многие библиотеки члены IIPC (International Internet Preservation Consortium
  • 10. Основные приоритеты • Принципы аналогичные ArchiveTeam. Приоритет “умирающим ресурсам” • “Консервированное государство”. Архивация всех государственных сайтов и сайтов сделанных на государственные средства • Специализированные проекты: • Цифровое культурное наследие • Цифровой научный архив • и многое другое
  • 11. Текущий статус • 8 терабайт сжатых данных • более 500 сохраненных сайтов • регулярное пополнение • подготовка масштабной инфраструктуры для непрерывной архивации (Nutch + Heritrix) • расходы: около 10 тысяч рублей в месяц, свои средства и краудфандинг • нет удобного интерфейса • нет непрерывного сохранения • не охвачены другие цифровые ресурсы
  • 12. Что дальше? • Тройное резервирование всего сохраненного • Непрерывная архивация всех сайтов государства • Краудфандинговая кампания на хостинг и резервирование • Запуск подпроектов по архивации цифрового культурного наследия, избирательных кампаний и тд.
  • 13. Как помочь? • Пожертвовать на проект на archive.infoculture.ru • Присылать адреса сайтов которые точно надо сохранить • Помочь найти бесплатное или дешевое хранилище от 100 терабайт и выше – лучше сразу 1 петабайт • Помочь в разработке инструментов архивации соцсетей: Facebook, Twitter, OK, VK, Telegram и тд • Помогать собирать сайты для кампаний по архивации
  • 14. Спасибо за внимание. Иван Бегтин Email: ibegtin@infoculture.ru Сайт: http://infoculture.ru