SlideShare a Scribd company logo
Организация хранения
данных
Николай Мишин
01.04.2014
Память компьютера: классификация
Скорость
работы
Стоимость
ОЗУ
Жесткие диски, SSD
Основная
память
кэш ЦПУ
Дополнительная
память
Дополнительная память
Минусы:
- Медленная скорость работы.
- Недолговечность.
Плюсы:
- Относительная дешевизна.
- Объем.
RAID (redundant array of independent disks — избыточный массив
независимых дисков)
Служит для повышения надёжности хранения данных и/или для
повышения скорости чтения/записи.
0 — striping — чередование блоков
1 — mirroring — зеркалирование
2 — чередование битов с кодом Хэмминга
3 — контрольный байт на отдельном диске
4 — контрольный блок на отдельном диске
5 — контрольный блок
на одном из дисков (с чередованием)
6 — 2 контрольных блока (с чередованием)
RAID 0 дисковый массив из двух или
более жёстких дисков без
резервирования (т.е., по сути RAID-
массивом не является). Информация
разбивается на блоки данных
фиксированной длины и записывается
на оба/несколько дисков одновременно.
(+)За счёт этого существенно
повышается производительность (от
количества дисков зависит кратность
увеличения производительности).
(-)Надёжность RAID 0 заведомо ниже
надёжности любого из дисков в
отдельности.
RAID 1 (mirroring —
«зеркалирование») — массив из
двух дисков, являющихся полными
копиями друг друга. Не следует
путать с массивами RAID 1+0, RAID
0+1 и RAID 10, в которых
используется более двух дисков и
более сложные механизмы
зеркалирования.
Отказоустойчивый дисковый массив с использованием кода Хемминга
Hamming Code ECC
RAID 2 - Отказоустойчивый дисковый массив с использованием кода
Хемминга Hamming Code ECC.
Массивы такого типа основаны на использовании кода Хемминга. Диски
делятся на две группы: для данных и для кодов коррекции ошибок.
Данные распределяются по дискам, предназначенным для хранения
информации, так же, как и в RAID 0.
Оставшиеся диски хранят коды коррекции ошибок, по которым в случае
выхода какого-либо жёсткого диска из строя возможно восстановление
информации. Метод Хемминга давно применяется в памяти типа ECC и
позволяет на лету исправлять однократные и обнаруживать двукратные
ошибки.
Достоинством массива RAID 2 является повышение скорости дисковых
операций по сравнению с производительностью одного диска.
Недостатком массива RAID 2 является то, что минимальное количество
дисков, при котором имеет смысл его использовать,— 7.
RAID 3 отказоустойчивый дисковый
массив с параллельной передачей
данных и четностью (Parallel
Transfer Disks with Parity)
В массиве RAID 3 из n дисков
данные разбиваются на куски
размером меньше сектора
(разбиваются на байты) и
распределяются по n - 1 дискам.
Ещё один диск используется для
хранения блоков чётности.
Отличия RAID 3 от RAID 2:
невозможность коррекции ошибок
на лету и меньшая избыточность.
RAID 4 похож на RAID 3, но
отличается от него тем, что данные
разбиваются на блоки, а не на
байты. Таким образом, удалось
отчасти «победить» проблему
низкой скорости передачи данных
небольшого объёма. Запись же
производится медленно из-за того,
что чётность для блока
генерируется при записи и
записывается на единственный
диск.
RAID 5 Отказоустойчивый массив
независимых дисков с
распределенной четностью.
Основным недостатком уровней
RAID от 2-го до 4-го является
невозможность производить
параллельные операции записи,
так как для хранения информации
о чётности используется
отдельный контрольный диск.
Получил широкое
распространение, в первую
очередь, благодаря своей
экономичности.
RAID 6 Отказоустойчивый массив
независимых дисков с двумя
независимыми распределенными
схемами четности.
RAID 6 — похож на RAID 5, но
имеет более высокую степень
надёжности — под контрольные
суммы выделяется ёмкость 2-х
дисков, рассчитываются 2 суммы
по разным алгоритмам.
Для организации массива
требуется минимум 4 диска.
XOR - Сложение по модулю 2
0 XOR 0 = 0
0 XOR 1 = 1
1 XOR 0 = 1
1 XOR 1 = 0
Пример
Drive #1: 00101010 (Data)
Drive #2: 10001110 (Data)
Drive #3: 11110111 (Data)
Drive #4: 10110101 (Data)
Drive #5: -------- (Hot spare)
Drive #6: -------- (Parity)
Пример
Drive #1: 00101010 (Data)
Drive #2: 10001110 (Data)
Drive #3: 11110111 (Data)
Drive #4: 10110101 (Data)
Drive #5: -------- (Hot spare)
Drive #6: 11100110 (Parity)
Пример
Drive #1: 00101010 (Data)
Drive #2: 10001110 (Data)
Drive #3: --Dead-- (Data)
Drive #4: 10110101 (Data)
Drive #5: -------- (Hot spare)
Drive #6: 11100110 (Parity)
*SCT Error Recovery Control
Пример
Drive #1: 00101010 (Data)
Drive #2: 10001110 (Data)
Drive #3: --Dead-- (Data)
Drive #4: 10110101 (Data)
Drive #5: 11110111 (Hot spare)
Drive #6: 11100110 (Parity)
SCT Error Recovery Control
Управления поведением диска при ошибках называется: SCT ERC. Это
расшифровывается как SCT Error Recovery Control. SCT в свою очередь
название общего протокола SMART Command Transport.
Посмотреть, поддерживает ли жёсткий диск управление ошибками можно
с помощью команды smartctl -a /dev/sdxx строчка SCT capabilities:
SCT capabilities: (0x303f) SCT Status supported.
SCT Error Recovery Control supported. *****
SCT Feature Control supported.
Если строчки нет — диск их (команды) не поддерживает.
Комбинированные уровни RAID
Помимо базовых уровней RAID 0 - RAID 6, существуют комбинированные
уровни с названиями вида «RAID α+β» или «RAID αβ», что обычно
означает «RAID β, составленный из нескольких RAID α» (иногда
производители интерпретируют это по-своему).
Например:
● RAID 10 (или 1+0) — это RAID 0, составленный из нескольких (или
хотя бы двух) RAID 1 (зеркалированных пар).
● RAID 51 — RAID 1, зеркалирующий два RAID 5 .
RAID 1+0 — чередование зеркал.
Эта архитектура представляет
собой массив типа RAID 0,
сегментами которого вместо
отдельных дисков являются
массивы RAID 1.
RAID 10 объединяет в себе
высокую отказоустойчивость и
производительность.
Для данного уровня RAID
возможно сохранение целостности
данных при выходе из строя
половины дисков *
Программный RAID в Linux
mdadm
– RAID 0, 1, 4, 5, 6, 10
mdadm --create /dev/md0 --level=1 --raid-devices=2 /dev/sd[ab]1
cat /proc/mdstat
mkfs.ext4 /dev/md0
Реализация хранения в Linux
Блоковые устройства: /dev/sda, /dev/sdb, …
Разбиение на разделы: /dev/sda1, /dev/sda2
Монтирование разделов: /etc/fstab
монтировать можно по:
- имени устройства /dev/sda1, /dev/sda2
- по UUID (уникальный идентификатор устройства)
# blkid /dev/hda6
/dev/hda6: UUID="3e6be9de-8139-11d1-9106-a43f08d823a6" TYPE="ext2"
- по метке
# e2label /dev/hda6 BACKUPDISK
Недостатки разделов
Трудно увеличивать и уменьшать
Должны быть непрерывными
Привязаны к диску — неудобно переносить
Менеджер логических томов LVM2
Возможности LVM:
● Зеркалирование и чередование
● Увеличение и уменьшение томов
● Перенос между физическими дисками
● Моментальные снимки для чтения и записи
Терминология
sda1 sda2 sdb sdc <-- PV, Physical volume, физический том.
| | | |
| | | |
+--------+- VG00 -+-------+ <-- VG, Volume group, группа томов.
|
+-------+--------+-----------+
| | | |
root usr home var <-- LV, Logical volume, логический том.
| | | |
ext3 reiserfs reiserfs xfs <-- Файловые системы
Ссылки
RAID wikipedia
LVM xgu.ru
Яндекс лекция: Системы хранения данных
SCT Error Recovery Control

More Related Content

What's hot

Масштабируемые решения для резервного копирования и архивирования с гарантиро...
Масштабируемые решения для резервного копирования и архивирования с гарантиро...Масштабируемые решения для резервного копирования и архивирования с гарантиро...
Масштабируемые решения для резервного копирования и архивирования с гарантиро...
Fujitsu Russia
 
Cassandra: быстрая запись данных в высоконагруженных системах
Cassandra: быстрая запись данных в высоконагруженных системахCassandra: быстрая запись данных в высоконагруженных системах
Cassandra: быстрая запись данных в высоконагруженных системахAlexander Mezhov
 
HP 3PAR StoreServ 7200
HP 3PAR StoreServ 7200HP 3PAR StoreServ 7200
HP 3PAR StoreServ 7200
Vyacheslav Tretyakov
 
49
4949
49JIuc
 
Обработка дедлоков в MySql
Обработка дедлоков в MySqlОбработка дедлоков в MySql
Обработка дедлоков в MySqlspariev
 
Сергей Париев - "обработка дедлоков в MySql"
Сергей Париев - "обработка дедлоков в MySql"Сергей Париев - "обработка дедлоков в MySql"
Сергей Париев - "обработка дедлоков в MySql"
railsclub
 
Afterparty forensics (24.03) MEPHI
Afterparty forensics (24.03) MEPHIAfterparty forensics (24.03) MEPHI
Afterparty forensics (24.03) MEPHIygoltsev
 
Система Хранения Оригиналов Документов
Система Хранения Оригиналов ДокументовСистема Хранения Оригиналов Документов
Система Хранения Оригиналов Документов
Gregory Vlasov
 
Обзор Btrfs
Обзор BtrfsОбзор Btrfs
Обзор Btrfs
OSLL
 
Владимир Иванов - Безопасность Unix-подобных ОС
Владимир Иванов - Безопасность Unix-подобных ОСВладимир Иванов - Безопасность Unix-подобных ОС
Владимир Иванов - Безопасность Unix-подобных ОСYandex
 
распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2
распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2
распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2rit2011
 
Анализ и оценка систем адресации данных в современных ЭВМ
Анализ и оценка систем адресации данных в современных ЭВМАнализ и оценка систем адресации данных в современных ЭВМ
Анализ и оценка систем адресации данных в современных ЭВМ
Sergey Gerasimov
 
Разработка высокопроизводительных серверных приложений для Linux/Unix (Алекса...
Разработка высокопроизводительных серверных приложений для Linux/Unix (Алекса...Разработка высокопроизводительных серверных приложений для Linux/Unix (Алекса...
Разработка высокопроизводительных серверных приложений для Linux/Unix (Алекса...Ontico
 
Механика DDoS (Александр Крижановский)
Механика DDoS (Александр Крижановский)Механика DDoS (Александр Крижановский)
Механика DDoS (Александр Крижановский)Ontico
 
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...rit2011
 
Новое поколение унифицированных систем хранения Hitachi
Новое поколение унифицированных систем хранения HitachiНовое поколение унифицированных систем хранения Hitachi
Новое поколение унифицированных систем хранения Hitachi
КРОК
 
Презентация Защита данных от Dell Software: краткий обзор и планы развития ...
Презентация Защита данных от Dell Software:  краткий обзор и планы  развития ...Презентация Защита данных от Dell Software:  краткий обзор и планы  развития ...
Презентация Защита данных от Dell Software: краткий обзор и планы развития ...
Marina Gryshko
 

What's hot (20)

Масштабируемые решения для резервного копирования и архивирования с гарантиро...
Масштабируемые решения для резервного копирования и архивирования с гарантиро...Масштабируемые решения для резервного копирования и архивирования с гарантиро...
Масштабируемые решения для резервного копирования и архивирования с гарантиро...
 
Cassandra: быстрая запись данных в высоконагруженных системах
Cassandra: быстрая запись данных в высоконагруженных системахCassandra: быстрая запись данных в высоконагруженных системах
Cassandra: быстрая запись данных в высоконагруженных системах
 
HP 3PAR StoreServ 7200
HP 3PAR StoreServ 7200HP 3PAR StoreServ 7200
HP 3PAR StoreServ 7200
 
49
4949
49
 
Обработка дедлоков в MySql
Обработка дедлоков в MySqlОбработка дедлоков в MySql
Обработка дедлоков в MySql
 
Сергей Париев - "обработка дедлоков в MySql"
Сергей Париев - "обработка дедлоков в MySql"Сергей Париев - "обработка дедлоков в MySql"
Сергей Париев - "обработка дедлоков в MySql"
 
Afterparty forensics (24.03) MEPHI
Afterparty forensics (24.03) MEPHIAfterparty forensics (24.03) MEPHI
Afterparty forensics (24.03) MEPHI
 
Система Хранения Оригиналов Документов
Система Хранения Оригиналов ДокументовСистема Хранения Оригиналов Документов
Система Хранения Оригиналов Документов
 
Обзор Btrfs
Обзор BtrfsОбзор Btrfs
Обзор Btrfs
 
redundunt array independent disks
redundunt array independent disksredundunt array independent disks
redundunt array independent disks
 
Redudant array independent disks
Redudant array independent disksRedudant array independent disks
Redudant array independent disks
 
Владимир Иванов - Безопасность Unix-подобных ОС
Владимир Иванов - Безопасность Unix-подобных ОСВладимир Иванов - Безопасность Unix-подобных ОС
Владимир Иванов - Безопасность Unix-подобных ОС
 
распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2
распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2
распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2
 
Анализ и оценка систем адресации данных в современных ЭВМ
Анализ и оценка систем адресации данных в современных ЭВМАнализ и оценка систем адресации данных в современных ЭВМ
Анализ и оценка систем адресации данных в современных ЭВМ
 
Data storage systems
Data storage systemsData storage systems
Data storage systems
 
Разработка высокопроизводительных серверных приложений для Linux/Unix (Алекса...
Разработка высокопроизводительных серверных приложений для Linux/Unix (Алекса...Разработка высокопроизводительных серверных приложений для Linux/Unix (Алекса...
Разработка высокопроизводительных серверных приложений для Linux/Unix (Алекса...
 
Механика DDoS (Александр Крижановский)
Механика DDoS (Александр Крижановский)Механика DDoS (Александр Крижановский)
Механика DDoS (Александр Крижановский)
 
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...
 
Новое поколение унифицированных систем хранения Hitachi
Новое поколение унифицированных систем хранения HitachiНовое поколение унифицированных систем хранения Hitachi
Новое поколение унифицированных систем хранения Hitachi
 
Презентация Защита данных от Dell Software: краткий обзор и планы развития ...
Презентация Защита данных от Dell Software:  краткий обзор и планы  развития ...Презентация Защита данных от Dell Software:  краткий обзор и планы  развития ...
Презентация Защита данных от Dell Software: краткий обзор и планы развития ...
 

Viewers also liked

Среды передачи данных. Коаксиал, оптика, витая пара.
Среды передачи данных. Коаксиал, оптика, витая пара.Среды передачи данных. Коаксиал, оптика, витая пара.
Среды передачи данных. Коаксиал, оптика, витая пара.
Oleg Lipin
 
Работа с коммутаторами Cisco. Конфигурирование Ethernet коммутаторов.
Работа с коммутаторами Cisco. Конфигурирование Ethernet коммутаторов.Работа с коммутаторами Cisco. Конфигурирование Ethernet коммутаторов.
Работа с коммутаторами Cisco. Конфигурирование Ethernet коммутаторов.
Oleg Lipin
 
Интеллектуальный уровень доступа как граница кампусной сети.
 Интеллектуальный уровень доступа как граница кампусной сети.  Интеллектуальный уровень доступа как граница кампусной сети.
Интеллектуальный уровень доступа как граница кампусной сети. Cisco Russia
 
VDS: обнаружение, выявление причин и устранение проблемных ситуаций. Диагнос...
VDS: обнаружение, выявление причин и устранение проблемных ситуаций.  Диагнос...VDS: обнаружение, выявление причин и устранение проблемных ситуаций.  Диагнос...
VDS: обнаружение, выявление причин и устранение проблемных ситуаций. Диагнос...
Oleg Lipin
 
Link removals prezzo fin
Link removals prezzo finLink removals prezzo fin
Link removals prezzo fin
Kirsty Hulse
 
Беспроводные локальные сети.
Беспроводные локальные сети.Беспроводные локальные сети.
Беспроводные локальные сети.
Oleg Lipin
 
Топологии сетей. Базовые концепции ethernet коммутации.
Топологии сетей. Базовые концепции ethernet коммутации.Топологии сетей. Базовые концепции ethernet коммутации.
Топологии сетей. Базовые концепции ethernet коммутации.
Oleg Lipin
 
Расчет масок переменной длины (VLSM). Статическая маршрутизация.
Расчет масок переменной длины (VLSM). Статическая маршрутизация.Расчет масок переменной длины (VLSM). Статическая маршрутизация.
Расчет масок переменной длины (VLSM). Статическая маршрутизация.
Oleg Lipin
 
IP адресация, маски и подсети.
IP адресация, маски и подсети.IP адресация, маски и подсети.
IP адресация, маски и подсети.
Oleg Lipin
 
Обзор протоколов динамической маршрутизации
Обзор протоколов динамической маршрутизацииОбзор протоколов динамической маршрутизации
Обзор протоколов динамической маршрутизации
Oleg Lipin
 
Основы IP-адресации и маршрутизации. Основы протокола TCP/IP.
Основы IP-адресации и маршрутизации. Основы протокола TCP/IP.Основы IP-адресации и маршрутизации. Основы протокола TCP/IP.
Основы IP-адресации и маршрутизации. Основы протокола TCP/IP.
Oleg Lipin
 
IP адресация. Расчет масок и подсетей. Практика.
IP адресация. Расчет масок и подсетей. Практика.IP адресация. Расчет масок и подсетей. Практика.
IP адресация. Расчет масок и подсетей. Практика.
Oleg Lipin
 
Сети и системы телекоммуникаций. Wi-Fi
Сети и системы телекоммуникаций. Wi-FiСети и системы телекоммуникаций. Wi-Fi
Сети и системы телекоммуникаций. Wi-Fi
Andrey Sozykin
 
Коммутаторы Cisco Catalyst 2К-4К что нового?
Коммутаторы Cisco Catalyst 2К-4К что нового? Коммутаторы Cisco Catalyst 2К-4К что нового?
Коммутаторы Cisco Catalyst 2К-4К что нового? Cisco Russia
 
Требования к межсетевому экрану нового поколения для предприятий малого и сре...
Требования к межсетевому экрану нового поколения для предприятий малого и сре...Требования к межсетевому экрану нового поколения для предприятий малого и сре...
Требования к межсетевому экрану нового поколения для предприятий малого и сре...
Cisco Russia
 
Learn inbound
Learn inboundLearn inbound
Learn inbound
Kirsty Hulse
 
Vlsm
VlsmVlsm
Vlsm
Taringa!
 

Viewers also liked (18)

Среды передачи данных. Коаксиал, оптика, витая пара.
Среды передачи данных. Коаксиал, оптика, витая пара.Среды передачи данных. Коаксиал, оптика, витая пара.
Среды передачи данных. Коаксиал, оптика, витая пара.
 
Работа с коммутаторами Cisco. Конфигурирование Ethernet коммутаторов.
Работа с коммутаторами Cisco. Конфигурирование Ethernet коммутаторов.Работа с коммутаторами Cisco. Конфигурирование Ethernet коммутаторов.
Работа с коммутаторами Cisco. Конфигурирование Ethernet коммутаторов.
 
Интеллектуальный уровень доступа как граница кампусной сети.
 Интеллектуальный уровень доступа как граница кампусной сети.  Интеллектуальный уровень доступа как граница кампусной сети.
Интеллектуальный уровень доступа как граница кампусной сети.
 
VDS: обнаружение, выявление причин и устранение проблемных ситуаций. Диагнос...
VDS: обнаружение, выявление причин и устранение проблемных ситуаций.  Диагнос...VDS: обнаружение, выявление причин и устранение проблемных ситуаций.  Диагнос...
VDS: обнаружение, выявление причин и устранение проблемных ситуаций. Диагнос...
 
Link removals prezzo fin
Link removals prezzo finLink removals prezzo fin
Link removals prezzo fin
 
нанор
нанорнанор
нанор
 
Беспроводные локальные сети.
Беспроводные локальные сети.Беспроводные локальные сети.
Беспроводные локальные сети.
 
Топологии сетей. Базовые концепции ethernet коммутации.
Топологии сетей. Базовые концепции ethernet коммутации.Топологии сетей. Базовые концепции ethernet коммутации.
Топологии сетей. Базовые концепции ethernet коммутации.
 
Расчет масок переменной длины (VLSM). Статическая маршрутизация.
Расчет масок переменной длины (VLSM). Статическая маршрутизация.Расчет масок переменной длины (VLSM). Статическая маршрутизация.
Расчет масок переменной длины (VLSM). Статическая маршрутизация.
 
IP адресация, маски и подсети.
IP адресация, маски и подсети.IP адресация, маски и подсети.
IP адресация, маски и подсети.
 
Обзор протоколов динамической маршрутизации
Обзор протоколов динамической маршрутизацииОбзор протоколов динамической маршрутизации
Обзор протоколов динамической маршрутизации
 
Основы IP-адресации и маршрутизации. Основы протокола TCP/IP.
Основы IP-адресации и маршрутизации. Основы протокола TCP/IP.Основы IP-адресации и маршрутизации. Основы протокола TCP/IP.
Основы IP-адресации и маршрутизации. Основы протокола TCP/IP.
 
IP адресация. Расчет масок и подсетей. Практика.
IP адресация. Расчет масок и подсетей. Практика.IP адресация. Расчет масок и подсетей. Практика.
IP адресация. Расчет масок и подсетей. Практика.
 
Сети и системы телекоммуникаций. Wi-Fi
Сети и системы телекоммуникаций. Wi-FiСети и системы телекоммуникаций. Wi-Fi
Сети и системы телекоммуникаций. Wi-Fi
 
Коммутаторы Cisco Catalyst 2К-4К что нового?
Коммутаторы Cisco Catalyst 2К-4К что нового? Коммутаторы Cisco Catalyst 2К-4К что нового?
Коммутаторы Cisco Catalyst 2К-4К что нового?
 
Требования к межсетевому экрану нового поколения для предприятий малого и сре...
Требования к межсетевому экрану нового поколения для предприятий малого и сре...Требования к межсетевому экрану нового поколения для предприятий малого и сре...
Требования к межсетевому экрану нового поколения для предприятий малого и сре...
 
Learn inbound
Learn inboundLearn inbound
Learn inbound
 
Vlsm
VlsmVlsm
Vlsm
 

Similar to Организация хранения данных

Тестируем производительность распределённых систем, Александр Киров (Parallels)
Тестируем производительность распределённых систем, Александр Киров (Parallels)Тестируем производительность распределённых систем, Александр Киров (Parallels)
Тестируем производительность распределённых систем, Александр Киров (Parallels)
Ontico
 
Ibm megatrade шиндак xiv v3.0
Ibm megatrade шиндак xiv v3.0Ibm megatrade шиндак xiv v3.0
Ibm megatrade шиндак xiv v3.0Nick Turunov
 
#PostgreSQLRussia в банке Тинькофф, доклад №1
#PostgreSQLRussia в банке Тинькофф, доклад №1#PostgreSQLRussia в банке Тинькофф, доклад №1
#PostgreSQLRussia в банке Тинькофф, доклад №1
Nikolay Samokhvalov
 
02 - Hadoop. Архитектура HDFS
02 - Hadoop. Архитектура HDFS02 - Hadoop. Архитектура HDFS
02 - Hadoop. Архитектура HDFS
Roman Brovko
 
Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)
Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)
Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)
Ontico
 
Погружение в виртуальную память и большие страницы / Константин Новаковский (...
Погружение в виртуальную память и большие страницы / Константин Новаковский (...Погружение в виртуальную память и большие страницы / Константин Новаковский (...
Погружение в виртуальную память и большие страницы / Константин Новаковский (...
Ontico
 
Реактивный раздатчик ok.ru/music
Реактивный раздатчик ok.ru/musicРеактивный раздатчик ok.ru/music
Реактивный раздатчик ok.ru/music
Vadim Tsesko
 
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуреСХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуреDEPO Computers
 
Обзор новых моделей EMC VNX
Обзор новых моделей EMC VNXОбзор новых моделей EMC VNX
Обзор новых моделей EMC VNX
КРОК
 
Современные серверы DEPO Storm и системы хранения DEPO Storage
Современные серверы DEPO Storm и системы хранения DEPO StorageСовременные серверы DEPO Storm и системы хранения DEPO Storage
Современные серверы DEPO Storm и системы хранения DEPO Storage
DEPO Computers
 
Решения DEPO Computers для консолидации данных и серверной виртуализации на б...
Решения DEPO Computers для консолидации данных и серверной виртуализации на б...Решения DEPO Computers для консолидации данных и серверной виртуализации на б...
Решения DEPO Computers для консолидации данных и серверной виртуализации на б...DEPO Computers
 
Solaris OS
Solaris OSSolaris OS
Solaris OS
SSA KPI
 
Флеш в серверах: работа со скоростью вспышки
Флеш в серверах: работа со скоростью вспышкиФлеш в серверах: работа со скоростью вспышки
Флеш в серверах: работа со скоростью вспышки
КРОК
 
Introduction to MongoDB
Introduction to MongoDBIntroduction to MongoDB
Introduction to MongoDBIurii Ogiienko
 
Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)
Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)
Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)
Ontico
 
Решения Dell для защиты данных и оптимизации ресурсов хранения
Решения Dell для защиты данных и оптимизации ресурсов храненияРешения Dell для защиты данных и оптимизации ресурсов хранения
Решения Dell для защиты данных и оптимизации ресурсов хранения
Dell_Russia
 
47
4747
47JIuc
 
XML Native Database на примере SednaXML
XML Native Database на примере SednaXMLXML Native Database на примере SednaXML
XML Native Database на примере SednaXMLSlach
 

Similar to Организация хранения данных (20)

Тестируем производительность распределённых систем, Александр Киров (Parallels)
Тестируем производительность распределённых систем, Александр Киров (Parallels)Тестируем производительность распределённых систем, Александр Киров (Parallels)
Тестируем производительность распределённых систем, Александр Киров (Parallels)
 
Ibm megatrade шиндак xiv v3.0
Ibm megatrade шиндак xiv v3.0Ibm megatrade шиндак xiv v3.0
Ibm megatrade шиндак xiv v3.0
 
Ssd
SsdSsd
Ssd
 
#PostgreSQLRussia в банке Тинькофф, доклад №1
#PostgreSQLRussia в банке Тинькофф, доклад №1#PostgreSQLRussia в банке Тинькофф, доклад №1
#PostgreSQLRussia в банке Тинькофф, доклад №1
 
SECON.Посиделки #16: Cassandra (презентация)
SECON.Посиделки #16: Cassandra (презентация) SECON.Посиделки #16: Cassandra (презентация)
SECON.Посиделки #16: Cassandra (презентация)
 
02 - Hadoop. Архитектура HDFS
02 - Hadoop. Архитектура HDFS02 - Hadoop. Архитектура HDFS
02 - Hadoop. Архитектура HDFS
 
Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)
Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)
Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)
 
Погружение в виртуальную память и большие страницы / Константин Новаковский (...
Погружение в виртуальную память и большие страницы / Константин Новаковский (...Погружение в виртуальную память и большие страницы / Константин Новаковский (...
Погружение в виртуальную память и большие страницы / Константин Новаковский (...
 
Реактивный раздатчик ok.ru/music
Реактивный раздатчик ok.ru/musicРеактивный раздатчик ok.ru/music
Реактивный раздатчик ok.ru/music
 
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуреСХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
СХД DEPO Storage 4600 для консолидации данных в современной IT-инфраструктуре
 
Обзор новых моделей EMC VNX
Обзор новых моделей EMC VNXОбзор новых моделей EMC VNX
Обзор новых моделей EMC VNX
 
Современные серверы DEPO Storm и системы хранения DEPO Storage
Современные серверы DEPO Storm и системы хранения DEPO StorageСовременные серверы DEPO Storm и системы хранения DEPO Storage
Современные серверы DEPO Storm и системы хранения DEPO Storage
 
Решения DEPO Computers для консолидации данных и серверной виртуализации на б...
Решения DEPO Computers для консолидации данных и серверной виртуализации на б...Решения DEPO Computers для консолидации данных и серверной виртуализации на б...
Решения DEPO Computers для консолидации данных и серверной виртуализации на б...
 
Solaris OS
Solaris OSSolaris OS
Solaris OS
 
Флеш в серверах: работа со скоростью вспышки
Флеш в серверах: работа со скоростью вспышкиФлеш в серверах: работа со скоростью вспышки
Флеш в серверах: работа со скоростью вспышки
 
Introduction to MongoDB
Introduction to MongoDBIntroduction to MongoDB
Introduction to MongoDB
 
Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)
Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)
Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)
 
Решения Dell для защиты данных и оптимизации ресурсов хранения
Решения Dell для защиты данных и оптимизации ресурсов храненияРешения Dell для защиты данных и оптимизации ресурсов хранения
Решения Dell для защиты данных и оптимизации ресурсов хранения
 
47
4747
47
 
XML Native Database на примере SednaXML
XML Native Database на примере SednaXMLXML Native Database на примере SednaXML
XML Native Database на примере SednaXML
 

Организация хранения данных

  • 2. Память компьютера: классификация Скорость работы Стоимость ОЗУ Жесткие диски, SSD Основная память кэш ЦПУ Дополнительная память
  • 3. Дополнительная память Минусы: - Медленная скорость работы. - Недолговечность. Плюсы: - Относительная дешевизна. - Объем.
  • 4. RAID (redundant array of independent disks — избыточный массив независимых дисков) Служит для повышения надёжности хранения данных и/или для повышения скорости чтения/записи. 0 — striping — чередование блоков 1 — mirroring — зеркалирование 2 — чередование битов с кодом Хэмминга 3 — контрольный байт на отдельном диске 4 — контрольный блок на отдельном диске 5 — контрольный блок на одном из дисков (с чередованием) 6 — 2 контрольных блока (с чередованием)
  • 5. RAID 0 дисковый массив из двух или более жёстких дисков без резервирования (т.е., по сути RAID- массивом не является). Информация разбивается на блоки данных фиксированной длины и записывается на оба/несколько дисков одновременно. (+)За счёт этого существенно повышается производительность (от количества дисков зависит кратность увеличения производительности). (-)Надёжность RAID 0 заведомо ниже надёжности любого из дисков в отдельности.
  • 6. RAID 1 (mirroring — «зеркалирование») — массив из двух дисков, являющихся полными копиями друг друга. Не следует путать с массивами RAID 1+0, RAID 0+1 и RAID 10, в которых используется более двух дисков и более сложные механизмы зеркалирования.
  • 7. Отказоустойчивый дисковый массив с использованием кода Хемминга Hamming Code ECC
  • 8. RAID 2 - Отказоустойчивый дисковый массив с использованием кода Хемминга Hamming Code ECC. Массивы такого типа основаны на использовании кода Хемминга. Диски делятся на две группы: для данных и для кодов коррекции ошибок. Данные распределяются по дискам, предназначенным для хранения информации, так же, как и в RAID 0. Оставшиеся диски хранят коды коррекции ошибок, по которым в случае выхода какого-либо жёсткого диска из строя возможно восстановление информации. Метод Хемминга давно применяется в памяти типа ECC и позволяет на лету исправлять однократные и обнаруживать двукратные ошибки. Достоинством массива RAID 2 является повышение скорости дисковых операций по сравнению с производительностью одного диска. Недостатком массива RAID 2 является то, что минимальное количество дисков, при котором имеет смысл его использовать,— 7.
  • 9. RAID 3 отказоустойчивый дисковый массив с параллельной передачей данных и четностью (Parallel Transfer Disks with Parity) В массиве RAID 3 из n дисков данные разбиваются на куски размером меньше сектора (разбиваются на байты) и распределяются по n - 1 дискам. Ещё один диск используется для хранения блоков чётности. Отличия RAID 3 от RAID 2: невозможность коррекции ошибок на лету и меньшая избыточность.
  • 10. RAID 4 похож на RAID 3, но отличается от него тем, что данные разбиваются на блоки, а не на байты. Таким образом, удалось отчасти «победить» проблему низкой скорости передачи данных небольшого объёма. Запись же производится медленно из-за того, что чётность для блока генерируется при записи и записывается на единственный диск.
  • 11. RAID 5 Отказоустойчивый массив независимых дисков с распределенной четностью. Основным недостатком уровней RAID от 2-го до 4-го является невозможность производить параллельные операции записи, так как для хранения информации о чётности используется отдельный контрольный диск. Получил широкое распространение, в первую очередь, благодаря своей экономичности.
  • 12. RAID 6 Отказоустойчивый массив независимых дисков с двумя независимыми распределенными схемами четности. RAID 6 — похож на RAID 5, но имеет более высокую степень надёжности — под контрольные суммы выделяется ёмкость 2-х дисков, рассчитываются 2 суммы по разным алгоритмам. Для организации массива требуется минимум 4 диска.
  • 13. XOR - Сложение по модулю 2 0 XOR 0 = 0 0 XOR 1 = 1 1 XOR 0 = 1 1 XOR 1 = 0
  • 14. Пример Drive #1: 00101010 (Data) Drive #2: 10001110 (Data) Drive #3: 11110111 (Data) Drive #4: 10110101 (Data) Drive #5: -------- (Hot spare) Drive #6: -------- (Parity)
  • 15. Пример Drive #1: 00101010 (Data) Drive #2: 10001110 (Data) Drive #3: 11110111 (Data) Drive #4: 10110101 (Data) Drive #5: -------- (Hot spare) Drive #6: 11100110 (Parity)
  • 16. Пример Drive #1: 00101010 (Data) Drive #2: 10001110 (Data) Drive #3: --Dead-- (Data) Drive #4: 10110101 (Data) Drive #5: -------- (Hot spare) Drive #6: 11100110 (Parity) *SCT Error Recovery Control
  • 17. Пример Drive #1: 00101010 (Data) Drive #2: 10001110 (Data) Drive #3: --Dead-- (Data) Drive #4: 10110101 (Data) Drive #5: 11110111 (Hot spare) Drive #6: 11100110 (Parity)
  • 18. SCT Error Recovery Control Управления поведением диска при ошибках называется: SCT ERC. Это расшифровывается как SCT Error Recovery Control. SCT в свою очередь название общего протокола SMART Command Transport. Посмотреть, поддерживает ли жёсткий диск управление ошибками можно с помощью команды smartctl -a /dev/sdxx строчка SCT capabilities: SCT capabilities: (0x303f) SCT Status supported. SCT Error Recovery Control supported. ***** SCT Feature Control supported. Если строчки нет — диск их (команды) не поддерживает.
  • 19. Комбинированные уровни RAID Помимо базовых уровней RAID 0 - RAID 6, существуют комбинированные уровни с названиями вида «RAID α+β» или «RAID αβ», что обычно означает «RAID β, составленный из нескольких RAID α» (иногда производители интерпретируют это по-своему). Например: ● RAID 10 (или 1+0) — это RAID 0, составленный из нескольких (или хотя бы двух) RAID 1 (зеркалированных пар). ● RAID 51 — RAID 1, зеркалирующий два RAID 5 .
  • 20. RAID 1+0 — чередование зеркал. Эта архитектура представляет собой массив типа RAID 0, сегментами которого вместо отдельных дисков являются массивы RAID 1. RAID 10 объединяет в себе высокую отказоустойчивость и производительность. Для данного уровня RAID возможно сохранение целостности данных при выходе из строя половины дисков *
  • 21. Программный RAID в Linux mdadm – RAID 0, 1, 4, 5, 6, 10 mdadm --create /dev/md0 --level=1 --raid-devices=2 /dev/sd[ab]1 cat /proc/mdstat mkfs.ext4 /dev/md0
  • 22. Реализация хранения в Linux Блоковые устройства: /dev/sda, /dev/sdb, … Разбиение на разделы: /dev/sda1, /dev/sda2 Монтирование разделов: /etc/fstab монтировать можно по: - имени устройства /dev/sda1, /dev/sda2 - по UUID (уникальный идентификатор устройства) # blkid /dev/hda6 /dev/hda6: UUID="3e6be9de-8139-11d1-9106-a43f08d823a6" TYPE="ext2" - по метке # e2label /dev/hda6 BACKUPDISK
  • 23. Недостатки разделов Трудно увеличивать и уменьшать Должны быть непрерывными Привязаны к диску — неудобно переносить
  • 24. Менеджер логических томов LVM2 Возможности LVM: ● Зеркалирование и чередование ● Увеличение и уменьшение томов ● Перенос между физическими дисками ● Моментальные снимки для чтения и записи
  • 25. Терминология sda1 sda2 sdb sdc <-- PV, Physical volume, физический том. | | | | | | | | +--------+- VG00 -+-------+ <-- VG, Volume group, группа томов. | +-------+--------+-----------+ | | | | root usr home var <-- LV, Logical volume, логический том. | | | | ext3 reiserfs reiserfs xfs <-- Файловые системы
  • 26.
  • 27.
  • 28. Ссылки RAID wikipedia LVM xgu.ru Яндекс лекция: Системы хранения данных SCT Error Recovery Control