SlideShare a Scribd company logo
1 of 22
Download to read offline
HDFS Shell
$hdfs dfs -<command> -<option> <URI>
$hdfs dfs –ls /
URI
hdfs://localhost:8020/user/home
scheme authority HDFS path
• Local:
$hdfs dfs -ls file:///to/path/file3
• HDFS:
$hdfs dfs -ls hdfs://localhost/to/path/dir
• fs.default.name=hdfs://localhost
$hdfs dfs -ls /to/path/dir
Команды в shell
• Похожие на команды Unix:
cat, rm, ls, du, ….
• Поддержка специфичных для HDFS операций
setrep - смена фактора репликации
Команда help
• Вывод списка команд
$ hdfs dfs –help
• Показать информацию по команде
$ hdfs dfs -help <command_name>
Основные команды в shell
ls – листинг директории и статистика файлов
[cloudera@localhost ~]$ hdfs dfs -ls /user/cloudera/wordcount/output
Found 3 items
-rw-r--r-- 3 cloudera cloudera 0 2014-03-15 11:56
/user/cloudera/wordcount/output/_SUCCESS
drwxr-xr-x - cloudera cloudera 0 2014-03-15 11:56
/user/cloudera/wordcount/output/_logs
-rw-r--r-- 3 cloudera cloudera 31 2014-03-15 11:56
/user/cloudera/wordcount/output/part-00000
Основные команды в shell
mkdir – создать директорию
$hdfs dfs –mkdir /data/new_path
Чтение файлов в shell
cat – вывод источника в stdout
– Весь файл: $hdfs dfs -cat /dir/file.txt
– Полезно вывод перенаправить через pipe в less,
head, tail и т.д.
– Получить первые 100 строк из файла:
$hdfs dfs -cat /dir/file.txt | head -n 100
Чтение файлов в shell
text – аналог cat, но разархивирует архивы:
$hdfs dfs -cat /dir/file.gz – непонятный текст
$hdfs dfs -text /dir/file.gz – понятный текст
$hdfs dfs -cat /dir/file.txt = $hdfs dfs -text /dir/file.txt
Чтение файлов в shell
tail – выводит последние строчки файла
$hdfs dfs -cat /dir/file.txt | tail – плохо
$hdfs dfs -tail /dir/file.txt – хорошо
Копирование данных в shell
cp – скопировать файлы из одного места в
другое
$hdfs dfs -cp /dir/file1 /otherDir/file2
! годится только для небольших файлов
Копирование данных в shell
distcp – копирует большие файлы или много
файлов
$hdfs distcp /dir/file1 /otherDir/file2
Копирование данных в shell
mv – перемещение файла из одного места в другое
$hdfs dfs -mv /dir/file1 /dir2
put (copyFromLocal) – копирование локального файла в HDFS
$hdfs dfs -put localfile /dir/file
get (copyToLocal) – копирование файла из HDFS в локальную FS
$hdfs dfs -get /dir/file localfile
Удаление в shell
rm – удалить файл (в корзину)
$hdfs dfs -rm /dir/file
rm -r – удалить рекурсивно директорию
$hdfs dfs -rm -r /dir
Cтатистика в shell
du – размер файла или директории в байтах
$hdfs dfs -du /dir/
du -h – размер файла или директории в
удобно-читаемом формате
$hdfs dfs -du –h /dir/
65M /dir
Остальные команды в shell
• Другие команды
– chmod, chown, count, test и т.д.
• Чтобы узнать больше
– $hdfs dfs -help
– $hdfs dfs -help <command>
Команда fsck
• Проверка неконсистентности файловой системы
• Показывает проблемы
– Отсутствующие блоки
– Недореплицированные блоки
• Не устраняет проблем, только информация
– Namenode попытается автоматически исправить проблемы
• $ hdfs fsck <path>
$ hdfs fsck /
Права в HDFS
• Ограничения на уровне файла/директории
– Сходство с моделью прав в POSIX
– Read (r), Write (w) и Execute (x)
– Разделяется на пользователя, группу и всех остальных
• Права пользователя определяются исходя из прав
той ОС, где он запускает клиентское приложение
• Авторизация через Kerberos
Права в HDFS
[cloudera@localhost ~]$ hadoop fs -ls /user/cloudera/wordcount/output
Found 3 items
-rw-r--r-- 3 cloudera cloudera 0 2014-03-15 11:56
/user/cloudera/wordcount/output/_SUCCESS
drwxr-xr-x - cloudera cloudera 0 2014-03-15 11:56
/user/cloudera/wordcount/output/_logs
-rw-r--r-- 3 cloudera cloudera 31 2014-03-15 11:56
/user/cloudera/wordcount/output/part-00000
Команда DFSAdmin
• Команды для администрирования HDFS
– $hdfs dfsadmin -<command>
– Например: $hdfs dfsadmin –report
• report – отображает статистику по HDFS
• safemode – включение безопасного режима
для проведения административных работ
– Upgrade, backup и т.д.
Балансер HDFS
• Блоки в HDFS могут быть неравномерно
распределены по всем Datanode’ам кластера
• Балансер – это утилита, которая автоматически
анализирует расположение блоков в HDFS и
старается его сбалансировать
$ hdfs balancer

More Related Content

What's hot

Alta Disponibilidade em Linux com Heartbeat e Drbd
Alta Disponibilidade em Linux com Heartbeat e DrbdAlta Disponibilidade em Linux com Heartbeat e Drbd
Alta Disponibilidade em Linux com Heartbeat e DrbdFrederico Madeira
 
Exercício resolvido normalização
Exercício resolvido normalizaçãoExercício resolvido normalização
Exercício resolvido normalizaçãoTicianne Darin
 
Para hacer dfd d fdatos internet
Para hacer dfd   d fdatos internetPara hacer dfd   d fdatos internet
Para hacer dfd d fdatos internetViviana Martín
 
Cours php & Mysql - 1ére partie
Cours php & Mysql - 1ére partieCours php & Mysql - 1ére partie
Cours php & Mysql - 1ére partiekadzaki
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduceAmal Abid
 
Base datos consultasavanzadas-postgres
Base datos consultasavanzadas-postgresBase datos consultasavanzadas-postgres
Base datos consultasavanzadas-postgresIván Delgado
 
[오픈소스컨설팅]레드햇계열리눅스7 운영자가이드 - 기초편
[오픈소스컨설팅]레드햇계열리눅스7 운영자가이드 - 기초편[오픈소스컨설팅]레드햇계열리눅스7 운영자가이드 - 기초편
[오픈소스컨설팅]레드햇계열리눅스7 운영자가이드 - 기초편Ji-Woong Choi
 
How To Analyze Geolocation Data with Hive and Hadoop
How To Analyze Geolocation Data with Hive and HadoopHow To Analyze Geolocation Data with Hive and Hadoop
How To Analyze Geolocation Data with Hive and HadoopHortonworks
 
Something About Dynamic Linking
Something About Dynamic LinkingSomething About Dynamic Linking
Something About Dynamic LinkingWang Hsiangkai
 
Sistemas Distribuídos - Comunicação Distribuída – RPC
Sistemas Distribuídos - Comunicação Distribuída – RPCSistemas Distribuídos - Comunicação Distribuída – RPC
Sistemas Distribuídos - Comunicação Distribuída – RPCAdriano Teixeira de Souza
 
10分で分かるLinuxブロックレイヤ
10分で分かるLinuxブロックレイヤ10分で分かるLinuxブロックレイヤ
10分で分かるLinuxブロックレイヤTakashi Hoshino
 
Sistemas de arquivos
Sistemas de arquivosSistemas de arquivos
Sistemas de arquivosJoao Ferreira
 
Course 102: Lecture 6: Seeking Help
Course 102: Lecture 6: Seeking HelpCourse 102: Lecture 6: Seeking Help
Course 102: Lecture 6: Seeking HelpAhmed El-Arabawy
 
Control de dos led's via Web en tiempo real con Raspberry y Firebase
Control de dos led's via Web en tiempo real con Raspberry y FirebaseControl de dos led's via Web en tiempo real con Raspberry y Firebase
Control de dos led's via Web en tiempo real con Raspberry y FirebaseFabian Velasco
 

What's hot (20)

Alta Disponibilidade em Linux com Heartbeat e Drbd
Alta Disponibilidade em Linux com Heartbeat e DrbdAlta Disponibilidade em Linux com Heartbeat e Drbd
Alta Disponibilidade em Linux com Heartbeat e Drbd
 
Exercício resolvido normalização
Exercício resolvido normalizaçãoExercício resolvido normalização
Exercício resolvido normalização
 
Ext4 filesystem(1)
Ext4 filesystem(1)Ext4 filesystem(1)
Ext4 filesystem(1)
 
Para hacer dfd d fdatos internet
Para hacer dfd   d fdatos internetPara hacer dfd   d fdatos internet
Para hacer dfd d fdatos internet
 
Cours php & Mysql - 1ére partie
Cours php & Mysql - 1ére partieCours php & Mysql - 1ére partie
Cours php & Mysql - 1ére partie
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduce
 
Linux basic commands
Linux basic commandsLinux basic commands
Linux basic commands
 
Base datos consultasavanzadas-postgres
Base datos consultasavanzadas-postgresBase datos consultasavanzadas-postgres
Base datos consultasavanzadas-postgres
 
[오픈소스컨설팅]레드햇계열리눅스7 운영자가이드 - 기초편
[오픈소스컨설팅]레드햇계열리눅스7 운영자가이드 - 기초편[오픈소스컨설팅]레드햇계열리눅스7 운영자가이드 - 기초편
[오픈소스컨설팅]레드햇계열리눅스7 운영자가이드 - 기초편
 
How To Analyze Geolocation Data with Hive and Hadoop
How To Analyze Geolocation Data with Hive and HadoopHow To Analyze Geolocation Data with Hive and Hadoop
How To Analyze Geolocation Data with Hive and Hadoop
 
Applied Computer Science Concepts in Android
Applied Computer Science Concepts in AndroidApplied Computer Science Concepts in Android
Applied Computer Science Concepts in Android
 
Something About Dynamic Linking
Something About Dynamic LinkingSomething About Dynamic Linking
Something About Dynamic Linking
 
Shell Scripting
Shell ScriptingShell Scripting
Shell Scripting
 
Sistemas Distribuídos - Comunicação Distribuída – RPC
Sistemas Distribuídos - Comunicação Distribuída – RPCSistemas Distribuídos - Comunicação Distribuída – RPC
Sistemas Distribuídos - Comunicação Distribuída – RPC
 
10分で分かるLinuxブロックレイヤ
10分で分かるLinuxブロックレイヤ10分で分かるLinuxブロックレイヤ
10分で分かるLinuxブロックレイヤ
 
Sistemas de arquivos
Sistemas de arquivosSistemas de arquivos
Sistemas de arquivos
 
Course 102: Lecture 6: Seeking Help
Course 102: Lecture 6: Seeking HelpCourse 102: Lecture 6: Seeking Help
Course 102: Lecture 6: Seeking Help
 
RPM (LINUX)
RPM (LINUX)RPM (LINUX)
RPM (LINUX)
 
Control de dos led's via Web en tiempo real con Raspberry y Firebase
Control de dos led's via Web en tiempo real con Raspberry y FirebaseControl de dos led's via Web en tiempo real con Raspberry y Firebase
Control de dos led's via Web en tiempo real con Raspberry y Firebase
 
Linux midterm quiz
Linux midterm quizLinux midterm quiz
Linux midterm quiz
 

Similar to 03 - Hadoop. HDFS Shell-команды

Лекция 3. Распределённая файловая система HDFS
Лекция 3. Распределённая файловая система HDFSЛекция 3. Распределённая файловая система HDFS
Лекция 3. Распределённая файловая система HDFSTechnopark
 
Владимир Иванов - Безопасность Unix-подобных ОС
Владимир Иванов - Безопасность Unix-подобных ОСВладимир Иванов - Безопасность Unix-подобных ОС
Владимир Иванов - Безопасность Unix-подобных ОСYandex
 
Василий Устинов - Drupal + Drush
Василий Устинов - Drupal + DrushВасилий Устинов - Drupal + Drush
Василий Устинов - Drupal + DrushDrupalSPB
 
DrupalCafe #1: Екатерина Маршалкина - Права на файлы Drupal в Unix-системах
DrupalCafe #1: Екатерина Маршалкина - Права на файлы Drupal в Unix-системахDrupalCafe #1: Екатерина Маршалкина - Права на файлы Drupal в Unix-системах
DrupalCafe #1: Екатерина Маршалкина - Права на файлы Drupal в Unix-системахDrupalSPB
 
Linux basics. Занятие 3.
Linux basics. Занятие 3. Linux basics. Занятие 3.
Linux basics. Занятие 3. Vikentsi Lapa
 
Linux files, file systems, block devices.
Linux files, file systems, block devices.Linux files, file systems, block devices.
Linux files, file systems, block devices.Vikentsi Lapa
 
Drush - незаменимый инструмент друпал разработчика
Drush - незаменимый инструмент друпал разработчикаDrush - незаменимый инструмент друпал разработчика
Drush - незаменимый инструмент друпал разработчикаValentina Borovaya
 
Мастер-класс по BigData Tools для HappyDev'15
Мастер-класс по BigData Tools для HappyDev'15Мастер-класс по BigData Tools для HappyDev'15
Мастер-класс по BigData Tools для HappyDev'15Alexey Zinoviev
 
Alex Krasheninnikov – Hadoop High Availability
Alex Krasheninnikov – Hadoop High AvailabilityAlex Krasheninnikov – Hadoop High Availability
Alex Krasheninnikov – Hadoop High AvailabilityBadoo Development
 
Александр Крашенинников "Hadoop High Availability: опыт Badoo"
Александр Крашенинников "Hadoop High Availability: опыт Badoo"Александр Крашенинников "Hadoop High Availability: опыт Badoo"
Александр Крашенинников "Hadoop High Availability: опыт Badoo"IT Event
 
О безопасном использовании PHP wrappers
О безопасном использовании PHP wrappersО безопасном использовании PHP wrappers
О безопасном использовании PHP wrappersPositive Hack Days
 
п о файловая система
п о файловая системап о файловая система
п о файловая системаkrasoa2009
 
Drush & Drupal
Drush & DrupalDrush & Drupal
Drush & Drupalzabej
 

Similar to 03 - Hadoop. HDFS Shell-команды (19)

Лекция 3. Распределённая файловая система HDFS
Лекция 3. Распределённая файловая система HDFSЛекция 3. Распределённая файловая система HDFS
Лекция 3. Распределённая файловая система HDFS
 
Владимир Иванов - Безопасность Unix-подобных ОС
Владимир Иванов - Безопасность Unix-подобных ОСВладимир Иванов - Безопасность Unix-подобных ОС
Владимир Иванов - Безопасность Unix-подобных ОС
 
Команды Ms dos
Команды Ms dosКоманды Ms dos
Команды Ms dos
 
Василий Устинов - Drupal + Drush
Василий Устинов - Drupal + DrushВасилий Устинов - Drupal + Drush
Василий Устинов - Drupal + Drush
 
DrupalCafe #1: Екатерина Маршалкина - Права на файлы Drupal в Unix-системах
DrupalCafe #1: Екатерина Маршалкина - Права на файлы Drupal в Unix-системахDrupalCafe #1: Екатерина Маршалкина - Права на файлы Drupal в Unix-системах
DrupalCafe #1: Екатерина Маршалкина - Права на файлы Drupal в Unix-системах
 
Administrarea DSpace
Administrarea DSpaceAdministrarea DSpace
Administrarea DSpace
 
Linux commands
Linux commandsLinux commands
Linux commands
 
Linux basics. Занятие 3.
Linux basics. Занятие 3. Linux basics. Занятие 3.
Linux basics. Занятие 3.
 
89
8989
89
 
Linux files, file systems, block devices.
Linux files, file systems, block devices.Linux files, file systems, block devices.
Linux files, file systems, block devices.
 
Drush - незаменимый инструмент друпал разработчика
Drush - незаменимый инструмент друпал разработчикаDrush - незаменимый инструмент друпал разработчика
Drush - незаменимый инструмент друпал разработчика
 
лекция 2
лекция 2лекция 2
лекция 2
 
Мастер-класс по BigData Tools для HappyDev'15
Мастер-класс по BigData Tools для HappyDev'15Мастер-класс по BigData Tools для HappyDev'15
Мастер-класс по BigData Tools для HappyDev'15
 
Alex Krasheninnikov – Hadoop High Availability
Alex Krasheninnikov – Hadoop High AvailabilityAlex Krasheninnikov – Hadoop High Availability
Alex Krasheninnikov – Hadoop High Availability
 
Александр Крашенинников "Hadoop High Availability: опыт Badoo"
Александр Крашенинников "Hadoop High Availability: опыт Badoo"Александр Крашенинников "Hadoop High Availability: опыт Badoo"
Александр Крашенинников "Hadoop High Availability: опыт Badoo"
 
О безопасном использовании PHP wrappers
О безопасном использовании PHP wrappersО безопасном использовании PHP wrappers
О безопасном использовании PHP wrappers
 
п о файловая система
п о файловая системап о файловая система
п о файловая система
 
Drush & Drupal
Drush & DrupalDrush & Drupal
Drush & Drupal
 
Приручаем linux-консоль
Приручаем linux-консольПриручаем linux-консоль
Приручаем linux-консоль
 

More from Roman Brovko

Individual task Networking
Individual task NetworkingIndividual task Networking
Individual task NetworkingRoman Brovko
 
Networking essentials lect3
Networking essentials lect3Networking essentials lect3
Networking essentials lect3Roman Brovko
 
Gl embedded starterkit_ethernet
Gl embedded starterkit_ethernetGl embedded starterkit_ethernet
Gl embedded starterkit_ethernetRoman Brovko
 
Networking essentials lect2
Networking essentials lect2Networking essentials lect2
Networking essentials lect2Roman Brovko
 
Networking essentials lect1
Networking essentials lect1Networking essentials lect1
Networking essentials lect1Roman Brovko
 
Bare metal training_07_spi_flash
Bare metal training_07_spi_flashBare metal training_07_spi_flash
Bare metal training_07_spi_flashRoman Brovko
 
Bare metal training_06_I2C
Bare metal training_06_I2CBare metal training_06_I2C
Bare metal training_06_I2CRoman Brovko
 
Bare metal training_05_uart
Bare metal training_05_uartBare metal training_05_uart
Bare metal training_05_uartRoman Brovko
 
Bare metal training_04_adc_temp_sensor
Bare metal training_04_adc_temp_sensorBare metal training_04_adc_temp_sensor
Bare metal training_04_adc_temp_sensorRoman Brovko
 
Bare metal training_03_timers_pwm
Bare metal training_03_timers_pwmBare metal training_03_timers_pwm
Bare metal training_03_timers_pwmRoman Brovko
 
Bare metal training_02_le_ds_and_buttons
Bare metal training_02_le_ds_and_buttonsBare metal training_02_le_ds_and_buttons
Bare metal training_02_le_ds_and_buttonsRoman Brovko
 
Bare metal training_01_hello_world
Bare metal training_01_hello_worldBare metal training_01_hello_world
Bare metal training_01_hello_worldRoman Brovko
 
Bare metal training_00_prerequisites
Bare metal training_00_prerequisitesBare metal training_00_prerequisites
Bare metal training_00_prerequisitesRoman Brovko
 
C language lect_23_advanced
C language lect_23_advancedC language lect_23_advanced
C language lect_23_advancedRoman Brovko
 
C language lect_22_advanced
C language lect_22_advancedC language lect_22_advanced
C language lect_22_advancedRoman Brovko
 
C language lect_21_advanced
C language lect_21_advancedC language lect_21_advanced
C language lect_21_advancedRoman Brovko
 
подготовка рабочего окружения
подготовка рабочего окруженияподготовка рабочего окружения
подготовка рабочего окруженияRoman Brovko
 
C language lect_20_advanced
C language lect_20_advancedC language lect_20_advanced
C language lect_20_advancedRoman Brovko
 
C language lect_19_basics
C language lect_19_basicsC language lect_19_basics
C language lect_19_basicsRoman Brovko
 

More from Roman Brovko (20)

Individual task Networking
Individual task NetworkingIndividual task Networking
Individual task Networking
 
Networking essentials lect3
Networking essentials lect3Networking essentials lect3
Networking essentials lect3
 
Gl embedded starterkit_ethernet
Gl embedded starterkit_ethernetGl embedded starterkit_ethernet
Gl embedded starterkit_ethernet
 
Networking essentials lect2
Networking essentials lect2Networking essentials lect2
Networking essentials lect2
 
Networking essentials lect1
Networking essentials lect1Networking essentials lect1
Networking essentials lect1
 
Bare metal training_07_spi_flash
Bare metal training_07_spi_flashBare metal training_07_spi_flash
Bare metal training_07_spi_flash
 
Bare metal training_06_I2C
Bare metal training_06_I2CBare metal training_06_I2C
Bare metal training_06_I2C
 
Glesk worshop
Glesk worshopGlesk worshop
Glesk worshop
 
Bare metal training_05_uart
Bare metal training_05_uartBare metal training_05_uart
Bare metal training_05_uart
 
Bare metal training_04_adc_temp_sensor
Bare metal training_04_adc_temp_sensorBare metal training_04_adc_temp_sensor
Bare metal training_04_adc_temp_sensor
 
Bare metal training_03_timers_pwm
Bare metal training_03_timers_pwmBare metal training_03_timers_pwm
Bare metal training_03_timers_pwm
 
Bare metal training_02_le_ds_and_buttons
Bare metal training_02_le_ds_and_buttonsBare metal training_02_le_ds_and_buttons
Bare metal training_02_le_ds_and_buttons
 
Bare metal training_01_hello_world
Bare metal training_01_hello_worldBare metal training_01_hello_world
Bare metal training_01_hello_world
 
Bare metal training_00_prerequisites
Bare metal training_00_prerequisitesBare metal training_00_prerequisites
Bare metal training_00_prerequisites
 
C language lect_23_advanced
C language lect_23_advancedC language lect_23_advanced
C language lect_23_advanced
 
C language lect_22_advanced
C language lect_22_advancedC language lect_22_advanced
C language lect_22_advanced
 
C language lect_21_advanced
C language lect_21_advancedC language lect_21_advanced
C language lect_21_advanced
 
подготовка рабочего окружения
подготовка рабочего окруженияподготовка рабочего окружения
подготовка рабочего окружения
 
C language lect_20_advanced
C language lect_20_advancedC language lect_20_advanced
C language lect_20_advanced
 
C language lect_19_basics
C language lect_19_basicsC language lect_19_basics
C language lect_19_basics
 

03 - Hadoop. HDFS Shell-команды

  • 2. $hdfs dfs -<command> -<option> <URI> $hdfs dfs –ls /
  • 4. • Local: $hdfs dfs -ls file:///to/path/file3 • HDFS: $hdfs dfs -ls hdfs://localhost/to/path/dir • fs.default.name=hdfs://localhost $hdfs dfs -ls /to/path/dir
  • 5. Команды в shell • Похожие на команды Unix: cat, rm, ls, du, …. • Поддержка специфичных для HDFS операций setrep - смена фактора репликации
  • 6. Команда help • Вывод списка команд $ hdfs dfs –help • Показать информацию по команде $ hdfs dfs -help <command_name>
  • 7. Основные команды в shell ls – листинг директории и статистика файлов [cloudera@localhost ~]$ hdfs dfs -ls /user/cloudera/wordcount/output Found 3 items -rw-r--r-- 3 cloudera cloudera 0 2014-03-15 11:56 /user/cloudera/wordcount/output/_SUCCESS drwxr-xr-x - cloudera cloudera 0 2014-03-15 11:56 /user/cloudera/wordcount/output/_logs -rw-r--r-- 3 cloudera cloudera 31 2014-03-15 11:56 /user/cloudera/wordcount/output/part-00000
  • 8. Основные команды в shell mkdir – создать директорию $hdfs dfs –mkdir /data/new_path
  • 9. Чтение файлов в shell cat – вывод источника в stdout – Весь файл: $hdfs dfs -cat /dir/file.txt – Полезно вывод перенаправить через pipe в less, head, tail и т.д. – Получить первые 100 строк из файла: $hdfs dfs -cat /dir/file.txt | head -n 100
  • 10. Чтение файлов в shell text – аналог cat, но разархивирует архивы: $hdfs dfs -cat /dir/file.gz – непонятный текст $hdfs dfs -text /dir/file.gz – понятный текст $hdfs dfs -cat /dir/file.txt = $hdfs dfs -text /dir/file.txt
  • 11. Чтение файлов в shell tail – выводит последние строчки файла $hdfs dfs -cat /dir/file.txt | tail – плохо $hdfs dfs -tail /dir/file.txt – хорошо
  • 12. Копирование данных в shell cp – скопировать файлы из одного места в другое $hdfs dfs -cp /dir/file1 /otherDir/file2 ! годится только для небольших файлов
  • 13. Копирование данных в shell distcp – копирует большие файлы или много файлов $hdfs distcp /dir/file1 /otherDir/file2
  • 14. Копирование данных в shell mv – перемещение файла из одного места в другое $hdfs dfs -mv /dir/file1 /dir2 put (copyFromLocal) – копирование локального файла в HDFS $hdfs dfs -put localfile /dir/file get (copyToLocal) – копирование файла из HDFS в локальную FS $hdfs dfs -get /dir/file localfile
  • 15. Удаление в shell rm – удалить файл (в корзину) $hdfs dfs -rm /dir/file rm -r – удалить рекурсивно директорию $hdfs dfs -rm -r /dir
  • 16. Cтатистика в shell du – размер файла или директории в байтах $hdfs dfs -du /dir/ du -h – размер файла или директории в удобно-читаемом формате $hdfs dfs -du –h /dir/ 65M /dir
  • 17. Остальные команды в shell • Другие команды – chmod, chown, count, test и т.д. • Чтобы узнать больше – $hdfs dfs -help – $hdfs dfs -help <command>
  • 18. Команда fsck • Проверка неконсистентности файловой системы • Показывает проблемы – Отсутствующие блоки – Недореплицированные блоки • Не устраняет проблем, только информация – Namenode попытается автоматически исправить проблемы • $ hdfs fsck <path> $ hdfs fsck /
  • 19. Права в HDFS • Ограничения на уровне файла/директории – Сходство с моделью прав в POSIX – Read (r), Write (w) и Execute (x) – Разделяется на пользователя, группу и всех остальных • Права пользователя определяются исходя из прав той ОС, где он запускает клиентское приложение • Авторизация через Kerberos
  • 20. Права в HDFS [cloudera@localhost ~]$ hadoop fs -ls /user/cloudera/wordcount/output Found 3 items -rw-r--r-- 3 cloudera cloudera 0 2014-03-15 11:56 /user/cloudera/wordcount/output/_SUCCESS drwxr-xr-x - cloudera cloudera 0 2014-03-15 11:56 /user/cloudera/wordcount/output/_logs -rw-r--r-- 3 cloudera cloudera 31 2014-03-15 11:56 /user/cloudera/wordcount/output/part-00000
  • 21. Команда DFSAdmin • Команды для администрирования HDFS – $hdfs dfsadmin -<command> – Например: $hdfs dfsadmin –report • report – отображает статистику по HDFS • safemode – включение безопасного режима для проведения административных работ – Upgrade, backup и т.д.
  • 22. Балансер HDFS • Блоки в HDFS могут быть неравномерно распределены по всем Datanode’ам кластера • Балансер – это утилита, которая автоматически анализирует расположение блоков в HDFS и старается его сбалансировать $ hdfs balancer