Hadoop —
набор инструментов для разработки программ и обеспечения среды для их запуска в распределенной среде. Позволяет создавать большие кластеры и упрощает процесс управления ими. Является одним из элементов конвейеров обработки больших данных. Разработан на Java фондом Apache Software Foundation.
Состоит из модулей:
- Common — для связи в единое целое других компонентов.
- HDFS — распределённая файловая система.
- YARN — планирование заданий и управление кластером.
- MapReduce — платформа программирования и выполнения распределённых MapReduce-вычислений.
Преимущества Hadoop:
- Надежность.
- Маштабируемость.
- Отказоустойчивость.
- Портируемость.
Подробнее о Hadoop на Википедии.