Доступно

[bigdata team] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka

Информация
Тип покупки: Оптовая
Цена: 100 РУБ

Организатор: Pac-Man Pac-Man
Статус:
Доступно
Список участников
  • 1.
    bama
Pac-Man
Pac-Man
Организатор
Сообщения
Монеты
+10.0
Оплачено
100
Купоны
0
Кешбэк
0
Баллы
0
  • @Skladchiki
  • #1

Складчина: [bigdata team] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka

Ссылка на картинку
изображение
Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.

Подробнее о каждом модуле и полезных навыках, которые вы освоите в модуле, мы рассказали ниже.

В этом модуле вы изучите:

▶ подходы к Realtime-обработке;
▶ гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";
▶ Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
▶ архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;
▶ семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.
▶ отличия Key-Value хранилищ от реляционных БД;
▶ компактификация и её виды, CQLSH;
▶ архитектура Cassandra;
▶ обеспечение надёжности и высокодоступности в Key-Value хранилищах;
▶ интеграция Spark с Cassandra.
▶ как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;
▶ trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;
▶ форматы данных в Big Data: ORC vs Parquet, Avro
 
Похожие темы
Просмотры
202
Просмотры
294
Просмотры
313

Зарегистрируйте учетную запись или войдите, чтобы обсуждать и скачивать материалы!

Зарегистрироваться

Создайте учетную запись. Это быстро!

Авторизоваться

Вы уже зарегистрированы? Войдите здесь.

Сверху