ЦРТ | Группа компаний

Инженер данных/Data Engineer

Не указана
  • Москва
  • От 3 до 6 лет
  • Spark
  • Apache Spark
  • Apache Airflow
  • Apache Kafka
  • PySpark
ЦРТ - российская аккредитованная продуктовая IT-компания. Являемся лидерами в разработке систем для распознавания и синтеза речи, идентификации личности по голосу и изображению. Наши продукты внедрены в крупных корпорациях по всей России. 75+ стран присутствия продукта на стороне клиента.

Сейчас мы ищем Инженера данных/Data Engineer.

Обязанности:
  • Проектировать и разрабатывать модели данных;

  • Разрабатывать и поддерживать мастер-системы, обеспечивать единую версию правды для ключевых бизнес-объектов;

  • Работать с различными СУБД на стороне заказчика (PostgreSQL, ClickHouse), оптимизировать запросы, проектировать индексы, обеспечивать качество и целостность данных;

  • Проектировать и реализовывать ETL/ELT-пайплайны с использованием Airflow;

  • Развивать архитектуру хранилищ данных (data warehouse, data lake, data mart), интегрировать и мигрировать данные между OLTP и OLAP системами;

  • Проектировать, документировать архитектуру решений, формировать структуру БД, описывать API и участвовать в разработке проектной документации.

Требования:
  • Опыт проектирования моделей данных, понимание нормализации и денормализации;

  • Практика разработки и поддержки мастер-систем;

  • Глубокие знания SQL, опыт работы с разными СУБД, умение оптимизировать запросы и обеспечивать качество данных;

  • Опыт работы с ETL/ELT-процессами, Airflow, Spark, Kafka;

  • Понимание архитектуры хранилищ данных, различий между OLTP и OLAP, опыт миграции и интеграции данных;

  • Навыки проектирования и документирования архитектуры, формирования структуры БД, описания API.