Датаджайл

ML-инженер в области информационной безопасности

Не указана
  • Санкт-Петербург
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет

Datagile - продуктовая компания. Основное наше направление - это разработка продуктов в сфере информационной безопасности, автоматизации и баз данных.

Основные задачи:

  • Разработка и внедрение моделей машинного обучения для автоматизации анализа данных в системах информационной безопасности (SIEM, SOAR, IDS/IPS).
  • Создание алгоритмов для:
  1. Обнаружения и предотвращения атак (DDoS, фишинг, malware, ботнеты).
  2. Выявления аномалий в сетевом трафике и журналах событий.
  3. Классификации угроз и их приоритизации на основе данных.
  • Построение аналитических решений для анализа инцидентов и предсказания потенциальных угроз.
  • Разработка и поддержка ML-решений для анализа сетевых пакетов и метаданных (PCAP файлы, протоколы HTTP/S, DNS, FTP и др.).
  • Интеграция разработанных моделей в системы мониторинга и реагирования.
  • Построение архитектуры больших данных для хранения, обработки и анализа логов безопасности.
  • Исследование и внедрение новых подходов для повышения производительности и точности моделей.

Требования к кандидату:

1. Опыт работы:

  • 3+ года опыта работы в области машинного обучения или анализа данных.
  • 2+ года опыта в кибербезопасности, включая практическое применение ML-решений.
  • Участие в проектах, связанных с анализом данных о безопасности (логи, сетевой трафик, поведение пользователей).

2. Технические навыки:

Машинное обучение и обработка данных:

  • Опыт построения моделей классификации (Random Forest, XGBoost, CatBoost, LightGBM, SVM, нейронные сети).
  • Навыки в обнаружении аномалий (Autoencoders, Isolation Forest, PCA).
  • Глубокое обучение (RNN, LSTM, CNN) для временных рядов и потоков данных.
  • Опыт работы с ML-фреймворками: TensorFlow, PyTorch, Scikit-learn.
  • Работа с временными рядами и потоковыми данными (Apache Kafka, Spark Streaming).

3. Инженерия данных и MLOps:

  • Проектирование ETL-пайплайнов, работа с большими данными (Hadoop, Spark, Elasticsearch).
  • Интеграция моделей в микросервисные архитектуры (REST API, gRPC).
  • Контейнеризация и оркестрация: Docker, Kubernetes, CI/CD.
  • Использование инструментов MLOps: MLFlow, Airflow, DVC, Kubeflow.

4. Кибербезопасность:

  • Понимание сетевых протоколов (TCP/IP, DNS, HTTP/S).
  • Знание MITRE ATT&CK, OWASP Top 10, CVSS.
  • Анализ логов и трафика с использованием инструментов Wireshark, Zeek, Suricata.

Программирование:

  • Владение Python (основной язык разработки), желательно опыт работы с Golang и Rust для задач высокой производительности.
  • Работа с реляционными и нереляционными базами данных (PostgreSQL, MongoDB, СlickHouse, Redis).

Математика и алгоритмы:

  • Теория вероятностей, статистика, линейная алгебра.
  • Методы оптимизации: градиентный спуск, регуляризация.
  • Теория графов для анализа сетей.

5. Soft Skills:

  • Способность объяснять сложные концепции.
  • Умение эффективно работать в команде.
  • Высокая самоорганизация.

Работа в Datagile это:
Наставничество, работа в команде экспертов, внешнее обучение и профессиональные конференции за счет компании, компенсация занятий иностранным языком;

Работа с комфортом: формат на выбор - удаленно из любой точки, офис, гибрид. Гибкое начало рабочего дня (обязательные часы присутствия с 11-16 по МСК), техника для работы;

Забота о здоровье: ДМС с психологом, офисный врач, компенсация занятий спортом, хобби или любых других увлечений, зона отдыха в офисе (чай/кофе/печеньки);

Забота о близких: Подарки детям на праздники, дотации на приобретение детских путевок в лагерь, материальная поддержка в важные периоды жизни;

Для общения: Корпоративные мероприятия, сквош, футбол, настольные игры в офисе;

Стабильность: Аккредитованная ИТ компания, официальное трудоустройство по ТК РФ, ежеквартальные премии, работа над масштабными проектами.