Datagile - продуктовая компания. Основное наше направление - это разработка продуктов в сфере информационной безопасности, автоматизации и баз данных.
Основные задачи:
- Разработка и внедрение моделей машинного обучения для автоматизации анализа данных в системах информационной безопасности (SIEM, SOAR, IDS/IPS).
- Создание алгоритмов для:
- Обнаружения и предотвращения атак (DDoS, фишинг, malware, ботнеты).
- Выявления аномалий в сетевом трафике и журналах событий.
- Классификации угроз и их приоритизации на основе данных.
- Построение аналитических решений для анализа инцидентов и предсказания потенциальных угроз.
- Разработка и поддержка ML-решений для анализа сетевых пакетов и метаданных (PCAP файлы, протоколы HTTP/S, DNS, FTP и др.).
- Интеграция разработанных моделей в системы мониторинга и реагирования.
- Построение архитектуры больших данных для хранения, обработки и анализа логов безопасности.
- Исследование и внедрение новых подходов для повышения производительности и точности моделей.
Требования к кандидату:
1. Опыт работы:
- 3+ года опыта работы в области машинного обучения или анализа данных.
- 2+ года опыта в кибербезопасности, включая практическое применение ML-решений.
- Участие в проектах, связанных с анализом данных о безопасности (логи, сетевой трафик, поведение пользователей).
2. Технические навыки:
Машинное обучение и обработка данных:
- Опыт построения моделей классификации (Random Forest, XGBoost, CatBoost, LightGBM, SVM, нейронные сети).
- Навыки в обнаружении аномалий (Autoencoders, Isolation Forest, PCA).
- Глубокое обучение (RNN, LSTM, CNN) для временных рядов и потоков данных.
- Опыт работы с ML-фреймворками: TensorFlow, PyTorch, Scikit-learn.
- Работа с временными рядами и потоковыми данными (Apache Kafka, Spark Streaming).
3. Инженерия данных и MLOps:
- Проектирование ETL-пайплайнов, работа с большими данными (Hadoop, Spark, Elasticsearch).
- Интеграция моделей в микросервисные архитектуры (REST API, gRPC).
- Контейнеризация и оркестрация: Docker, Kubernetes, CI/CD.
- Использование инструментов MLOps: MLFlow, Airflow, DVC, Kubeflow.
4. Кибербезопасность:
- Понимание сетевых протоколов (TCP/IP, DNS, HTTP/S).
- Знание MITRE ATT&CK, OWASP Top 10, CVSS.
- Анализ логов и трафика с использованием инструментов Wireshark, Zeek, Suricata.
Программирование:
- Владение Python (основной язык разработки), желательно опыт работы с Golang и Rust для задач высокой производительности.
- Работа с реляционными и нереляционными базами данных (PostgreSQL, MongoDB, СlickHouse, Redis).
Математика и алгоритмы:
- Теория вероятностей, статистика, линейная алгебра.
- Методы оптимизации: градиентный спуск, регуляризация.
- Теория графов для анализа сетей.
5. Soft Skills:
- Способность объяснять сложные концепции.
- Умение эффективно работать в команде.
- Высокая самоорганизация.
Работа в Datagile это:
Наставничество, работа в команде экспертов, внешнее обучение и профессиональные конференции за счет компании, компенсация занятий иностранным языком;
Работа с комфортом: формат на выбор - удаленно из любой точки, офис, гибрид. Гибкое начало рабочего дня (обязательные часы присутствия с 11-16 по МСК), техника для работы;
Забота о здоровье: ДМС с психологом, офисный врач, компенсация занятий спортом, хобби или любых других увлечений, зона отдыха в офисе (чай/кофе/печеньки);
Забота о близких: Подарки детям на праздники, дотации на приобретение детских путевок в лагерь, материальная поддержка в важные периоды жизни;
Для общения: Корпоративные мероприятия, сквош, футбол, настольные игры в офисе;
Стабильность: Аккредитованная ИТ компания, официальное трудоустройство по ТК РФ, ежеквартальные премии, работа над масштабными проектами.