Интеллектуальные Системы Управления

Data Scientist / Researcher

Не указана
  • Санкт-Петербург
  • Полная занятость
  • Удаленная работа
  • От 1 года до 3 лет

Наша компания занимается разработкой и развитием масштабной AI-системы, которая анализирует различные источники данных — внутренние архивы, архивы, веб, соцсети и многое другое — с целью выявления событий, акторов, геоданных и связей между ними.
Система формирует динамическую базу знаний и временные ряды для анализа корреляций, визуализации взаимосвязей и прогнозирования.

Вы будете работать с многоуровневой архитектурой данных (ETL, временные базы, векторные представления, графовые модели), участвовать в построении пайплайнов обработки и интеграции ML-моделей (NLP, NER, ASR, OCR, CV), а также создании инструментов для анализа, визуализации и поиска/

Мы решаем комплексные задачи: от построения data flow и feature store — до проектирования семантических графов и оркестрации пайплайнов моделей.

Ищем сотрудника на вакансию Data Scientist / Researcher, способного анализировать сложные данные и строить модели, которые влияют на развитие бизнеса.

Обязанности:

  • Проведение исследования данных, построение гипотез, выявление корреляций и связей между переменными

  • Построение графов связей и визуализация сложных структур данных

  • Разработка и внедрение статистических и ML моделей (классификация, кластеризация, прогнозирование)

  • Анализ и подготовка данных для обучения моделей и прототипирование новых методов

  • Построение и оптимизация пайплайнов на Python (Pandas, Scikit-learn, NLP toolkit)

  • Работа с графовыми базами данных (Neo4j), TimescaleDB, и моделями временных рядов (Prophet)

  • Использование NetworkX для анализа сетевых структур, а также библиотеки XGBoost для задач предсказания

  • Необходимый стек:

  • Python, Pandas, Scikit-learn, XGBoost, Prophet

  • NetworkX, Neo4j, TimescaleDB

  • NLP инструменты (управление моделями, обработка текста)

  • Работа с графами связей, временными рядами и ML-моделями

  • Требования:

  • Опыт проведения аналитических исследований и построения ML моделей

  • Навыки построения гипотез и тестирования статистических связей

  • Опыт работы с графовыми базами данных (Neo4j), TimescaleDB

  • Знание Python, навыки работы с Pandas, Scikit-learn, NetworkX

  • Навыки визуализации данных и генерации прототипов

  • Высшее образование в области математики, статистики, информатики или связанных областях

  • Условия:
  • Возможность публикаций и участия в конференциях

  • Работа с крупными массивами данных и сложные аналитические задачи

  • Использование передовых инструментов и технологий

  • Участие в развитии компании, возможность влиять на продукт и процессы компании

  • Достойная, конкурентноспособная заработная плата

  • Удаленная работа, Гибкий график

  • Возможность профессионального развития

Уважаемые соискатели!

В связи с большим количеством поступивших откликов время обработки может быть увеличено. Просим вас отнестись к этому с пониманием.