IMOT.IO

Middle/Senior Data Scientist

До 350 000 RUR
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет
  • Python
  • pandas
  • PyTorch
  • Natural Language Processing
  • SQL

Привет!

Мы делаем SaaS-платформу, которая с помощью ИИ анализирует тысячи телефонных разговоров бизнеса, чтобы он мог извлекать из них инсайты и понимать, что нужно сделать, чтобы расти быстрее.

Пару слов о нас: мы растём на 60% в год, уже работаем с клиниками, EdTech-проектами и девелоперами.

Сейчас мы в поиске Middle/Senior Data Scientist, который повысит точность и глубину анализа коммуникаций, снизит зависимость и затраты на внешние AI-сервисы, улучшит качество расшифровки разговоров и будет адаптировать AI-модели под специфику бизнеса каждого клиента.

Пул задач нашего будущего коллеги:

  • Тестирование и оценка LLM-моделей:

* Сравнительный анализ эффективности различных LLM (как проприетарных, типа GPT, так и open-source, like Mistral, Llama) для задач классификации, извлечения сущностей (NER), суммаризации и анализа тональности в текстах диалогов.

* Разработка и поддержка benchmark-системы и датасетов для оценки качества моделей на релевантных бизнес-задачах.

* Анализ "галлюцинаций" и ошибок моделей, подготовка отчетов для команды.

  • Разработка и улучшение NLP-моделей:

* Дообучение (fine-tuning) и промт-инжиниринг готовых LLM под специфические домены и задачи клиентов.

* Оптимизация производительности и стоимости работы с LLM-API.

* Разработка и поддержка алгоритмов на основе словарей (rule-based systems) и их гибридизация с ML-подходами.

  • Работа с STT (Speech-to-Text) моделями:

* Тестирование и выбор лучших STT-решений (как облачных, так и локальных) для русского и других языков.

* Анализ и обработка ошибок транскрибации, их влияние на последующий анализ.

* Возможное дообучение STT-моделей на специфическую терминологию клиентов.

  • Взаимодействие с командой:

* Тесная работа с разработчиками для интеграции моделей в продукт.

* Участие в проектировании архитектуры AI-компонентов продукта.

Мы ожидаем, что у тебя есть опыт работы в Data Science/Machine Learning от 3 лет, глубокие знания и практический опыт работы с Natural Language Processing (NLP), а также

  • Опыт работы с LLM (Large Language Models): fine-tuning, prompt engineering, оценка качества.
  • Знание современных фреймворков для ML: Python, PyTorch/TensorFlow, Hugging Face (Transformers, Datasets, Evaluate).
  • Умение работать с данными: уверенное владение Pandas, NumPy, SQL для предобработки и анализа.
  • Понимание принципов работы STT систем, опыт их тестирования и сравнения.
  • Знание классических методов ML и NLP (линейные модели, деревья решений, TF-IDF, BERT и т.д.).

Мы предлагаем:

  • Трудоустройство согласно ТК РФ, белая ЗП;

  • Групповые занятия английским после окончания испытательного срока;

  • Обучение за счет компании – курсы, тренинги, семинары, конференции;

  • Адекватное руководство, лояльное к любым полезным инициативам.