IMOT.IO

Middle/Senior Data Scientist

До 350 000 RUR

Москва
Полная занятость
Удаленная работа
От 3 до 6 лет

Python
pandas
PyTorch
Natural Language Processing
SQL

Привет!

Мы делаем SaaS-платформу, которая с помощью ИИ анализирует тысячи телефонных разговоров бизнеса, чтобы он мог извлекать из них инсайты и понимать, что нужно сделать, чтобы расти быстрее.

Пару слов о нас: мы растём на 60% в год, уже работаем с клиниками, EdTech-проектами и девелоперами.

Сейчас мы в поиске Middle/Senior Data Scientist, который повысит точность и глубину анализа коммуникаций, снизит зависимость и затраты на внешние AI-сервисы, улучшит качество расшифровки разговоров и будет адаптировать AI-модели под специфику бизнеса каждого клиента.

Пул задач нашего будущего коллеги:

Тестирование и оценка LLM-моделей:

* Сравнительный анализ эффективности различных LLM (как проприетарных, типа GPT, так и open-source, like Mistral, Llama) для задач классификации, извлечения сущностей (NER), суммаризации и анализа тональности в текстах диалогов.

* Разработка и поддержка benchmark-системы и датасетов для оценки качества моделей на релевантных бизнес-задачах.

* Анализ "галлюцинаций" и ошибок моделей, подготовка отчетов для команды.

Разработка и улучшение NLP-моделей:

* Дообучение (fine-tuning) и промт-инжиниринг готовых LLM под специфические домены и задачи клиентов.

* Оптимизация производительности и стоимости работы с LLM-API.

* Разработка и поддержка алгоритмов на основе словарей (rule-based systems) и их гибридизация с ML-подходами.

Работа с STT (Speech-to-Text) моделями:

* Тестирование и выбор лучших STT-решений (как облачных, так и локальных) для русского и других языков.

* Анализ и обработка ошибок транскрибации, их влияние на последующий анализ.

* Возможное дообучение STT-моделей на специфическую терминологию клиентов.

Взаимодействие с командой:

* Тесная работа с разработчиками для интеграции моделей в продукт.

* Участие в проектировании архитектуры AI-компонентов продукта.

Мы ожидаем, что у тебя есть опыт работы в Data Science/Machine Learning от 3 лет, глубокие знания и практический опыт работы с Natural Language Processing (NLP), а также

Опыт работы с LLM (Large Language Models): fine-tuning, prompt engineering, оценка качества.
Знание современных фреймворков для ML: Python, PyTorch/TensorFlow, Hugging Face (Transformers, Datasets, Evaluate).
Умение работать с данными: уверенное владение Pandas, NumPy, SQL для предобработки и анализа.
Понимание принципов работы STT систем, опыт их тестирования и сравнения.
Знание классических методов ML и NLP (линейные модели, деревья решений, TF-IDF, BERT и т.д.).

Мы предлагаем:

Трудоустройство согласно ТК РФ, белая ЗП;
Групповые занятия английским после окончания испытательного срока;
Обучение за счет компании – курсы, тренинги, семинары, конференции;
Адекватное руководство, лояльное к любым полезным инициативам.

Источник вакансии

Вернуться, к списку вакансий