
IMOT.IO
Middle/Senior Data Scientist
- Python
- pandas
- PyTorch
- Natural Language Processing
- SQL
Привет!
Мы делаем SaaS-платформу, которая с помощью ИИ анализирует тысячи телефонных разговоров бизнеса, чтобы он мог извлекать из них инсайты и понимать, что нужно сделать, чтобы расти быстрее.
Пару слов о нас: мы растём на 60% в год, уже работаем с клиниками, EdTech-проектами и девелоперами.
Сейчас мы в поиске Middle/Senior Data Scientist, который повысит точность и глубину анализа коммуникаций, снизит зависимость и затраты на внешние AI-сервисы, улучшит качество расшифровки разговоров и будет адаптировать AI-модели под специфику бизнеса каждого клиента.
Пул задач нашего будущего коллеги:
- Тестирование и оценка LLM-моделей:
* Сравнительный анализ эффективности различных LLM (как проприетарных, типа GPT, так и open-source, like Mistral, Llama) для задач классификации, извлечения сущностей (NER), суммаризации и анализа тональности в текстах диалогов.
* Разработка и поддержка benchmark-системы и датасетов для оценки качества моделей на релевантных бизнес-задачах.
* Анализ "галлюцинаций" и ошибок моделей, подготовка отчетов для команды.
- Разработка и улучшение NLP-моделей:
* Дообучение (fine-tuning) и промт-инжиниринг готовых LLM под специфические домены и задачи клиентов.
* Оптимизация производительности и стоимости работы с LLM-API.
* Разработка и поддержка алгоритмов на основе словарей (rule-based systems) и их гибридизация с ML-подходами.
- Работа с STT (Speech-to-Text) моделями:
* Тестирование и выбор лучших STT-решений (как облачных, так и локальных) для русского и других языков.
* Анализ и обработка ошибок транскрибации, их влияние на последующий анализ.
* Возможное дообучение STT-моделей на специфическую терминологию клиентов.
- Взаимодействие с командой:
* Тесная работа с разработчиками для интеграции моделей в продукт.
* Участие в проектировании архитектуры AI-компонентов продукта.
Мы ожидаем, что у тебя есть опыт работы в Data Science/Machine Learning от 3 лет, глубокие знания и практический опыт работы с Natural Language Processing (NLP), а также
- Опыт работы с LLM (Large Language Models): fine-tuning, prompt engineering, оценка качества.
- Знание современных фреймворков для ML: Python, PyTorch/TensorFlow, Hugging Face (Transformers, Datasets, Evaluate).
- Умение работать с данными: уверенное владение Pandas, NumPy, SQL для предобработки и анализа.
- Понимание принципов работы STT систем, опыт их тестирования и сравнения.
- Знание классических методов ML и NLP (линейные модели, деревья решений, TF-IDF, BERT и т.д.).
Мы предлагаем:
-
Трудоустройство согласно ТК РФ, белая ЗП;
-
Групповые занятия английским после окончания испытательного срока;
-
Обучение за счет компании – курсы, тренинги, семинары, конференции;
-
Адекватное руководство, лояльное к любым полезным инициативам.