Ростелеком

Middle Data Scientist разработчик NLP/OCR/CV/Audio

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 1 года до 3 лет
  • Python
  • OCR
  • CV
  • NLP
  • Машинное обучение
  • Алгоритмы и структуры данных

Основным направлением работы команды является полная автоматизация рабочих процессов с помощью ИИ.

В реализации задач мы применяем как проверенную базу, так и sota-архитектуры и методы, прямые руки и инженерный подход. Разрабатываем и внедряем промышленные решения полного цикла - от идеи до вывода в эксплуатацию. Реализуем весьма амбициозные цели по метрикам и sla.

Обязанности:

  • Проработка архитектуры ИИ-пайплайна;
  • Сбор, подготовка и разметка данных из внутренних и внешних источников;
  • Обучение моделей, валидация и разбор ошибок;
  • Разработка прод. кода итогового технического решения, взаимодействие с DE по интеграциям;
  • Совместное с аналитиками ведение актуальной документации, уточнение постановки;
  • Мониторинг уровня доступности и качества запущенных сервисов.

При погружении в рабочие процессы и на первых этапах предполагается работа с наставником.

Требования:

  • Мы работаем в основном с контрольной/финансовой сферой и ИБ, для нас критична последовательность, обязательность, аккуратность и внимание к деталям;
  • Опыт программирования Python, знание torch;
  • Практический опыт применения в рабочих задачах OCR/CV/NLP/Audio моделей;
  • Понимание основ машинного обучения и метрик, базовой статистики;
  • Отлично, если есть опыт пром. разработки

Условия:

  • Удаленка или гибрид (по согласованию) и исходя из фактического места жительства;
  • Рабочие станции с современными GPU;
  • Прозрачность карьерного трека;
  • Возможность бронирования от военной службы