
Ростелеком
Middle Data Scientist разработчик NLP/OCR/CV/Audio
Не указана
- Python
- OCR
- CV
- NLP
- Машинное обучение
- Алгоритмы и структуры данных
Основным направлением работы команды является полная автоматизация рабочих процессов с помощью ИИ.
В реализации задач мы применяем как проверенную базу, так и sota-архитектуры и методы, прямые руки и инженерный подход. Разрабатываем и внедряем промышленные решения полного цикла - от идеи до вывода в эксплуатацию. Реализуем весьма амбициозные цели по метрикам и sla.
Обязанности:
- Проработка архитектуры ИИ-пайплайна;
- Сбор, подготовка и разметка данных из внутренних и внешних источников;
- Обучение моделей, валидация и разбор ошибок;
- Разработка прод. кода итогового технического решения, взаимодействие с DE по интеграциям;
- Совместное с аналитиками ведение актуальной документации, уточнение постановки;
- Мониторинг уровня доступности и качества запущенных сервисов.
При погружении в рабочие процессы и на первых этапах предполагается работа с наставником.
Требования:
- Мы работаем в основном с контрольной/финансовой сферой и ИБ, для нас критична последовательность, обязательность, аккуратность и внимание к деталям;
- Опыт программирования Python, знание torch;
- Практический опыт применения в рабочих задачах OCR/CV/NLP/Audio моделей;
- Понимание основ машинного обучения и метрик, базовой статистики;
- Отлично, если есть опыт пром. разработки
Условия:
- Удаленка или гибрид (по согласованию) и исходя из фактического места жительства;
- Рабочие станции с современными GPU;
- Прозрачность карьерного трека;
- Возможность бронирования от военной службы