Ростелеком Информационные Технологии

MLOps

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет

Мы – РТК ИТ, аккредитованная ИТ компания, оказывающая полный комплекс услуг по разработке и внедрению программных решений.

Каждый день на наших проектах задействовано 4200+ сотрудников, у нас 70+ направлений разработки различных решений. За 11 лет нашей работы мы успешно реализовали более 60 ИТ-продуктов.

О проекте:

Мы создаем передовую платформу, которая позволяет эффективно обучать, тонко настраивать и разворачивать крупномасштабные языковые модели (LLM) и другие NLP-решения. Наша цель — предоставить командам исследователей и бизнес-пользователям инструментарий для работы с современными моделями ИИ в условиях ограниченного доступа к облачным ресурсам.

Чем предстоит заниматься:

- Работа с LLM: Деплой, оптимизация и поддержка open-source моделей (Llama, Mistral, Mixal и др) для инференса в production среде;
- Внедрение продуктов на основе NLP моделей;
- Оптимизация текущих решений с акцентом на производительность и управление нагрузкой (onnx, openvino, tensorrt);
- Оптимизация пайплайна в исполненения на CPU/GPU инфраструктуре с использованием VLLM, Nvidia Triton Server;
- Исследование и прототипирование фреймворков и моделей в области Generative AI.

Что мы ожидаем:

- Опыт в оптимизации инференса (vllm, Triton Inference Server, аналоги);
- Уверенное знание Python и опыт разработки сетевых/асинхронных приложений;
- Опыт Деплоя ML-моделей в production (Docker, K8S, FastAPI/Gradio)
- Внедрения и оценки эффективности решений на основе современных NLP моделей в роли ведущего или лида проекта;

Будет плюсом, но не обязательно:- Знание Docker, CI/CD, и SQL, с готовностью разрабатывать решения с нуля;
-Опыт работы с LLM-моделями;
- Опыт работы с экосистемой Huggin Face (Transformers, PEFI, TRL)
- Знание основ face-tunning трансформеров и адаптивного обучения (Lora, QLora)
- Опыт участия в проектах по внедрению Gen AI-решений.

Мы предлагаем:

- Удаленный или гибридный формат работы;
- Возможность принимать участие в конференциях, проходить обучение за счет компании;
- Полностью "белая" заработная плата: оклад + годовая премия;
- Кафетерий льгот, который искренне любят наши сотрудники;
- График работы гибкий: начало работы с 08:00 до 10:00 МСК, окончание - с 17:00 до 19:00 МСК, Сб-Вс – выходные.