Обязанности:
- Разработка и доработка LLM: Проектирование, создание и адаптация больших языковых моделей для решения специфических задач компании.
- Оптимизация моделей: Улучшение производительности и эффективности использования LLM и других ML-моделей на серверном оборудовании (включая работу с k8s).
- Исследование и внедрение: Изучение новых архитектур моделей, методов их тренировки (например, LoRA, QLoRA) и интеграция передовых подходов.
- Работа с ML-инфраструктурой: Применение RAG (Retrieval-Augmented Generation), векторных баз данных и эмбеддинг-моделей для создания продвинутых ИИ-решений.
- Разработка ИИ-решений: Создание кастомных AI-решений для оптимизации производственных процессов и других направлений бизнеса.
- Образование: Высшее техническое или в области ИТ.
- Опыт работы: От 3 до 5 лет в области машинного обучения, разработки LLM или смежных направлений.
- ML-фреймворки: Уверенное владение PyTorch и/или TensorFlow.
- LLM-инструменты: Опыт работы с библиотеками для LLM, такими как Langchain, Llama.
- Глубокие знания Python и опыт разработки на нем.
- ML-практики: Опыт работы с RAG, векторными базами данных, эмбеддинг-моделями.
- Знание техник дообучения и оптимизации моделей (LoRA, QLoRA).
- Опыт работы с Kubernetes (k8s) и опыт развертывания ML-моделей.
- Свободное владение Linux и командной строкой.
- Удалённый формат работы
- Официальное оформление по ТкРФ, белая ЗП (по договорённости);
- График работы 5/2 с 8:30 до 17:30 по Москве;
- Премии за эффективную работу и достижение результатов;
- Различные программы обучения для прокачки профессиональных скиллов;
- ДМС программа