Yurt Tech

ML инженер, Data scientist

Не указана

Астана
Полная занятость
Полный день
От 1 года до 3 лет

Что нужно делать?

1. Разработка и доработка ML-моделей

* Разработка моделей машинного обучения и глубокого обучения (CV, NLP, Multimodal, VLM).
* Использование фреймворков: PyTorch, TensorFlow, Hugging Face Transformers.
* Тонкая настройка (fine-tuning) готовых моделей на собственных данных.
* Конвертация моделей в ONNX и оптимизация с помощью TensorRT для ускорения инференса.

2. Работа с данными

* Предобработка, очистка и анализ больших объёмов данных.
* Взаимодействие с VectorDB (например, FAISS, Chroma, Weaviate, Pinecone) в задачах RAG.

3. RAG и векторный поиск

* Проектирование систем Retrieval-Augmented Generation (RAG).
* Индексация документов, извлечение контекста с помощью embedding-моделей.
* Интеграция с LLM (в том числе через Hugging Face или OpenAI API).
* Построение пайплайнов для чата с документами или внутренней базы знаний.

4. Деплой и продакшн

* Разработка REST API с использованием FastAPI или Flask.
* Контейнеризация моделей и приложений с помощью Docker и Docker + GPU (nvidia-docker).
* Оркестрация и масштабирование через Kubernetes.
* Работа с RabbitMQ для асинхронной очереди задач и микросервисной архитектуры.

5. Мониторинг и сопровождение

* Мониторинг качества и производительности моделей в продакшене (latency, drift, accuracy).
* Логирование, алерты, перезапуск пайплайнов при сбоях.
* Регулярное переобучение и откат моделей при необходимости.

6. Взаимодействие в команде

* Совместная работа с DevOps, аналитиками, инженерами и продуктовой командой.
* Участие в код-ревью, проектировании архитектуры решений.
* Поддержка экспериментов с LLM/VLM и их интеграция в реальные продукты.

Условия:
Участие в создании инновационного продукта с нуля.
Работа в небольшой, но динамичной команде.
Возможность влиять на архитектуру и развитие проекта.
Уровень оплаты обсуждается индивидуально исходя из навыков и опыта работы кандидата.

Источник вакансии

Вернуться, к списку вакансий