Обязанности:
- RAG-пайплайн:
- Сбор данных через ETL (POI, отзывы, описания).
- Интеграция векторного поиска (Pinecone/Weaviate/FAISS).
- Реализация логики кэширования контекста.
- Prompt Engineering:
- Создание промтов для различных сценариев.
- A/B-тестирование и оценка качества.
- Интеграция LLM API:
- Работа с OpenAI API, стриминг, обработка ошибок.
- Настройка fallback-механизмов и system-messages.
- MLOps:
- Docker, Kubernetes.
- Мониторинг (запросы, latency, cost).
- CI/CD для пайплайнов.
- 2+ года в ML/AI или Data Science, опыт с RAG/PROMPT-системами.
- Знание RAG: векторные БД, метрики сходства, кэширование.
- Prompt engineering для LLM (GPT-3.5/4, Claude).
- Python, работа с API.
- ETL-инструменты (Airflow, Dagster).
- Docker, Kubernetes.
- Мониторинг и логирование.
Будет преимуществом
- Опыт в travel-домене.
- Облачные сервисы (AWS/GCP/Azure).
- Масштабирование RAG-систем.
- Работа с feature-flags и экспериментами.
Условия:
- Работа в офисе - Москва.
- Оформление на выбор.
- Работа в новой команде.
- Работа над новым интересным продуктом.