HR Rocket — технологическая AI / HR Tech платформа, автоматизирующая управление HR-рекламой.
Помогаем крупным компаниям снижать стоимость отклика, оптимизировать бюджеты и делать найм прогнозируемым с помощью ML/AI. Среди наших клиентов — лидеры ритейла, логистики, производства, телеком и других отраслей с массовым подбором.
Кого ищем
Мы ищем LLM‑специалиста, который усилит наш AI‑стек, выстроит архитектуру LLM‑модулей и поможет развивать генеративные продукты внутри HR Rocket.
Чем предстоит заниматься:
-
Проектировать архитектуру LLM‑модулей и AI‑сервисов внутри платформы;
-
Разрабатывать и оптимизировать пайплайны: inference, finetuning, RAG, векторные базы;
-
Строить системы генерации и обработки вакансий, откликов, диалогов, резюме;
-
Настраивать и улучшать качество LLM‑моделей (evals, safety, data curation);
-
Встраивать LLM‑функциональность в backend через асинхронные вызовы, очереди и API;
-
Работать с ML‑модулями, аналитикой и системами прогноза;
-
Участвовать в разработке AI‑продуктов: автогенерация объявлений, интеллектуальные чат‑боты, умные интерфейсы для рекрутеров;
-
Оптимизировать стоимость и скорость inference (quantization, batching, caching);
-
Поддерживать интеграции с внешними LLM‑провайдерами и локальными моделями.
Что от тебя ждем:
-
5–6+ лет опыта в ML/AI или backend‑разработке;
-
Опыт работы с LLM: GPT, Claude, Llama, GigaChat, Qwen и др.
-
Умение проектировать RAG‑архитектуры, опыт со векторными БД (Chroma, Qdrant, Milvus);
-
Опыт обучения или дообучения моделей (PEFT, LoRA, SFT);
-
Владение Python (FastAPI);
-
Глубокое понимание ML‑инфраструктуры, пайплайнов, оптимизации inference;
-
Опыт работы с Postgres, Redis, очередями, async вызовами;
-
Знание Docker, Docker Compose; умение работать в CI/CD;
-
Навыки работы с Git, code review, хорошая инженерная культура;
-
Опыт работы с Cursor, ClaudeCode или аналогичными инструментами обязателен.
Будет плюсом:
-
Опыт разработки recommendation systems, ML‑инфраструктуры или data pipelines;
-
Знание PyTorch, Transformers, vLLM, Llama.cpp, OpenAI‑совместимых API
-
Навыки DevOps или MLOps.
Что предлагаем:
-
Возможность строить ключевые AI‑модули первой HR‑маркетинговой платформы в России;
-
Влияние на архитектуру и продуктовые решения;
-
Работа в быстрорастущем стартапе с коротким циклом принятия решений;
-
Современный AI‑стек: LLM, RAG, векторные базы, ML‑интеграции, Python, FastAPI;
-
Гибкий формат — удалёнка.