Neoflex
Lead AI Engineer / AI Architect (LLM)
- Python
- Docker
- LangGraph
- PyTorch
- FastAPI
- LangChain
- PEFT/LoRA
- LLM
- RAG
- Kubernetes
- vLLM
- GitLab CI
- LangFuse
- LiteLLM
- tool calling
- Guardrails
- Английский — B2 — Средне-продвинутый
ОДИН ИЗ ЛУЧШИХ РАБОТОДАТЕЛЕЙ РОССИИ
Мы – Neoflex. Аккредитованная IT компания. За 20 лет работы мы создали 12+ готовых решений для бизнеса, так же занимаемся заказной разработкой программного обеспечения.
Приветствуем на странице нашей компании и благодарим за интерес к вакансии. Будем рады оказаться полезны друг другу.
Мы развиваем направление LLM/GenAI и ищем инженера, который станет техническим лидером для нескольких продуктовых команд: поможет проектировать LLM‑системы (включая агентные workflow), выстроит подходы к оценке качества и надёжности, и будет помогать командам стабильно доводить решения до промышленной эксплуатации.
Если вы не совпадаете со всеми пунктами, но вам близки сложные агентные workflow и вы понимаете, как выстраивать валидацию и observability — откликайтесь.
Стек проекта: Python, PyTorch, LangChain/LangGraph, Milvus/Weaviate/etc, Triton/vLLM, LangFuse, LiteLLM, FastAPI, GitLab CI, SQL.
Чем предстоит заниматься:
-
Помогать командам с архитектурой и системным дизайном: reference‑подходы, дизайн‑ревью, стандарты, best practices для нескольких продуктовых команд.
-
Проектировать и улучшать агентные решения: выбирать паттерны (router, planner/executor, ReAct и т.п.), проектировать tool use, structured output, orchestration (workflow/graph/state machine), безопасные контуры выполнения.
-
Выстраивать качество и надёжность: метрики, бенчмарки и regression‑проверки, A/B‑эксперименты, мониторинг, guardrails, observability (трейсинг/логирование/алерты).
-
Оптимизировать производительность и стоимость инференса (latency/cost), помогать командам с production‑готовностью (SLA, стабильность, масштабирование).
-
Курировать R&D‑прототипы и доводить их до продукта; менторить коллег, развивать инженерную экспертизу (митапы/хакатоны — по желанию).
Что мы ждём от вас (must-have):
-
3+ лет коммерческого опыта в software engineering / backend / AI/ML инженерии, из них 2+ года в LLM/GenAI‑проектах (в проде).
-
Уверенное владение Python, SQL, Git и хорошее понимание инженерных практик разработки (архитектура сервисов, тестирование, CI/CD, эксплуатация).
-
Опыт внедрения и поддержки в промышленной эксплуатации решений на базе LLM (включая мониторинг/инциденты/качество/стоимость).
-
Опыт построения систем оценки качества LLM/agent решений: метрики, датасеты/бенчмарки, автоматизированные проверки, A/B‑эксперименты, интерпретация результатов.
-
Опыт технического лидерства: дизайн/архитектурные решения, координация с командами, взаимодействие с заказчиками, защита/аргументация технических решений.
Будет плюсом:
-
Опыт построения AI‑платформ, фреймворков, SDK или внутренних библиотек/компонентов для команд.
-
Опыт оптимизации и/или кастомизации инференса (vLLM/Triton/квантизация/батчинг/кэширование).
-
Опыт fine‑tuning / PEFT (LoRA/QLoRA) или дообучения эмбеддеров/реранкеров.
-
Опыт работы с мультимодальными и речевыми моделями (VLM, ASR, TTS).
-
Вклад в open‑source, публикации/выступления на конференциях.
-
Умение объяснять сложные вещи простым языком и переводить требования бизнеса в технические метрики качества.
Что ты приобретёшь, присоединившись к нам:
- достойную оплату труда + компенсационные, стимулирующие и мотивационные выплаты, бонусы за участие в реферальной программе;
- работа в команде профессионалов готовых делиться экспертизой;
- официальное трудоустройство по ТК РФ, аккредитация IT, расширенный социальный пакет:
✔️ страховка ДМС (с 3-го месяца работы, стоматология, возможность подключения родственников, теле медицина, полис ВЗР),
✔️ сотрудникам со стажем в Neoflex более 3 месяцев при предоставлении листка нетрудоспособности устанавливается доплата до полного заработка за период болезни,
✔️ обучение детей сотрудников ИТ специальностям,
✔️ компенсация затрат на фитнес и занятия английским языком;
- обеспечиваем техникой для работы (ноутбук, наушники, мышь);
- профессиональное развитие - в Учебном Центре (курсы по работе с большими данными, видео лекции, тренажеры, карьерный коучинг, лекции, тренинги, конференции, участие в митапах);
- возможность пройти проф.сертификацию;
- прозрачную систему карьерного развития Performance Review;
- персонального куратора с первого дня работы;
- насыщенную корпоративную жизнь: яркие корпоративы, праздники для детей сотрудников, корпоративные спортивные мероприятия, мотивационные награждения;
- комфортную атмосферу в филиалах компании в городах: Москва, Санкт-Петербург, Нижний Новгород, Пенза, Воронеж, Саратов, Самара, Краснодар где есть лаунж и фотозоны, вендинги в кухнях, пространство для медитаций и другие секретные места, о которых знают только наши сотрудники.
- удалённый формат работы на территории России.
Здесь мечты превращаются в реальность. Мы будем рады, если ты станешь частью нашей команды! Откликайся ;)