Аспирити

ML (AI инженер)

Не указана
  • Красноярск
  • От 3 до 6 лет

О проекте:

Aspirity — студия веб- и мобильной разработки из Сибири, специализирующаяся на создании программных решений для международных стартапов и крупных компаний. Среди наших клиентов — технологические компании Кремниевой долины, такие как Shoreline и Pinecone, а также лидеры рынков России, Европы и Азии, включая РУСАЛ, NGenix (в составе группы «Ростелеком») и Schibsted.

Мы развиваем направление outstaff-сотрудничества и формируем команды, которые работают в продуктах клиентов, оставаясь при этом частью инженерной культуры Aspirity.

Параллельно мы запускаем крупный внутренний проект в области AI — систему автоматизации проектирования складских комплексов. Цель проекта — внедрение интеллектуальных ассистентов и цифровых пайплайнов в инженерные и производственные процессы.

Обязанности:

  • Разработка, внедрение и оптимизация AI/ML решений для автоматизации проектирования и работы внутреннего ассистента

  • Дообучение open-source LLM, настройка, квантование, оптимизация под доступную инфраструктуру (облако: Yandex Cloud H100/H200, внутренний сервер: L40)

  • Построение и поддержка RAG (Retrieval-Augmented Generation) пайплайнов

  • Автоматизация процессов подготовки и обработки данных (текст, таблицы, чертежи — в т.ч. AutoCAD/Excel)

  • Интеграция моделей и сервисов через API (FastAPI)

  • Взаимодействие с командой по разметке данных: построение пайплайнов, автоматизация, обучение внутренних сотрудников

  • Настройка контейнеризации и инфраструктуры инференса (Docker, взаимодействие с DevOps)

  • Оценка качества моделей, проработка и внедрение метрик для обратной связи от бизнеса

  • Ведение технической документации, обучение команды работе с решениями

Требования:

  • Практический опыт ML/AI-инжиниринга от 2–3 лет

  • Отличное знание Python, опыт с ML-фреймворками: PyTorch, TensorFlow

  • Глубокое понимание архитектуры трансформеров, attention, LoRA, RAG

  • Опыт fine-tuning/дообучения LLM, квантование моделей, оптимизация для ограниченных ресурсов

  • Навыки интеграции через API (FastAPI, REST), понимание принципов контейнеризации (Docker)

  • Ориентация на работу с разными типами данных (текст, таблицы, инженерные чертежи)

  • Опыт взаимодействия с командами по разметке данных / разработке пайплайнов

  • Умение оценивать качество решений, выстраивать обратную связь

  • Уверенное чтение технической документации на английском

  • Готовность работать в домене промышленной автоматизации и инженерного проектирования (не финтех / не e-commerce), с задачами производства и логистической инфраструктуры

Будет плюсом:

  • Опыт работы с облачными вычислениями (Yandex Cloud, H100/H200, L40)

  • Навыки построения корпоративных ассистентов и пайплайнов с большим количеством данных

  • Опыт в автоматизации инженерных процессов: интеграция с AutoCAD, Excel и др. ПО

  • Знакомство с Chroma, LangChain, Qdrant

Мы предлагаем:

  • Участие в масштабном инновационном проекте с нуля

  • Возможность влиять на архитектуру и процесс, работать с широким стеком технологий

  • Конкурентная заработная плата: обсуждается индивидуально

  • Официальное оформление, перспективы профессионального и карьерного роста