Бэнкс Софт Системс

Backend Developer + AI

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет
  • Python
  • FastAPI
  • PostgreSQL
  • Redis
  • MongoDB
  • Docker
  • LLM
  • OpenAI

Компания BSS — системно значимая российская ИТ-компания, специализирующаяся на разработке, внедрении и поддержке решений по цифровизации клиентского обслуживания для банков, финтех-компаний, госсектора, телекома, ритейла, медицины, сферы ЖКХ в России и СНГ. Мы разрабатываем системы речевой аналитики, развиваем платформы дистанционного банковского обслуживания, а также оказываем услуги по заказной и аутсорс разработке. Мы практикуем наиболее востребованные рынком технологические решения: от машинного обучения до разработки 1С.

Обязанности:

  • Интеграция сторонних LLM API (OpenAI, Claude, DeepSeek) и кастомизация промптов.

  • Построение систем Retrieval-Augmented Generation (RAG): от чанкинга данных до поиска релевантных результатов.

  • Разработка чат-ботов и ассистентов с цепочками вызовов, памятью, fallback-механизмами.

  • Оптимизация стоимости вызовов LLM, работа с streaming и function calling.

  • Создание прототипов MVP интерфейсов для демонстрации решений (HTMX/Bootstrap/Streamlit).

  • Настройка инфраструктуры для работы с LLM: интеграция API, настройка кешей, очередей.

  • Работа с векторными базами данных (FAISS, Pinecone) и графами знаний.

  • Внедрение решений по квантованию моделей и fallback на локальные модели GPT.

  • Мониторинг метрик и логирование работы систем.

Требования:

  • Глубокая экспертиза в Python: asyncio, threading, multiprocessing, профилирование памяти/CPU-bound задач.

  • Уверенное владение FastAPI + Pydantic v2 (асинхронная архитектура).

  • Опыт работы с базами данных: PostgreSQL, Redis, MongoDB — проектирование схем, индексация.

  • Контейнеризация: Docker, Docker Compose; базовое понимание Kubernetes.

  • Опыт настройки очередей сообщений: RabitMQ, Kafka; Celery — retry-логика, dead-letter очереди.

  • Навыки быстрого прототипирования интерфейсов (HTMX/Bootstrap/Streamlit).

  • Способность быстро собирать MVP за короткое время.

  • Самостоятельность в постановке задач и выборе архитектурных решений.

    Желательные навыки:

  • Работа с LLM API (OpenAI, Claude), кастомизация промптов, Ollama, vLLM.

  • Построение RAG-систем: выбор векторных БД и графов знаний.

  • Работа с ML-инфраструктурой: transformers, vLLM, ONNX Runtime.

  • Знание MLOps инструментов: MLflow, Weights & Biases.

Условия:

  • Аккредитованная IT-компания;
  • Возможность удаленной работы;
  • Полное соблюдение ТК РФ и своевременная выплата заработной платы;
  • Расширенное ДМС со стоматологией, бесплатные лекарства по назначению врачей;
  • Корпоративное обучение и сертификация в технических областях;
  • Бесплатное обучение английскому;
  • Онлайн-йога.