GST

ML-инженер (NLP, LLM, STT, TTS)

150 000 - 200 000 RUR
  • Ростов-на-Дону
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет

Мы находимся в поиске ML- инженера на удаленный формат работы.

Работаем в сфере Информационной безопасности с 2015 года. Нашими клиентами являются банки, входящие в ТОП-10 России, организации из топливно-энергетического комплекса и многие другие компании федерального значения.

Сейчас в разработке находится новый интересный продукт - DAILO. Это - интерактивный речевой тренажер для обучения, который позволяет развивать коммуникативные навыки: продажи, эффективные коммуникации с сотрудниками и коллегами, публичные выступления и многое другое.

В наших разработках мы используем новейшие ИИ-технологии, а также потоковое распознавание речи.

В 2023 году мы смогли доказать работоспособность наших перспективных методологий обучения и получили патент на изобретение

Мы предлагаем:

Стабильную белую конкурентную заработную плату

Оформление на работу по ТК РФ

Возможность решать интересные задачи, расширять свою экспертизу

Работу в профессиональной команде

Минимум бюрократии, гибкая настройка рабочего дня

ЗП от 150 000 на руки (по результатам собеседования)

О вакансии:

Ищем увлеченного ML Engineer для работы над передовыми проектами в **NLP, LLM, STT и TTS**. Вы будете ключевым членом команды, занимаясь разработкой, развертыванием и оптимизацией ML-моделей для наших инновационных продуктов. Вакансия для тех, кто любит сложные задачи, исследования и видеть результат своей работы в реальном мире.

**Чем предстоит заниматься:**

* **Развертывание и эксплуатация ML-моделей:** Production-развертывание, мониторинг, масштабирование и обеспечение стабильной работы нейросетевых моделей (NLP, STT, TTS).

* **Разработка и доработка ML-решений:** Полный цикл разработки ML-решений, от прототипирования до внедрения и поддержки. Улучшение существующих и разработка новых решений.

* **Исследование и разработка новых моделей:** Самостоятельное изучение и адаптация новых инструментов, подходов и архитектур для NLP, STT, TTS.

* **Оптимизация производительности inference:** Повышение эффективности и скорости inference моделей.

* **Документирование ML-процессов:** Создание технической документации для обеспечения воспроизводимости и масштабируемости.

**Что мы ждем от кандидата:**

**Технические навыки и опыт:**

* **ML & AI Основы:** Глубокое понимание методов ML (обучение с учителем/без учителя/с подкреплением), NLP, глубокого обучения (CNN, RNN, Transformer и др.), оценка качества моделей.

* **NLP Модели:** Опыт работы с Transformer-based моделями (BERT, RoBERTa, T5 и др.), fine-tuning pre-trained моделей.

* **Аудио Модели:** Опыт работы с нейросетевыми моделями для работы с речью (STT, TTS, VAD, Diarization), включая современные архитектуры (Zipformer, Wav2Vec, Whisper, VITS и др.). Понимание принципов STT/TTS систем.

* **Python Программирование:** Экспертное знание Python, включая асинхронный код, фоновые задачи, очереди задач. Библиотеки: PyTorch (или TensorFlow), ONNX, Scikit-learn, Pandas, NumPy. Тестирование кода, Git, code review, CI/CD.

* **Inference-сервисы:** Опыт разработки и развертывания inference-сервисов с использованием фреймворков (FastAPI, vLLM, Sherpa-ONNX, TensorRT и др.). Понимание масштабируемости и отказоустойчивости.

* **Контейнеризация и оркестрация:** Docker (обязательно), Kubernetes (желательно).

**Решение проблем и аналитическое мышление:**

* Декомпозиция сложных задач на ML задачи.

* Выбор оптимального подхода к решению задач (ML или эвристики/статистика).

* Отладка и оптимизация inference моделей.

* Анализ результатов экспериментов и улучшение моделей.

**Будет плюсом:**

* MLOps: Управление жизненным циклом ML-моделей, автоматизация.

* ML-пайплайны: Построение и интеграция end-to-end пайплайнов.

* Оценка и мониторинг качества моделей: использование автоматизированных инструментов оценки качества моделей.

* LLM: Понимание принципов работы LLM, опыт inference, оптимизации, RAG.

* Векторные БД: Опыт работы с векторными базами данных для RAG.

* Мониторинг ML-систем: Использование Prometheus, Grafana, MLflow Monitoring.

* SQL и БД: Навыки SQL и опыт работы с базами данных.

* CI/CD: Настройка CI/CD для ML-приложений.

* Опыт оркестрации k8s ML сервиса

* Опыт работы с cuda+docker или cuda+docker+k8s

* Open Source: Участие в Open Source проектах по NLP/STT/TTS.

**Обязательные навыки:**

* Машинное обучение

* Python

* Docker

* Git

* Опыт работы с любой облачной платформой (Yandex Cloud, AWS, GCP, Azure)

***