Мы находимся в поиске ML- инженера на удаленный формат работы.
Работаем в сфере Информационной безопасности с 2015 года. Нашими клиентами являются банки, входящие в ТОП-10 России, организации из топливно-энергетического комплекса и многие другие компании федерального значения.
Сейчас в разработке находится новый интересный продукт - DAILO. Это - интерактивный речевой тренажер для обучения, который позволяет развивать коммуникативные навыки: продажи, эффективные коммуникации с сотрудниками и коллегами, публичные выступления и многое другое.
В наших разработках мы используем новейшие ИИ-технологии, а также потоковое распознавание речи.
В 2023 году мы смогли доказать работоспособность наших перспективных методологий обучения и получили патент на изобретение
Мы предлагаем:
Стабильную белую конкурентную заработную плату
Оформление на работу по ТК РФ
Возможность решать интересные задачи, расширять свою экспертизу
Работу в профессиональной команде
Минимум бюрократии, гибкая настройка рабочего дня
ЗП от 150 000 на руки (по результатам собеседования)
О вакансии:
Ищем увлеченного ML Engineer для работы над передовыми проектами в **NLP, LLM, STT и TTS**. Вы будете ключевым членом команды, занимаясь разработкой, развертыванием и оптимизацией ML-моделей для наших инновационных продуктов. Вакансия для тех, кто любит сложные задачи, исследования и видеть результат своей работы в реальном мире.
**Чем предстоит заниматься:**
* **Развертывание и эксплуатация ML-моделей:** Production-развертывание, мониторинг, масштабирование и обеспечение стабильной работы нейросетевых моделей (NLP, STT, TTS).
* **Разработка и доработка ML-решений:** Полный цикл разработки ML-решений, от прототипирования до внедрения и поддержки. Улучшение существующих и разработка новых решений.
* **Исследование и разработка новых моделей:** Самостоятельное изучение и адаптация новых инструментов, подходов и архитектур для NLP, STT, TTS.
* **Оптимизация производительности inference:** Повышение эффективности и скорости inference моделей.
* **Документирование ML-процессов:** Создание технической документации для обеспечения воспроизводимости и масштабируемости.
**Что мы ждем от кандидата:**
**Технические навыки и опыт:**
* **ML & AI Основы:** Глубокое понимание методов ML (обучение с учителем/без учителя/с подкреплением), NLP, глубокого обучения (CNN, RNN, Transformer и др.), оценка качества моделей.
* **NLP Модели:** Опыт работы с Transformer-based моделями (BERT, RoBERTa, T5 и др.), fine-tuning pre-trained моделей.
* **Аудио Модели:** Опыт работы с нейросетевыми моделями для работы с речью (STT, TTS, VAD, Diarization), включая современные архитектуры (Zipformer, Wav2Vec, Whisper, VITS и др.). Понимание принципов STT/TTS систем.
* **Python Программирование:** Экспертное знание Python, включая асинхронный код, фоновые задачи, очереди задач. Библиотеки: PyTorch (или TensorFlow), ONNX, Scikit-learn, Pandas, NumPy. Тестирование кода, Git, code review, CI/CD.
* **Inference-сервисы:** Опыт разработки и развертывания inference-сервисов с использованием фреймворков (FastAPI, vLLM, Sherpa-ONNX, TensorRT и др.). Понимание масштабируемости и отказоустойчивости.
* **Контейнеризация и оркестрация:** Docker (обязательно), Kubernetes (желательно).
**Решение проблем и аналитическое мышление:**
* Декомпозиция сложных задач на ML задачи.
* Выбор оптимального подхода к решению задач (ML или эвристики/статистика).
* Отладка и оптимизация inference моделей.
* Анализ результатов экспериментов и улучшение моделей.
**Будет плюсом:**
* MLOps: Управление жизненным циклом ML-моделей, автоматизация.
* ML-пайплайны: Построение и интеграция end-to-end пайплайнов.
* Оценка и мониторинг качества моделей: использование автоматизированных инструментов оценки качества моделей.
* LLM: Понимание принципов работы LLM, опыт inference, оптимизации, RAG.
* Векторные БД: Опыт работы с векторными базами данных для RAG.
* Мониторинг ML-систем: Использование Prometheus, Grafana, MLflow Monitoring.
* SQL и БД: Навыки SQL и опыт работы с базами данных.
* CI/CD: Настройка CI/CD для ML-приложений.
* Опыт оркестрации k8s ML сервиса
* Опыт работы с cuda+docker или cuda+docker+k8s
* Open Source: Участие в Open Source проектах по NLP/STT/TTS.
**Обязательные навыки:**
* Машинное обучение
* Python
* Docker
* Git
* Опыт работы с любой облачной платформой (Yandex Cloud, AWS, GCP, Azure)
***