Т1

Data Science

Не указана
  • Рязань
  • Полная занятость
  • Полный день
  • От 1 года до 3 лет
  • Python
  • SQL
Обязанности:
  • Решение задач, направленных на обработку и структурирование текстовой информации для разработки моделей
  • Построение решений на базе LLM моделей \ разработка промптов.
  • Суммаризация информации для генерации кода и тестов
  • Генерация кода и тестов с помощью LLM
  • Определение роли пользователя \ выделение навыков с помощью LLM
  • Генерация рекомендаций по улучшению кода пользователя с помощью LLM
  • Построение RAG сервиса базы знаний по коду и тестам
  • Формулирование гипотез для улучшения алгоритмов и сервисов, реализация дизайна экспериментов, проведение экспериментов с анализом итоговых результатов
Требования:
  • опыт работы в области NLP/LLM/ML от 3 лет

  • высокий уровень математического аппарата - математический анализ, линейная алгебра, теория вероятностей

  • детальное понимание моделей машинного обучения и алгоритмов

  • уверенное владение языком Python 3.х, будет плюсом: ООП, паттерны, Web, Clean code

  • знания Linux, bash, Docker (более глубокие знания DevOps будут плюсом, но не обязательны)

  • знание classic ML/NLP - инструментов (numpy, pandas, sklearn, gradio, nltk, spacy, pymorphy, natasha, regex и др.)

  • опыт тюнинга моделей на различные задачи NLP (Question Answering, Code Search, Code Completion, Text Classification, POS Tagging, Machine Translation) и работы с эмбеддингами w2v, fastText, BERT, BM25 на PyTorch

  • опыт/знание хотябы 1 фреймворка деплоя/квантизации: vLLM, CTranslate2, OpenLLM, DeepSpeed-MII, Text generation inference

  • вывод ML/NLP моделей через интерфейс (gradio/streamlit, fastapi/flask, FastChat)

​​​​​​