Обязанности:
- В первую очередь, тебе предстоит развивать внутреннюю систему для автоматического анализа текстовых документов с применением больших языковых моделей (LLM):
- разрабатывать и внедрять новые сценарии анализа текстов (под новые типы документов)
- улучшать стабильность и качество текущих сценариев анализа текстов, оптимизировать код
- применять LLM для успешного решения кейсов (писать промпты, разбираться в тонкостях работы с LLM, разрабатывать RAG-пайплайны)
- совместно с командами DE, MLOps, мониторинга интегрировать сервисы в промышленную среду
- промышленный опыт разработки и внедрения классических моделей
-
знание классического ML и алгоритмов
опыт применения и понимание работы с LLM, желание развиваться в этом направлении -
уверенное владение ML-стеком Python: lightgbm/xgboost/catboost, Scikit-Learn, Pandas, Numpy
-
умение работать с инструментами Spark, Hadoop, Hive
Будет большим плюсом:
-
-опыт в области обработки естественного языка, понимаете принцип работы NLP моделей - контрибьют в ML-библиотеки
-
опыт full-stack разработки - знание DL-алгоритмов и опыт работы с Pytorch