BTS Digital

Data & AI Platform Architect

Не указана
  • Астана
  • Более 6 лет

О нашей команде и продуктах:

Компания BTSD создает цифровые продукты и сервисы, которые помогают людям, бизнесу и государству. В экосистеме реализуются проекты для повседневной жизни, ведения бизнеса и госуправления. Более 9 миллионов пользователей уже выбрали нас и наши продукты: AituCloud, Aitu Messenger, Digital ID, Aitu Koshelek 2.0, Aitu Passport, Система Мгновенных Платежей и др.

AI-команда BTSD разрабатывает корпоративных ИИ-ассистентов и агентов, которые автоматизируют бизнес-процессы, отвечают на вопросы сотрудников и клиентов, а также интегрируются с корпоративными системами. Среди наших достижений — STT собственной разработки, поддерживающая казахский, русский и смешанную речь.

Мы ищем Архитектора Data&AI, который обеспечит разработку и развитие масштабируемой, надёжной и интеллектуальной платформы данных, способной поддерживать инициативы в области аналитики, машинного обучения и генеративного ИИ.

Основные задачи:
  • Проектирование и развитие платформы данных и ИИ: Data Lake, Feature Store, ML-платформы, LLM-инфраструктуры и агентных систем

  • Разработка архитектурных решений для сбора, обработки, хранения и предоставления данных в режиме реального времени и batch

  • Оценка и выбор облачных и on-premise технологий: Apache Spark, Kafka, Airflow, Kubeflow, MLflow, векторные СУБД и т.д.

  • Сотрудничество с командами Data Science, MLOps и BI для формирования сквозного пути от данных к ценности

  • Подготовка технической документации, архитектурных диаграмм и дорожных карт для стейкхолдеров

Требования:
  • Опыт от 5 лет в области архитектуры данных, из них 3+ года в роли архитектора, опыт работы с крупными (10+TB) датасетами

  • Обработка данных: Apache Spark / PySpark, Kafka / Flink, Airflow

  • ИИ / ML / LLM: MLflow, Kubeflow, Feature Store (Feast, Tecton); LLM: fine-tuning, RAG, агентные архитектуры (LangChain, LlamaIndex, AutoGen); векторные БД (Pinecone, Weaviate, pgvector)

  • Хранилища: Data Lake; Delta Lake / Apache Iceberg / Hudi; columnar-форматы (Parquet, ORC)

  • Языки: Python (advanced), SQL, знание Scala или Java будет преимуществом

  • Data Governance: Опыт внедрения Data Catalog, Lineage, RBAC

  • Контейнеризация: Docker, Kubernetes, Helm; CI/CD (GitLab CI / ArgoCD)

Условия:
  • Уютный офис в г.Астана

  • Гибридный формат работы

  • Официальное трудоустройство

  • Возможность стать частью IT компании, которая создает цифровые решения, меняющие жизнь людей к лучшему