Sifox

Специалист по разметке/ Транскрибатор арабского языка (Оманский диалект, ML-датасеты)

Не указана
  • Москва
  • От 1 года до 3 лет

О ПРОЕКТЕ

Мы разрабатываем виртуального AI-секретаря для крупного мобильного оператора из Омана. Продукт принимает пропущенные звонки, ведёт диалог со звонящим, записывает и передаёт сообщения пользователю — всё это на арабском языке.

Чтобы секретарь корректно понимал живую речь и намерения собеседника, нам необходимы высококачественные обучающие данные для моделей ASR (распознавание речи) и NLU (понимание естественного языка). Именно здесь нужна ваша экспертиза.

ЗАДАЧИ

Консультирование

  • Консультации по особенностям арабского языка: письменность, лексика, грамматика

  • Разъяснение специфики оманского диалекта: фонетика, региональные выражения, культурный контекст

Разметка и перевод датасетов

  • Перевод коротких разговорных реплик с английского на арабский и обратно

  • Адаптация реплик под реалии арабских стран: актуальные имена, организации, адреса

  • Составление реплик на арабском языке по заданным тематикам: просьба перезвонить, прощание, благодарность и др.

  • Корректировка автоматических переводов (post-editing)

Работа с аудио

  • Расшифровка коротких аудиозаписей на арабском языке (транскрипция речи в текст)

  • Оценка качества автоматических расшифровок (ASR-разметка)

ТРЕБОВАНИЯ

Обязательно:

  • Свободное владение арабским языком — C1/C2 или уровень носителя (в том числе, специалисты, выучившие арабский как иностранный)

  • Грамотная письменная речь на арабском: умение работать с текстом, переводить и редактировать

  • Внимательность к деталям, аккуратность при работе с большими объёмами однотипных данных

Будет плюсом:

  • Знание оманского диалекта или других диалектов Персидского залива

  • Опыт работы с ML-датасетами, ASR- или NLU-разметкой

  • Понимание особенностей разговорного арабского vs. литературного

  • Опыт транскрипции аудиозаписей