Sifox
Специалист по разметке/ Транскрибатор арабского языка (Оманский диалект, ML-датасеты)
О ПРОЕКТЕ
Мы разрабатываем виртуального AI-секретаря для крупного мобильного оператора из Омана. Продукт принимает пропущенные звонки, ведёт диалог со звонящим, записывает и передаёт сообщения пользователю — всё это на арабском языке.
Чтобы секретарь корректно понимал живую речь и намерения собеседника, нам необходимы высококачественные обучающие данные для моделей ASR (распознавание речи) и NLU (понимание естественного языка). Именно здесь нужна ваша экспертиза.
ЗАДАЧИ
Консультирование
-
Консультации по особенностям арабского языка: письменность, лексика, грамматика
-
Разъяснение специфики оманского диалекта: фонетика, региональные выражения, культурный контекст
Разметка и перевод датасетов
-
Перевод коротких разговорных реплик с английского на арабский и обратно
-
Адаптация реплик под реалии арабских стран: актуальные имена, организации, адреса
-
Составление реплик на арабском языке по заданным тематикам: просьба перезвонить, прощание, благодарность и др.
-
Корректировка автоматических переводов (post-editing)
Работа с аудио
-
Расшифровка коротких аудиозаписей на арабском языке (транскрипция речи в текст)
-
Оценка качества автоматических расшифровок (ASR-разметка)
ТРЕБОВАНИЯ
Обязательно:
-
Свободное владение арабским языком — C1/C2 или уровень носителя (в том числе, специалисты, выучившие арабский как иностранный)
-
Грамотная письменная речь на арабском: умение работать с текстом, переводить и редактировать
-
Внимательность к деталям, аккуратность при работе с большими объёмами однотипных данных
Будет плюсом:
-
Знание оманского диалекта или других диалектов Персидского залива
-
Опыт работы с ML-датасетами, ASR- или NLU-разметкой
-
Понимание особенностей разговорного арабского vs. литературного
-
Опыт транскрипции аудиозаписей