Анонимді өндірістік кейс

Аудионы транскрипциялау және қорытындылау пайплайны

Дыбысты шығару, диаризация, сегменттеу, сөйлеуді тану және құрылымдалған API нәтижесі бар аудио/бейне өңдеу контуры.

Мәселе

Неге аудио өңдеу бір модельден тез шығып кетеді

Медиа әркелкі

Қоңыраулар мен жазбалар сапасы, ұзақтығы және сөйлеушілер құрылымы бойынша өзгеше.

Бірнеше кезең қажет

Extraction, diarization және recognition бір жүйе ретінде жұмыс істеуі керек.

Нәтиже құрылымдалған болуы тиіс

Ол кейінгі іздеу, қорытындылау және downstream өңдеуге жарамды болуы керек.

Ағын қайталанатын болуы керек

Production контуры қолмен скрипттер мен бір реттік қадамдарға сүйене алмайды.

Тәсіл

FOXOPS бұл медиа пайплайнын қалай жинады

Тәсіл 01

Аудионы шығару

Бастапқы медиа басқарылатын кіріс сатысына келтірілді.

Тәсіл 02

Диаризация және сегментация

Сөйлеушілерді бөлу және сегментация медиа өңдеуді құрылымдалған бірліктерге айналдырды.

Тәсіл 03

Recognition және API нәтижесі

Нәтижелер кейінгі қолдануға жарамды құрылымда қайтарылды.

Шешім контуры
Медиа кірісі аудио / видео
Extraction дыбысты дайындау
Диаризация сөйлеушілерді бөлу
Recognition мәтінге айналдыру
Құрылымдалған нәтиже API шығуы
Келесі қадам

Егер сізге медиа немесе сөйлеу өңдеу контуры керек болса, оны толық инженерлік жүйе ретінде қарау керек

FOXOPS production медиа ағыны үшін керек архитектураны, кезеңдерді және операциялық модельді бағалауға көмектеседі.