Ugrás a tartalomhoz

 

"Releasing the BEAST" - a BEA gépi beszédleiratozási feladat, megközelítések és eredmények

  • Metaadatok
Tartalom: http://acta.bibl.u-szeged.hu/75875/
Archívum: SZTE Egyetemi Kiadványok Repozitórium
Gyűjtemény: Szakterület = 01. Természettudományok: 01.02. Számítás- és információtudomány
Szakterület = 01. Természettudományok
Szakterület = 06. Bölcsészettudományok: 06.02. Nyelvek és irodalom
Szakterület = 06. Bölcsészettudományok
Tipus = Konferencia vagy workshop anyag
Cím:
"Releasing the BEAST" - a BEA gépi beszédleiratozási feladat, megközelítések és eredmények
Létrehozó:
Mihajlik Péter
Balog András
Gráczi Tekla Etelka
Kohári Anna
Fegyó Tibor
Mády Katalin
Dátum:
2022
Téma:
01. Természettudományok
01.02. Számítás- és információtudomány
06. Bölcsészettudományok
06.02. Nyelvek és irodalom
Tartalmi leírás:
Bemutatjuk a BEA-Base adatbázist, mely az általános BEA (BEszélt nyelvi Adatbázis) 140 beszélős részhalmazának egyszerűsített és gépi beszédfelismerési kísérletekre előkészített kivonata. Definiáljuk a beszédfelismerési feladatot, melyben csak a BEA-Base adatbázis használható felügyelt adatként. Ismertetjük az alkalmazott, legkorszerűbb beszédfelismerési technikákra épülő beszédfelismerés megközelítéseket, úgymint hibrid rejtett Markov-modell/mély neuronhálós fonéma és graféma alapú rendszerek, konvolúciós és rekurrens hálókra épülő enkóder-dekóder end-to-end rendszerek figyelmi mechanizmussal vagy anélkül. Végül eljutunk a kontrasztív, önfelügyelt módon előtanított súlyokkal inicializált transzformer alapú megközelítésig, amit BEAST-nek (BEA Speech Transcriber) neveztünk el. Utóbbi rendszer – köszönhetően az 53 ezer órás hanganyagon történt előtanításnak – a klasszikus megoldáshoz képest 40%-kal csökkenti a legrelevánsabb szó- és betűhibaarányt, valamint a magyar Common Voice tesztadatokon is versenyképes leiratot szolgáltat.
Nyelv:
magyar
magyar
Típus:
Konferencia vagy workshop anyag
NonPeerReviewed
Formátum:
part
Azonosító:
Mihajlik Péter; Balog András; Gráczi Tekla Etelka; Kohári Anna; Fegyó Tibor; Mády Katalin: "Releasing the BEAST" - a BEA gépi beszédleiratozási feladat, megközelítések és eredmények.
Kapcsolat: