Kereső
Bejelentkezés
Kapcsolat
"Releasing the BEAST" - a BEA gépi beszédleiratozási feladat, megközelítések és eredmények |
Tartalom: | http://acta.bibl.u-szeged.hu/75875/ |
---|---|
Archívum: | SZTE Egyetemi Kiadványok Repozitórium |
Gyűjtemény: |
Szakterület = 01. Természettudományok: 01.02. Számítás- és információtudomány
Szakterület = 01. Természettudományok Szakterület = 06. Bölcsészettudományok: 06.02. Nyelvek és irodalom Szakterület = 06. Bölcsészettudományok Tipus = Konferencia vagy workshop anyag |
Cím: |
"Releasing the BEAST" - a BEA gépi beszédleiratozási feladat, megközelítések és eredmények
|
Létrehozó: |
Mihajlik Péter
Balog András
Gráczi Tekla Etelka
Kohári Anna
Fegyó Tibor
Mády Katalin
|
Dátum: |
2022
|
Téma: |
01. Természettudományok
01.02. Számítás- és információtudomány
06. Bölcsészettudományok
06.02. Nyelvek és irodalom
|
Tartalmi leírás: |
Bemutatjuk a BEA-Base adatbázist, mely az általános BEA (BEszélt nyelvi Adatbázis) 140 beszélős részhalmazának egyszerűsített és gépi beszédfelismerési kísérletekre előkészített kivonata. Definiáljuk a beszédfelismerési feladatot, melyben csak a BEA-Base adatbázis használható felügyelt adatként. Ismertetjük az alkalmazott, legkorszerűbb beszédfelismerési technikákra épülő beszédfelismerés megközelítéseket, úgymint hibrid rejtett Markov-modell/mély neuronhálós fonéma és graféma alapú rendszerek, konvolúciós és rekurrens hálókra épülő enkóder-dekóder end-to-end rendszerek figyelmi mechanizmussal vagy anélkül. Végül eljutunk a kontrasztív, önfelügyelt módon előtanított súlyokkal inicializált transzformer alapú megközelítésig, amit BEAST-nek (BEA Speech Transcriber) neveztünk el. Utóbbi rendszer – köszönhetően az 53 ezer órás hanganyagon történt előtanításnak – a klasszikus megoldáshoz képest 40%-kal csökkenti a legrelevánsabb szó- és betűhibaarányt, valamint a magyar Common Voice tesztadatokon is versenyképes leiratot szolgáltat.
|
Nyelv: |
magyar
magyar
|
Típus: |
Konferencia vagy workshop anyag
NonPeerReviewed
|
Formátum: |
part
|
Azonosító: |
Mihajlik Péter; Balog András; Gráczi Tekla Etelka; Kohári Anna; Fegyó Tibor; Mády Katalin: "Releasing the BEAST" - a BEA gépi beszédleiratozási feladat, megközelítések és eredmények.
|
Kapcsolat: |