Ugrás a tartalomhoz

Humán annotált emóciókorpusz létrehozása aktorokhoz köthető érzelmek detektálására

  • Metaadatok
Tartalom: https://ojs.elte.hu/digitalisbolcseszet/article/view/4576
Archívum: Digitális Bölcsészet
Gyűjtemény: Műhely
Cím:
Creating a Human Annotated Emotion Corpus for the Detection of Actor-related Emotions
Humán annotált emóciókorpusz létrehozása aktorokhoz köthető érzelmek detektálására
Létrehozó:
Knap, Árpád
Tóth, Tímea Emese
Rakovics, Zsófia
Kiadó:
Bakonyi Géza Alapítvány, ELTE BTK Régi Magyar Irodalom Tanszék
Dátum:
2022-12-31
Téma:
szentimentdetektálás
érzelemdetektálás
szövegklasszifikáció
BERT
felügyelt modell
humán annotáció
Tartalmi leírás:
Tanulmányunkban egy olyan kutatási projektet mutatunk be, amelyben egy aktorokhoz (pl. intézményekhez, személyekhez) kapcsolódó, szentimentek és konkrét érzelmek klasszifikációjára képes nyelvi modell létrehozása a célunk. A modell tanítóadatbázisát egy tízezer cikkből álló, online újságokból származó, statisztikai mintavétel segítségével összeállított, humán annotált szövegkorpusz jelenti. Az annotálás során két lépcsőben először az előforduló névelemeket, illetve aktorként funkcionáló közneveket, majd ezt követően a névelemek szövegkörnyezetében megtalálható szentiment- és érzelmi tölteteket annotáljuk. Az annotált szövegek adatbázisa jó bemeneti adatot jelenthet felügyelt klasszifikációs modellek létrehozásához. Cikkünkben ismertetjük a projekt korpuszát, a felügyelt és nem felügyelt szövegklasszifikációs eljárások sajátosságait, valamint a szentiment- és érzelemdetektálás lehetséges módszereit. Ezt követően bemutatjuk a kutatásunkban alkalmazott kétlépcsős annotálási módszertant, az ennek kialakítása során felmerült problémákat és kihívásokat, illetve azokat a kutatói döntéseket, amelyeket a létrehozni kívánt modell társadalomtudományos felhasználhatóságának érdekében hoztunk meg.
Nyelv:
magyar
Típus:
info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Lektorált közlemény
Formátum:
application/pdf
Azonosító:
10.31400/dh-hun.2022.6.4576
Forrás:
Digitális Bölcsészet; szám 6 (2022): Digitális Bölcsészet; M:3-M:17
2630-9696
Kapcsolat:
Létrehozó:
Copyright (c) 2022 a szerző(k)