Bevezető Kereső Szókincstérképek Forrásjegyzék Morfoszintaktikai címkék Útmutató a kereséshez Jelmagyarázat A találatok értelmezése Kapcsolat About the project
.

Szemantikus térképek a korpusz lexémáiról

Az alábbi linkekről elérhető térképeken a korpuszban legalább 3-szor előforduló lexémák szerepelnek. A disztribúcióalapú modelleket a fastText eszközben implementált neurális hálók betanításával hoztuk létre a korpusz annotált anyagán. Az eredetileg 300 dimenziós vektortérmodellekben a hasonló szövegkörnyezetekben előforduló elemek reprezentációja foglal el egymáshoz közeli pozíciókat, a különböző környezetekben szereplő elemek távolabb helyezkednek el egymástól. A tematikus térképeket a reprezentációk 300 dimenziós térből két dimenzióba való vetítésével hoztuk létre. Az alábbi képekre kattinva elérhető navigálható térképeken szereplő elemekre duplán kattintva lekérdezés kezdeményehető az adott lemma korpuszbeli előfordulásaira.

Tematikus térkép:
Csak a korpusz anyagának felhasználásával készült
Nyelvi térkép 1:
Bővített korpuszt használtunk a ritka szavak reprezentációjának javítása érdekében
Nyelvi térkép 2:
Bővített korpuszt használtunk a ritka szavak reprezentációjának javítása érdekében
A korpusz létrehozását a következő két pályázat támogatta, illetve támogatja: OTKA K 81189 és NKFI–OTKA K 116217.