Automatikus korpuszépítés tulajdonnév-felismerés céljára

Nemeskey, Dávid Márk and Simon, Eszter (2013) Automatikus korpuszépítés tulajdonnév-felismerés céljára. In: MSZNY 2013, 2013-01-07 - 2013-01-08, Szeged, Magyarország.

Full text not available from this repository.

Abstract

A felügyelt gépi tanulási módszerek alkalmazásához nagyméretű annotált korpuszokra van szükség, amelyek előállítása rendkívül emberierőforrás-igényes. Több lehetőség van az annotációs költségek csökkentésére, ezek közül az egyik az automatikus annotálás. Cikkünkben egy nyelvfüggetlen módszert mutatunk be, mellyel bármely Wikipédiával rendelkező nyelvre előállítható tulajdonnévi címkéket tartalmazó korpusz. Az automatikus annotálás során a DBpedia ontológiai kategóriáit képeztük le CoNLL-névosztályokra. Cikkünkben a magyar korpusz részletes hibaelemzését és kiértékelését adjuk.

Item Type: Conference or Workshop Item (Lecture)
Subjects: Q Science > QA Mathematics and Computer Science > QA75 Electronic computers. Computer science / számítástechnika, számítógéptudomány
Divisions: ?? R104a ??
Depositing User: EPrints Admin
Date Deposited: 18 Feb 2013 13:55
Last Modified: 05 Feb 2014 12:33
URI: http://eprints.sztaki.hu/id/eprint/6874

Update Item Update Item