Automatikus korpuszépítés tulajdonnév-felismerés céljára
Nemeskey, Dávid Márk and Simon, Eszter (2013) Automatikus korpuszépítés tulajdonnév-felismerés céljára. In: MSZNY 2013. Szegedi Tudományegyetem Informatikai Tanszékcsoport, Szeged, pp. 106-117. ISBN 978-963-306-189-3
|
Text
nemeskey_simon_2012.pdf - Published Version Download (309kB) | Preview |
Abstract
A felügyelt gépi tanulási módszerek alkalmazásához nagyméretű annotált korpuszokra van szükség, amelyek előállítása rendkívül emberierőforrás-igényes. Több lehetőség van az annotációs költségek csökkentésére, ezek közül az egyik az automatikus annotálás. Cikkünkben egy nyelvfüggetlen módszert mutatunk be, mellyel bármely Wikipédiával rendelkező nyelvre előállítható tulajdonnévi címkéket tartalmazó korpusz. Az automatikus annotálás során a DBpedia ontológiai kategóriáit képeztük le CoNLL-névosztályokra. Cikkünkben a magyar korpusz részletes hibaelemzését és kiértékelését adjuk.
Item Type: | Book Section |
---|---|
Subjects: | Q Science > QA Mathematics and Computer Science > QA75 Electronic computers. Computer science / számítástechnika, számítógéptudomány |
Divisions: | Informatics Laboratory |
SWORD Depositor: | MTMT Injector |
Depositing User: | MTMT Injector |
Date Deposited: | 10 Jul 2014 08:00 |
Last Modified: | 10 Jul 2014 08:00 |
URI: | https://eprints.sztaki.hu/id/eprint/7832 |
Update Item |