Automatikus korpuszépítés tulajdonnév-felismerés céljára

Nemeskey, Dávid Márk and Simon, Eszter (2013) Automatikus korpuszépítés tulajdonnév-felismerés céljára. In: MSZNY 2013. Szegedi Tudományegyetem Informatikai Tanszékcsoport, Szeged, pp. 106-117. ISBN 978-963-306-189-3

[img]
Preview
Text
nemeskey_simon_2012.pdf - Published Version

Download (309kB) | Preview

Abstract

A felügyelt gépi tanulási módszerek alkalmazásához nagyméretű annotált korpuszokra van szükség, amelyek előállítása rendkívül emberierőforrás-igényes. Több lehetőség van az annotációs költségek csökkentésére, ezek közül az egyik az automatikus annotálás. Cikkünkben egy nyelvfüggetlen módszert mutatunk be, mellyel bármely Wikipédiával rendelkező nyelvre előállítható tulajdonnévi címkéket tartalmazó korpusz. Az automatikus annotálás során a DBpedia ontológiai kategóriáit képeztük le CoNLL-névosztályokra. Cikkünkben a magyar korpusz részletes hibaelemzését és kiértékelését adjuk.

Item Type: Book Section
Subjects: Q Science > QA Mathematics and Computer Science > QA75 Electronic computers. Computer science / számítástechnika, számítógéptudomány
Divisions: Informatics Laboratory
SWORD Depositor: MTMT Injector
Depositing User: MTMT Injector
Date Deposited: 10 Jul 2014 08:00
Last Modified: 10 Jul 2014 08:00
URI: https://eprints.sztaki.hu/id/eprint/7832

Update Item Update Item