Hibatűrő keresés digitalizált magyar nyelvű szövegekben
Pataki, Máté and Füzessy, Tamás and Kovács, László and Tóth, Zoltán (2008) Hibatűrő keresés digitalizált magyar nyelvű szövegekben. In: Networkshop 2008. Dunaújváros, 2008..
|
Image (cover image)
cover.jpg - Cover Image Download (4kB) | Preview |
|
|
Text
200803_Networkshop_HibaturoKereses.pdf - Published Version Download (116kB) | Preview |
Abstract
Az írásos emlékek megőrzése a jövő számára egy fontos feladata korunknak. A ma készülő művek jelentős része már digitális formában is tárolásra kerül, ugyanakkor fontos, hogy a régebben, csak nyomtatásban megjelent könyvekhez, írott anyagokhoz is hozzáférést biztosítsunk korunk digitális nemzedékének. Az így előállt adatbázis azonban használhatatlan a tárolt anyagokban történő kereshetőség megteremtése nélkül. Az MTA SZTAKI Elosztott Rendszerek Osztálya egy GVOP pályázat keretében azt vizsgálta, hogy magyar nyelvű szkennelt szövegekben milyen hibák keletkeznek az eredeti dokumentumhoz képest. Ezeket az eredményeket felhasználva egy olyan kereső prototípusát építettük meg, amely egy digitalizálásból eredő hibákat tartalmazó adatbázisban is megbízhatóan tud keresni.
Item Type: | Conference or Workshop Item (Paper) |
---|---|
Uncontrolled Keywords: | OCR, search, error, character recognition |
Subjects: | Q Science > QA Mathematics and Computer Science > QA75 Electronic computers. Computer science / számítástechnika, számítógéptudomány |
Divisions: | Department of Distributed Systems |
Depositing User: | Eszter Nagy |
Date Deposited: | 11 Dec 2012 15:29 |
Last Modified: | 11 Dec 2012 15:29 |
URI: | https://eprints.sztaki.hu/id/eprint/4873 |
Update Item |