Hibatűrő keresés digitalizált magyar nyelvű szövegekben

Pataki, Máté and Füzessy, Tamás and Kovács, László and Tóth, Zoltán (2008) Hibatűrő keresés digitalizált magyar nyelvű szövegekben. In: Networkshop 2008. Dunaújváros, 2008..

[img]
Preview
Image (cover image)
cover.jpg - Cover Image

Download (4kB) | Preview
[img]
Preview
Text
200803_Networkshop_HibaturoKereses.pdf - Published Version

Download (116kB) | Preview

Abstract

Az írásos emlékek megőrzése a jövő számára egy fontos feladata korunknak. A ma készülő művek jelentős része már digitális formában is tárolásra kerül, ugyanakkor fontos, hogy a régebben, csak nyomtatásban megjelent könyvekhez, írott anyagokhoz is hozzáférést biztosítsunk korunk digitális nemzedékének. Az így előállt adatbázis azonban használhatatlan a tárolt anyagokban történő kereshetőség megteremtése nélkül. Az MTA SZTAKI Elosztott Rendszerek Osztálya egy GVOP pályázat keretében azt vizsgálta, hogy magyar nyelvű szkennelt szövegekben milyen hibák keletkeznek az eredeti dokumentumhoz képest. Ezeket az eredményeket felhasználva egy olyan kereső prototípusát építettük meg, amely egy digitalizálásból eredő hibákat tartalmazó adatbázisban is megbízhatóan tud keresni.

Item Type: Conference or Workshop Item (Paper)
Uncontrolled Keywords: OCR, search, error, character recognition
Subjects: Q Science > QA Mathematics and Computer Science > QA75 Electronic computers. Computer science / számítástechnika, számítógéptudomány
Divisions: Department of Distributed Systems
Depositing User: Eszter Nagy
Date Deposited: 11 Dec 2012 15:29
Last Modified: 11 Dec 2012 15:29
URI: http://eprints.sztaki.hu/id/eprint/4873

Update Item Update Item