Transkrypcja tekstów w środowisku elektronicznym. Przegląd wybranych narzędzi

Małgorzata Kowalska

DOI: http://dx.doi.org/10.12775/SE.2016.020

Abstrakt


Wymagania użytkowników formułowane w odniesieniu do jakości i funkcjonalności dokumentów cyfrowych stale rosną. O ile w pierwszych, pionierskich projektach kolekcji cyfrowych wystarczał dostęp do cyfrowego obrazu stron danego dokumentu, to obecnie od twórców dokumentów elektronicznych oczekuje się wyposażania ich w zaawansowane możliwości edycji i analizy tekstu oraz zapewniania ich przeszukiwalności. Szansą na spełnienie tych wymagań jest z jednej strony skanowanie obiektów z techniką optycznego rozpoznawania pisma, z drugiej – poddawanie dygitalizatów procesowi transkrypcji za pomocą specjalnych narzędzi programistycznych. Artykuł prezentuje możliwości wybranych rozwiązań w tym zakresie, wskazuje możliwe obszary ich zastosowań oraz nakreśla potencjalne zalety i wady w ich funkcjonalności.


Słowa kluczowe


transkrypcja tekstów; dokumenty cyfrowe; digitalizacja; środowisko elektroniczne

Pełny tekst:

PDF

Bibliografia


Distributed Proofreaders, http://www.pgdp.net/c/ (dostęp: 23.05.2014).

Dudczak A., DigitLab Wiki. Dokumentacja po polsku, https://confluence.man.poznan.pl/ community/display/DIG/Dokumentacja+po+polsku (dostęp: 23.05.2014).

Dudczak A., Od skanów do tekstu w kilku prostych krokach i dwóch smakach, http://lib.psnc.pl/Content/444/adudczak-thatcamp-lublin.pdf (dostęp: 23.05.2014).

Dudczak A., Wróż B., Wprowadzenie do Wirtualnego Laboratorium Transkrypcji, https://confluence.man.poznan.pl/community/display/WLT/Wprowadzenie+do+Wirtualnego+Laboratorium+Transkrypcji (dostęp: 23.05.2014).

FreeOCR.net, http://www.freeocr.net/ (dostęp: 16.02.2017).

Get Scriber, http://genscriber.com/genappsd/ (dostęp: 16.02.2017).

Ginther J., A New tool for Transcription of Digitized Manuscripts, http://earlymodernonlinebib.wordpress.com/2012/10/22/t-pen-a-new-tool-for-transcription-of-digitized-manuscripts/ (dostęp: 23.05.2014).

Holley R., Crowdsourcing. How and Why Should Libraries Do It?, „D-Lib Magazine” 2010, Vol. 16, No. 3/4, http://www.dlib.org/dlib/march10/holley/ 03holley.print.html (dostęp: 23.05.2014).

jacobboerema nl, http://www.jacobboerema.nl/en/Freeware.htm. (dostęp: 16.02.2017).

Kolasa W. M., 2012, Biblioteki cyfrowe na świecie – powstanie i rozwój, w: Biblioteki cyfrowe, red. M. Janiak, M. Krakowska i M. Próchnicka, Warszawa.

Kowalska M., 2007, Dygitalizacja zbiorów bibliotek polskich, Warszawa.

Kowalska M., Wykorzystywanie koncepcji mądrości tłumu w działalności bibliotek, „Toruńskie Studia Bibliologiczne” 2012, nr 2 (9).

Nahotko M., Zasady tworzenia bibliotek cyfrowych, „Biuletyn EBIB” 2006, nr 4 (74), http://www.ebib.info/2006/74/nahotko.php. (dostęp: 23.05.2014).

Raport o digitalizacji dóbr kultury. Program digitalizacji dóbr kultury oraz gromadzenia, przechowywania i udostępniania obiektów cyfrowych w Polsce 2009–2020, 2009, http://www.kongreskultury.pl/library/File/RaportDigitalizacja/Program digitalizacji 2009-2020.pdf. (dostęp: 23.05.2014), Warszawa.

tesseract-ocr, https://code.google.com/ p/tesseract-ocr/ (dostęp: 23.05.2014).








ISSN 2084-7963 (print)
ISSN 2391-7903 (online)

Partnerzy platformy czasopism