Transkrypcja tekstów w środowisku elektronicznym. Przegląd wybranych narzędzi
DOI:
https://doi.org/10.12775/SE.2016.020Słowa kluczowe
transkrypcja tekstów, dokumenty cyfrowe, digitalizacja, środowisko elektroniczneAbstrakt
Wymagania użytkowników formułowane w odniesieniu do jakości i funkcjonalności dokumentów cyfrowych stale rosną. O ile w pierwszych, pionierskich projektach kolekcji cyfrowych wystarczał dostęp do cyfrowego obrazu stron danego dokumentu, to obecnie od twórców dokumentów elektronicznych oczekuje się wyposażania ich w zaawansowane możliwości edycji i analizy tekstu oraz zapewniania ich przeszukiwalności. Szansą na spełnienie tych wymagań jest z jednej strony skanowanie obiektów z techniką optycznego rozpoznawania pisma, z drugiej – poddawanie dygitalizatów procesowi transkrypcji za pomocą specjalnych narzędzi programistycznych. Artykuł prezentuje możliwości wybranych rozwiązań w tym zakresie, wskazuje możliwe obszary ich zastosowań oraz nakreśla potencjalne zalety i wady w ich funkcjonalności.
Bibliografia
Distributed Proofreaders, http://www.pgdp.net/c/ (dostęp: 23.05.2014).
Dudczak A., DigitLab Wiki. Dokumentacja po polsku, https://confluence.man.poznan.pl/ community/display/DIG/Dokumentacja+po+polsku (dostęp: 23.05.2014).
Dudczak A., Od skanów do tekstu w kilku prostych krokach i dwóch smakach, http://lib.psnc.pl/Content/444/adudczak-thatcamp-lublin.pdf (dostęp: 23.05.2014).
Dudczak A., Wróż B., Wprowadzenie do Wirtualnego Laboratorium Transkrypcji, https://confluence.man.poznan.pl/community/display/WLT/Wprowadzenie+do+Wirtualnego+Laboratorium+Transkrypcji (dostęp: 23.05.2014).
FreeOCR.net, http://www.freeocr.net/ (dostęp: 16.02.2017).
Get Scriber, http://genscriber.com/genappsd/ (dostęp: 16.02.2017).
Ginther J., A New tool for Transcription of Digitized Manuscripts, http://earlymodernonlinebib.wordpress.com/2012/10/22/t-pen-a-new-tool-for-transcription-of-digitized-manuscripts/ (dostęp: 23.05.2014).
Holley R., Crowdsourcing. How and Why Should Libraries Do It?, „D-Lib Magazine” 2010, Vol. 16, No. 3/4, http://www.dlib.org/dlib/march10/holley/ 03holley.print.html (dostęp: 23.05.2014).
jacobboerema nl, http://www.jacobboerema.nl/en/Freeware.htm. (dostęp: 16.02.2017).
Kolasa W. M., 2012, Biblioteki cyfrowe na świecie – powstanie i rozwój, w: Biblioteki cyfrowe, red. M. Janiak, M. Krakowska i M. Próchnicka, Warszawa.
Kowalska M., 2007, Dygitalizacja zbiorów bibliotek polskich, Warszawa.
Kowalska M., Wykorzystywanie koncepcji mądrości tłumu w działalności bibliotek, „Toruńskie Studia Bibliologiczne” 2012, nr 2 (9).
Nahotko M., Zasady tworzenia bibliotek cyfrowych, „Biuletyn EBIB” 2006, nr 4 (74), http://www.ebib.info/2006/74/nahotko.php. (dostęp: 23.05.2014).
Raport o digitalizacji dóbr kultury. Program digitalizacji dóbr kultury oraz gromadzenia, przechowywania i udostępniania obiektów cyfrowych w Polsce 2009–2020, 2009, http://www.kongreskultury.pl/library/File/RaportDigitalizacja/Program digitalizacji 2009-2020.pdf. (dostęp: 23.05.2014), Warszawa.
tesseract-ocr, https://code.google.com/ p/tesseract-ocr/ (dostęp: 23.05.2014).
Pobrania
Opublikowane
Jak cytować
Numer
Dział
Statystyki
Liczba wyświetleń i pobrań: 343
Liczba cytowań: 0