Transcription of texts in digital environment – a review of selected tools
DOI:
https://doi.org/10.12775/SE.2016.020Keywords
digital documents, digital collections, tools for edition and text analysis, transcription, special programming toolsAbstract
Users’ requirements formulated in reference to quality and functionality of digital documents are constantly growing. Whereas in the first, pioneering projects of digital collections it was sufficient to have access to digital image of pages of a given document, at present creators of digital documents are expected to fit them with advanced tools of edition and text analysis, as well as ensuring their searchability. A chance to meet those requirements is, on the one hand, scanning documents with the use of optical character recognition and, on the other hand, subjecting the digital texts to the process of transcription using special programming tools. The article presents the possibilities of selected solutions in this area, pointing to possible areas of their use, and outlines the potential advantages and disadvantages of their functionality.
References
Distributed Proofreaders, http://www.pgdp.net/c/ (dostęp: 23.05.2014).
Dudczak A., DigitLab Wiki. Dokumentacja po polsku, https://confluence.man.poznan.pl/ community/display/DIG/Dokumentacja+po+polsku (dostęp: 23.05.2014).
Dudczak A., Od skanów do tekstu w kilku prostych krokach i dwóch smakach, http://lib.psnc.pl/Content/444/adudczak-thatcamp-lublin.pdf (dostęp: 23.05.2014).
Dudczak A., Wróż B., Wprowadzenie do Wirtualnego Laboratorium Transkrypcji, https://confluence.man.poznan.pl/community/display/WLT/Wprowadzenie+do+Wirtualnego+Laboratorium+Transkrypcji (dostęp: 23.05.2014).
FreeOCR.net, http://www.freeocr.net/ (dostęp: 16.02.2017).
Get Scriber, http://genscriber.com/genappsd/ (dostęp: 16.02.2017).
Ginther J., A New tool for Transcription of Digitized Manuscripts, http://earlymodernonlinebib.wordpress.com/2012/10/22/t-pen-a-new-tool-for-transcription-of-digitized-manuscripts/ (dostęp: 23.05.2014).
Holley R., Crowdsourcing. How and Why Should Libraries Do It?, „D-Lib Magazine” 2010, Vol. 16, No. 3/4, http://www.dlib.org/dlib/march10/holley/ 03holley.print.html (dostęp: 23.05.2014).
jacobboerema nl, http://www.jacobboerema.nl/en/Freeware.htm. (dostęp: 16.02.2017).
Kolasa W. M., 2012, Biblioteki cyfrowe na świecie – powstanie i rozwój, w: Biblioteki cyfrowe, red. M. Janiak, M. Krakowska i M. Próchnicka, Warszawa.
Kowalska M., 2007, Dygitalizacja zbiorów bibliotek polskich, Warszawa.
Kowalska M., Wykorzystywanie koncepcji mądrości tłumu w działalności bibliotek, „Toruńskie Studia Bibliologiczne” 2012, nr 2 (9).
Nahotko M., Zasady tworzenia bibliotek cyfrowych, „Biuletyn EBIB” 2006, nr 4 (74), http://www.ebib.info/2006/74/nahotko.php. (dostęp: 23.05.2014).
Raport o digitalizacji dóbr kultury. Program digitalizacji dóbr kultury oraz gromadzenia, przechowywania i udostępniania obiektów cyfrowych w Polsce 2009–2020, 2009, http://www.kongreskultury.pl/library/File/RaportDigitalizacja/Program digitalizacji 2009-2020.pdf. (dostęp: 23.05.2014), Warszawa.
tesseract-ocr, https://code.google.com/ p/tesseract-ocr/ (dostęp: 23.05.2014).
Downloads
Published
How to Cite
Issue
Section
Stats
Number of views and downloads: 343
Number of citations: 0