Between a corpus and digital scholarly edition – based on the example of the “Corpus of The Great Four”
DOI:
https://doi.org/10.12775/SE.2023.00011Keywords
corpus, natural language processing, Polish Romanticism, Adam Mickiewicz, Juliusz Słowacki, Zygmunt Krasiński, Cyprian Norwid, idiolect, vocabularyAbstract
The text discusses the bases of the Corpus of The Great Four (Korpus Czterech Wieszczów) project, the aim of which is to create a database of all texts by Juliusz Słowacki, Adam Mickiewicz, Zygmunt Krasiński and Cyprian Norwid. The article, above all, discusses the most important differences between the corpus approach and the digital scholarly edition. The fundamental difference is in the purpose – the aim of editors’ work is to provide the reader with a text that is prepared and fit to read, while the corpus is primarily used for research and analysis. Thanks to the unified rules for developing the sub-corpora of all four poets, it will also be possible to compare them with each other. The introduction of a set of annotations will allow for better organization of the material and enable new research directions.
References
Analizator i generator fleksyjny Morfeusz 2, http://morfeusz.sgjp.pl/ (dostęp: 14.04.2023).
Bąbiak G. P., 2021, Pisma zebrane a edycje krytyczne polskiej literatury. Zarys zjawiska, „Sztuka Edycji. Studia Tekstologiczne i Edytorskie”, nr 1 (19): Tradycja a wymogi współczesności w pracy edytora, pod red. M. Strzyżewskiego.
Bem P., 2020, Tekst „edytorski” czy „wieloautorski”. Kilka uwag o heterogeniczności edytorstwa naukowego, „Pamiętnik Literacki”, z. 4.
Biber D., Conrad S., Reppen R., 2008, Corpus Linguistics: Investigating Language Structure and Use, Cambridge.
Bizior-Dombrowska M., 2015, Wstęp, w: Z. Krasiński, Nie-Boska komedia. Wydanie krytyczne pierwodruku z 1835 roku, Toruń.
Bryant J., 2020, Płynny tekst, tłum. Ł. Cybulski, Warszawa.
Eder M., 2014, Metody ścisłe w literaturoznawstwie i pułapki pozornego obiektywizmu ‒ przykład stylometrii, „Teksty Drugie”, nr 2.
Elektroniczny Korpus Tekstów Polskich z XVII I XVIII w. (do 1772 r.), https://korba.edu.pl/query_corpus/ (dostęp: 14.04.2023).
Hojdis B., Cankudis A., 2020, Cyfrowe edycje literackie i naukowe jako element cyfrowej humanistyki, „Sztuka Edycji. Studia Tekstologiczne i Edytorskie”, nr 1 (17): Tekstografie. Edytorskie przestrzenie tekstu i obrazu, pod red. M. Czerwińskiego, I. Kropidło i O. Taranek-Wolańskiej.
Jeżowski M., 2002, Słownik rymów Juliusza Słowackiego, Warszawa, https://www.slownikjezykanorwida.uw.edu.pl/ (dostęp: 5.05.2023).
Korpus polszczyzny XVI wieku, w: Słownik polszczyzny XVI wieku, http://spxvi.edu.pl/korpus/ (dostęp: 14.04.2023).
Korpus tekstów staropolskich, w: Instytut Języka Polskiego PAN, https://ijp.pan.pl/publikacje-i-materialy/zasoby/korpus-tekstow-staropolskich/ (dostęp: 14.04.2023).
Korpysz T. et al., 2022, „Korpus Czterech Wieszczów” – cyfrowy wymiar dziedzictwa narodowego, „Poradnik Językowy”, nr 7.
Kucera H., Francis W. N., 1967, Computational Analysis of Present-Day American English, Providence.
Loth R., 2006, Podstawowe problemy i pojęcia tekstologii i edytorstwa naukowego, Warszawa.
Lüdeling A., Kytö M., 2010, Corpus Linguistics: An International Handbook, Berlin.
McEnery T., Hardie A., 2011, Corpus Linguistics: Method, Theory and Practice, Cambridge.
McGann J., 2016, Nowa Respublica litteraria. Pamięć i nauka w wieku cyfryzacji, tłum. P. Bem et al., Warszawa.
Mędrzecka-Stefańska A., Mirkowska E., 2023, Słowacki cyfrowy – perspektywy i szanse edycji cyfrowej, „Sztuka Edycji. Studia Tekstologiczne i Edytorskie”, nr 2 (24): Edycje romantyków – interpretacje romantyzmu, pod red. M. Strzyżewskiego i A. Markuszewskiej (w druku).
Moretti F., 2013, Distant Reading, London.
Narodowy Korpus Języka Polskiego, 2012, pod red. A. Przepiórkowskiego et al., Warszawa.
Narodowy Korpus Języka Polskiego, http://nkjp.pl/poliqarp/help/ense2.html (dostęp: 14.04.2023).
O projekcie, w: Automatyczna analiza fleksyjna polszczyzny XIX wieku, http://www.f19.uw.edu.pl/o-projekcie/ (dostęp: 14.04.2023).
Ohge Ch., 2021, Publishing Scholarly Editions. Archives, Computing, and Experience, Cambridge.
Pawelec D., 2020, Edytorstwo jako krytyka literacka, „Pamiętnik Literacki”, z. 4.
Pawłowski A., 2020, Lingwistyka kwantytatywna a humanistyka cyfrowa: ciągłość czy zmiana?, w: Polszczyzna w dobie cyfryzacji, pod red. A. Hąci, K. Kłosińskiej i P. Zbróga, Warszawa.
Piasecki M., 2008, Cele i zadania lingwistyki informatycznej, w: Metodologie językoznawstwa. Współczesne tendencje i kontrowersje, pod red. P. Stalmaszczyka, Kraków.
Piasecki M., Walkowiak T., Maryl M., 2017, Literary Exploration Machine: A New Tool for Distant Readers of Polish Literature, https://ws.clarin-pl.eu/lem# (dostęp: 11.03.2023).
Podstawy językoznawstwa korpusowego, 2005, pod red. B. Lewandowskiej-Tomaszczy, Łódź.
Poetyka i matematyka, 1965, red. M. R. Mayenowa, Warszawa.
Prussak M., 2020, Zmierzch edycji krytycznych?, „Pamiętnik Literacki”, z. 4.
Raptularz Wschodni Juliusza Słowackiego, 2019, t. 2: Edycja – komentarz – objaśnienia, oprac. M. Kalinowska (poemat), Z. Przychodniak (wiersze), M. Troszyński (proza), pod red. Z. Przychodniaka, Warszawa.
Sahle P., 2016, What Is a Scholarly Digital Edition?, w: Digital Scholarly Editing: Theories and Practices, eds. M. Driscoll, E. Pierazzo, Cambridge, https://www.google.com/url?q=https://books.openedition.org/obp/3397&sa=D&source=docs&ust=1677859569335276&usg=AOvVaw2AR-9LkwZLCrmogRHQ8O61 (dostęp: 3.03.2023).
Sambor J., 1969, Badania statystyczne nad słownictwem (na materiale „Pana Tadeusza”), Wrocław‒Warszawa‒Kraków.
Sambor J., 1972, Słowa i liczby, Wrocław.
Shillingsburg P. L., 2020, Od Gutenberga do Google’a. Elektroniczne reprezentacje tekstów literackich, tłum. P. Bem, red. nauk. A. P. Lesiakowski, Warszawa.
Słownik języka Adama Mickiewicza, 1962–1983, t. 1–11, pod red. K. Górskiego i S. Hrabca, Wrocław.
Strzyżewski M., 2020, O szaleństwie edytorów w perspektywie „ratio” i „praxis”, „Pamiętnik Literacki”, z. 4.
Śliwińska M., 2014, Dzieła zebrane Zygmunta Krasińskiego – elektroniczna edycja naukowa, „Sztuka Edycji. Studia Tekstologiczne i Edytorskie”, nr 1‒2 (6): Zygmunt Krasiński – edycje i interpretacje, pod red. M. Strzyżewskiego.
Świdziński M., 2006, Lingwistyka korpusowa w Polsce – źródła, stan, perspektywy, „LingVaria”, nr 1.
TEI NPLP, https://tei.nplp.pl (dostęp: 14.04.2023).
The Literary Irony in the Works of Juliusz Słowacki, w: Selected Papers from the CLARIN Annual Conference 2020, https://ecp.ep.liu.se/index.php/clarin/article/view/16 (dostęp: 14.04.2023).
Troszyński M., 2017, Alchemia rękopisu. „Samuel Zborowski” Juliusza Słowackiego, Warszawa.
Usługi – CLARIN-PL, https://clarin-pl.eu/index.php/uslugi/ (dostęp: 14.04.2023).
Wojtyńska-Nowotka M., 2020, Słownik języka Maurycego Mochnackiego (na podstawie „Rozpraw literackich”), Warszawa.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2023 Anna Mędrzecka-Stefańska

This work is licensed under a Creative Commons Attribution-NoDerivatives 4.0 International License.
Stats
Number of views and downloads: 517
Number of citations: 0