Informatyczne technologie języka – wyzwania dla polskiej lingwistyki. Na przykładach z badań własnych

Zygmunt Vetulani

DOI: http://dx.doi.org/10.12775/LinCop.2017.011

Abstrakt


W niniejszym artykule przedstawiamy wybrane prace ilustrujące złożoność i różnorodność problemów, z którymi konfrontowani są twórcy systemów z kompetencją językową. Przegląd szczegółowy obejmuje wybór informatycznych technologii języka naturalnego w ramach projektów realizowanych w Zakładzie Lingwistyki Informatycznej i Sztucznej Inteligencji UAM w ostatnim 30-leciu. Są to przede wszystkim prace z zakresu tworzenia zasobów leksykalnych, gramatycznych i semantycznych oraz systemów z kompetencją językową. Celem przeglądu jest ilustracja, konkretnymi zadaniami, wybranych wyzwań, przed którymi stanęła w drugiej połowie XX wieku lingwistyka polska. Jednocześnie staramy się zwrócić uwagę na fakt, że większość z tych wyzwań jest i nadal będzie aktualna. Przegląd ten nie pretenduje do kompletności, w szczególności nie obejmuje całego, bardzo ważnego sektora przetwarzania mowy.


Słowa kluczowe


lingwistyka komputerowa; technologie języka; zasoby językowe; systemy z kompetencją językową

Pełny tekst:

PDF

Bibliografia


Colmerauer A., Kittredge R., 1982, ORBIS, COLING 1982.

Fillmore Ch.J., Baker C.F., Sato H., 2002, The FrameNet Database and Software Tools. LREC 2002 Proceedings, ELRA/ELDA Paris, 1157–1160.

Gross M., 1975, Méthodes en syntaxe, Paris: Hermann.

Polański K. (red.), 1980–1992, Słownik syntaktyczno-generatywny czasowników polskich, vol. 1–4, Ossolineum: Wrocław; vol. 5, Kraków: Instytut Języka Polskiego PAN.

Marasek K. , Gubrynowicz R., 2008, Design and Data Collection for Spoken Polish Dialogs Database, LREC 2008 Proceedings, ELRA/ELDA, Paris, 185–189.

Miller G.A., Felbaum Ch.. 2007, WordNet then and now. Language Resources and Evaluation 41(2), 209–214.

Piasecki M., Burdka Ł., Maziarz M., Kalinski M., 2016, Diagnostic Tools in plWordNet Development Process, w: Lecture Notes in Computer Science 9561, Springer, 255–273.

Przepiórkowski A., 2004, The IPI PAN Corpus. Preliminary version, Warszawa: Instytut Podstaw Informatyki PAN.

Szpakowicz S., 1983, Formalny opis składniowy zdań polskich, Warszawa: Wydawnictwo Uniwersytetu Warszawskiego.

Szymczak M. (red.), 1978–1981, Słownik języka polskiego, t. 1–3, Warszawa: Państwowe Wydawnictwo Naukowe.

Urbańczyk St. (red.), 1984, Gramatyka współczesnego języka polskiego. Składnia. Morfologia, Warszawa: Państwowe Wydawnictwo Naukowe.

Vetulani G., 2000, Rzeczowniki predykatywne języka polskiego. W kierunku syntaktycznego słownika rzeczowników predykatywnych, Poznań: Wydawnictwo Naukowe UAM.

Vetulani G., 2012, Kolokacje werbo-nominalne jako samodzielne jednostki języka. Syntaktyczny słownik kolokacji werbo-nominalnych języka polskiego na potrzeby zastosowań informatycznych. Część I., Poznań: Wydawnictwo Naukowe UAM.

Vetulani Z., 1990, Corpus of consultative dialogues. Experimentally collected source data for AI applications, Poznań: Adam Mickiewicz University Press.

Vetulani Z., 1988, PROLOG Implementation of an Access in Polish to a Data Base, Studia z automatyki XII, 5–23.

Vetulani Z., 2000, Electronic Language Resources for POLISH: POLEX, CEGLEX and GRAMLEX, w: M. Gavrilidou et al. (eds.), Second International Conference on Language Resources and Evaluation, Athens, Greece, 30.05.–2.06.2000, (Proceedings), Paris: ELRA, 367–374.

Vetulani Z., 2005, Joint Panel on Technology for Linguistics, Linguistics for Technology, w: Human Language Technologies as a Challenge for Computer Science and Linguistics, Proc. of Language and Technology Conference, April 21–23, 2005, Poznań, Poland, Poznań: Wyd. Poznańskie, pp. XXVI–XXX.

Vetulani Z., 2006, Tradition and New Challenges for the HLT Community, Studia Informatica, 1/2(7), 161–177.

Vetulani Z., 2014, PolNet – Polish WordNet., w: Human Language Technology. Challenges for Computer Science and Linguistics. LTC 2011. Revised Selected Papers. LNAI 8387, Berlin Heidelberg: Springer-Verlag, 408–416.

Vetulani Z., Martinek J., Obrębski T., Vetulani G., 1998b, Dictionary Based Methods and Tools for Language Engineering, Poznań: Adam Mickiewicz University Press.

Vetulani Z., Marcinak J., Obrębski J., Vetulani G., Dabrowski A., Kubis M., Osiński J., Walkowska J., Kubacki P., Witalewski K., 2010, Zasoby językowe i technologie przetwarzania tekstu. POLINT-112-SMS jako przykład aplikacji z zakresu bezpieczeństwa publicznego, Adam Mickiewicz University Press: Poznań.

Vetulani Z., Osiński J., 2017. Intelligent Tnformation Bypass for More Efficient Emergency Management, CMST 23(2), 105–123.

Vetulani Z., Vetulani G., 2014, Through Wordnet to Lexicon Grammar, w: Fryni akoyianni Doa (ed.). Penser le lexique grammaire: perspectives actuelles, Pa ris : Editions Honoré Champion, 531–543.

Vetulani Z., Walczak B., Obrębski T., Vetulani G., 1998a, Unambiguous coding of the inflection of Polish nouns and its application in electronic dictionaries – format POLEX, Poznań: Adam Mickiewicz University Press.

Wagner A., Bachan J., Klessa K., Demenko G., 2015, Przegląd wybranych aspektów analizy prozodii mowy spontanicznej na potrzeby technologii mowy, Prace Filologiczne LXVI, 271–298.

Walker D., Zampolli A., Calzolari N. (eds.), 1994, Automating the lexicon: research and practice in a multilingual environment, Oxford: OUP

Ziółko B., Ziółko M., 2011, Przetwarzanie mowy, Kraków: Wydawnictwa AGH.

Zampolli A. 1996, Współpraca międzynarodowa w dziedzinie LR; Informatyka, Nr 3, s. 34–37.








ISSN 2080-1068 (print)
ISSN 2391-7768 (online)

Partnerzy platformy czasopism