Prolegomena do parametryzacji ekwiwalentów kontekstowych i słownikowych w bitekście polsko-rosyjskim: wymiar lakunarności (na przykładzie utworu gatunku fantasy
DOI:
https://doi.org/10.26881/srg.2024.11.10Słowa kluczowe:
lakunarność, bitekst, tagowanie, uczenie maszynoweAbstrakt
Artykuł poświęcony jest zagadnieniu lakunarności w badaniach nad polsko-rosyjskim bitekstem (BTXT) i powiązaniu tych badań z dziedziną systemów uczących się. Zdefiniowano, czym jest zjawisko lakunarności i jakie są rodzaje luk w BTXT. Analizę przeprowadzono na trzydziestu BTXT typu {zdanie X L1|||zdanie X L2} zaczerpniętych odpowiednio z powieści Andrzeja Sapkowskiego Boży bojownicy i jej rosyjskiego przekładu Божьи воины autorstwa Jewgienija Wajsbrota. Podstawowym kryterium analizy jest asymetria między L1 (np. zdaniem w języku polskim) i L2 (np. zdaniem w języku rosyjskim) w ramach serii parametrów: typ konotacji, przynależność do stylu funkcjonalnego, frazem/niefrazem, hapaks, znaczenie sumaryczne/asumaryczne, dystrybucja komponentów, metaforyczność/niemetaforyczność, znaczenie leksykalne komponentów, przynależność do klasy paremii. Lakunarność rozumiana jest jako brak określonej cechy lub sumy cech w zdaniu X w L2 w stosunku do zdania X w L1. Taka lakunarność jest utożsamiana z asymetrią cech. Wyniki parametryzacji wspomnianej asymetrii świadczą, że parametryzacja i tagowanie BTXT mogą mieć właściwości modularne, co z kolei może służyć do trenowania sieci neuronowej, tj. do głębszej (automatycznej, niemanualnej) analizy większej liczby równoległych tekstów. W badaniu najwięcej uwagi poświęcono frazemom (FR) – kolokacjom i idiomom.