Zakład Językoznawstwa Stosowanego i Translatoryki

Temat badawczy: KONSTRUKCJA ELEKTRONICZNYCH SŁOWNIKÓW (BAZ DANYCH LEKSYKALNYCH) I DEZAMBIGUIZACJA ZNACZENIOWA DLA CELÓW TŁUMACZENIA AUTOMATYCZNEGO

W naszym Zakładzie realizowane są głównie prace w ramach ujęcia obiektowego nad dezambiguizacją wyrażeń polisemicznych języka francuskiego, hiszpańskiego, włoskiego i angielskiego dla celów tłumaczenia automatycznego oraz konstrukcja słowników elektronicznych - elektronicznych baz danych leksykalnych.
Nadrzędną cechą realizowanych w ramach projektu opisów językoznawczych i ich aplikacji informatycznych jest ich modularność, przy czym modularność rozumiana jest tutaj w sposób rozszerzony, nie tylko jako możliwość wydzielenia w opracowywanym materiale językoznawczym czy też realizowanym dlań software części składowych i oddzielne ich badanie czy też konstruowanie (w sensie dekompozycji zatem), ale także jako takie ich opracowywanie, aby opis / konstrukcja proponowany/a mógł być wykorzystywany/a w innych kompleksach opisowych i softwarowych, niż aktualnie prowadzony (w sensie kompozycji zatem, co pozwala na maksymalną "rentowność" i "mobilność" realizowanych prac) a także takie, które dąży do jak największej autonomizacji modułów opisowych / aplikacyjnych, co gwarantuje konieczność mniejszych zmian w modułach połączonych tak, by jego zawartość nie musiała ewentualnie podlegać modyfikacji.
Takie podejście do opisu językoznawczego i konstrukcji software określa szczegóły metodologiczne i konstrukcyjne realizowanych zadań.
Oczywiście, opis w kategoriach tak ujętych klas obiektowych musi być bardzo precyzyjny; natomiast fakt, że jakiś moduł jest właśnie częścią modułową większej całości daje możliwość:
• Z jednej strony, skalowania stopnia precyzacji opisu, z punktu widzenia np. celu, dla którego realizujemy dany opis: inny będzie stopień precyzji opisu jeśli chodzi o dane dla dezambiguizacji automatycznej, inny zaś jeśli chodzi o dane dla klasyfikacji kontekstów użycia wyrażeń bez dążenia do zautomatyzowania automatyzacji procedur, inny stopień precyzji opisu będzie także w przypadku podstawowego zestawu słów a inny w przypadku zestawu słów rejestru specjalistycznego, etc.
• Z drugiej strony, jeśli chodzi o język ogólny, stopień precyzji opisu będzie zależał od konkretnych celów danej aplikacji, gdyż, w prezentowanym ujęciu frame-scriptowym, opis obiektowy zakłada, po pierwsze, pewną redundancję informacyjną w poszczególnych rekordach a także, po drugie, wzajemne przenikanie się informacji między modułami, co widać najlepiej być może na przykładzie połączeń relacji semantyczno-leksykalnych między rekordami opisowymi elementów danej klasy obiektowej a rekordami opisowymi elementów klas pozostających czy to w relacji super-klasy (hiperonimii), pod-klasy (hiponimii) czy też koordynacji klas do wyjściowej, tego typu ujęcie predestynowane jest do dynamicznego wykorzystywania, w celu zwiększania skuteczności rozwiązywania semantyczno - leksykalnych problemów tłumaczenia automatycznego, antynomii lokalnego opisu modułowego i opisu globalnego, holistycznego (dzięki procedurom wydobywania krzyżujących się informacji typu np. wyżej wymienionego).
Ujęcie zorientowane obiektowo jest dopełnione poprzez powracający uogólniający cykl klasyfikowania operatorów i atrybutów w klasy, których klamrą jest dana forma leksykalna
i stanowi jednocześnie metodę wskazywania w kontekście, w której występuje dana forma leksykalna, tych elementów, należących do jakiejś klasy obiektowej, które pozwalają na nowy sposób wydobywania ilości jej znaczeń, która, w tej opcji, jest wypadkową różnych klas obiektowych realizowanych na pozycjach argumentowych i różnych odpowiedników w języku, na który dokonuje się tłumaczenia.
Z tej perspektywy, ilość różnych znaczeń danej formy leksykalnej jest określana przez pryzmat języka, który wchodzi w relację opisu kontrastywnego dla celów tłumaczenia automatycznego, co jest operacyjnym – kontrastywnym - rozwiązaniem odwiecznego problemu ile znaczeń ma dana forma językowa.
W r. 2013 podjęte zostały kolejne próby systematycznego stosowania ujęcia zorientowanego obiektowo do kolejnych części słownictwa francuskiego i polskiego:
- francusko – polskiego opisu wybranych, najbardziej polisemicznych rzeczowników, charakteryzujących się największą frekwencją użycia z głównym naciskiem na szczegółowy opis kadrów, w których zostały one użyte. Informacje natury semantycznej dostarczające precyzyjnej charakterystyki klasom obiektowym są zawsze powiązane z kontekstem, kadrem, w którym pojawia się analizowany element językowy, co warunkuje poprawną interpretację jego znaczenia. Sprecyzowanie rodzaju kadru oraz jego dokładny opis będzie stanowił rdzeń moich zainteresowań badawczych. We wcześniejszych analizach wielokrotnie zetknęłam się z licznymi przypadkami, w których nawet w obrębie jednej klasy obiektowej oraz w obrębie tej samej jej podklasy, operatory bądź atrybuty towarzyszące danej formie językowej były takie same, a ich tłumaczenie na język polski było różne, w zależności od kontekstu, w którym zostały użyte. Zatem kadr, w którym pojawia się dany obiekt językowy z danym operatorem czy atrybutem jest dodatkowym elementem, bardzo często decydującym, jeśli wcześniej wymienione czynniki nie są wystarczające, o poprawnym wskazaniu znaczenia danego słowa czy konstrukcji w języku docelowym (dr B. Smigielska).
- wybranych czasowników ruchu w perspektywie kontrastywnej (j. francuski, j. hiszpański i j.polski).
Rozpoczęte zostało gromadzenie źródeł bibliograficznych dotyczących klasyfikacji podstawowych typów czasowników opisujących sytuację przestrzenną i określenie, na tej podstawie, korpusu badawczego. W dalszej kolejności, dokonany zostanie szczegółowy opis wybranych leksemów z uwzględnieniem klas obiektowych w ich otoczeniu, podobieństw i różnic między nimi w języku francuskim i hiszpańskim oraz podstawowych struktur syntaktyczno-semantycznych. Poszukiwanie wyników tychże analiz w postaci tłumaczenia wszystkich wyróżnionych znaczeń na język polski.
Opis podstaw metodologicznych i koncepcji filozoficznych zastosowanych w analizach praktycznych. Analiza badań prowadzonych w obrębie dyscyplin takich jak: współczesna leksykografia, lingwistyka informatyczna, lingwistyka korpusowa oraz perspektywy i cele związane z potrzebą rozwoju słowników elektronicznych i tłumaczy automatycznych (dr A. Żłobińska – Nowak).
- kwestie generalne związane z leksykografia komputacyjną i tłumaczeniem automatycznym,
w tym przedstawienie tłumaczenia automatycznego w kontekście szerszym lingwistyki komputerowej, opracowanie narzędzi komputerowych oraz ram przygotowywanej włosko – polskiej bazy danych leksykalnych (dr D. Słapek)
- francuskich czasowników ruchu tłumaczonych na język polski przez jechać/jeździć. Wstępne badania wykazały, że wybór właściwego ekwiwalentu tłumaczeniowego – jechać lub jeździć – a więc wybór pomiędzy semelfaktywną a iteratywną formą czasownikową – wciąż pozostaje nierozwiązany i stanowi poważny problem przy tłumaczeniu automatycznym francusko-polskim i polsko-francuskim. W roku 2013 wyodrębnione i opisane zostały podstawowe schematy z czasownikiem aller w czasie présent de l’indicatif (w szczególności przy obecnej klasie obiektowej <moyen de transport>) (mgr M. Hrabia).
- terminologii specjalistycznej z dziedziny prawa. Celem projektu jest opis leksyki specjalistycznej, a w szczególności terminologii specjalistycznej, przy zastosowaniu szeregu narzędzi językoznawczych dla potrzeb przekładu automatycznego, co pozwala na umiejscowienie prowadzonych badań w nurcie opisowych badań nad terminologią (leksykografii terminologicznej), językoznawstwa komputerowego oraz językoznawstwa korpusowego. Prowadzone badania dotykają także aspektów praktycznych zastosowania metod językoznawczych oraz baz leksykograficznych w środowisku pracy tłumacza, w tym środowisku informatycznym narzędzi wspomagających tłumaczenie (mgr Ksenia Gałuskina).
- kontrastywny opis leksykograficzny czasowników ruchu w języku włoskim i polskim, uszczegóławiający różnice w wyrażaniu ruchu w obu tych językach i pokazujący kierunek wyboru odpowiedniego ekwiwalentu danego czasownika w języku docelowym (mgr L. Marcol)

Prowadzone były także badania dotyczące:
• ewolucji funkcjonowania francuskich trybów conditionnel i subjonctif z punktu widzenia roli kategorii trybu oraz z punktu widzenia przeobrażeń historycznych i społeczno-kulturowych, które wywarły wpływ na sposób myślenia i mówienia o świecie (językowe obrazy świata) Francuzów (dr hab. K. Kwapisz).
• analizy elementów językowych, nadających argumentacyjny wymiar tekstom tradycyjnie nieargumentacyjnym, tj. tekstowi narracyjnemu, opisowemu, wyjaśniającemu, informacyjnemu, artystycznemu i konwersacyjnemu. Punkt wyjścia stanowiła teoria argumentacji O. Ducrota i J.-P. Anscombre`a, tj. proponowana definicja argumentacji oraz wyróżnienie 3 typów jednostek języka, które świadczą o argumentacyjnym charakterze każdego tekstu, sekwencji i dyskursu (dr hab. K. Kwapisz).
• analizy zjawiska braku słów z punktu widzenia psycholingwistycznych teorii rozwoju osobowości i rozwoju języka (mowy), ze szczególnym uwzględnieniem koncepcji dotyczących procesu kategoryzacji. Zbadano także zjawisko w wymiarze komunikacyjnym i literackim (zwłaszcza poetyckim), tzn. kiedy brak słów jest celowym zabiegiem językowym (dr hab. K. Kwapisz).
• kategorii aspektu i klasycznego podziału na proces, stan i zdarzenie. Z punktu widzenia językoznawstwa kognitywnego, gdzie podstawą wszelkiej analizy języka są procesy poznawcze, wybrana forma czasownika jest szczególną konfiguracją przetworzonych danych, które niekoniecznie muszą odpowiadać realnemu stanowi rzeczy. W konsekwencji wyróżnienie aspektów: semantycznego, syntaktycznego, gramatycznego czy też pragmatycznego, częstokroć prowadzi do braku zgodności między nimi, co świadczy o prymarnej roli procesów poznawczych w stosunku do danych językowych (dr hab. K. Kwapisz).
• czasu futur antérieur w języku francuskim oraz jego ekwiwalentów w języku polskim. Celem badań jest opis różnych użyć tego czasu oraz szczegółowa analiza elementów kontekstu, które pozwalają na przypisanie futur antérieur określonego znaczenia. Pozwoli to na stworzenie reguł, za pomocą których możliwe będzie jego automatyczne tłumaczenie na język polski (dr E. Ciszewska).
• frazeologii, a zwłaszcza frazeodydaktyki. Badania te stanowią połączenie analiz językoznawczych i glottodydaktycznych, a także zakładają wielotorowe działania naukowe. Wspólnym celem powyższych badań jest lepsze poznanie zjawiska frazeologizacji w językach naturalnych oraz bardziej dogłębne zrozumienie procesów odbioru i przyswajania frazeologizmów, zwłaszcza w językach obcych (dr M. Sułkowska).
• quebeckiej odmianie francuszczyzny, a w szczególności różnic gramatycznych i leksykalnych między językiem quebeckim a francuskim międzynarodowym, obserwowanych z perspektywy językoznawcy i dydaktyka języka francuskiego (dr A. Chrupała).

Wyniki badań zostały przedstawione na konferencjach krajowych (26 referatów) oraz zagranicznych (5 referatów). Ukazał się drukiem 25 tom czasopisma naukowego Neophilologica pod red. prof.zw. dr. hab. Wiesława Banysia. Pracownicy opublikowali 14 artykułów w Polsce i 2 za granicą. Przyjęto do druku dalsze 21 artykułów w Polsce i 4 za granicą. Zakończone zostały dwa przewody doktorskie ( dr K. Gabrysiak, dr D. Słapek). Wszczęte zostały procedury do uzyskania stopnia naukowego doktora habilitowanego (dr Monika Sułkowska) oraz doktora (mgr L. Marcol). Monografię habilitacyjną ukończyła dr E. Ciszewska. Otwarty został kolejny przewód doktorski (mgr M. Hrabia).

Pracownicy zakładu:

Kierownik Zakładu: prof. zw. dr hab. Wiesław Banyś