wtorek, 3 grudnia 2013

Materiał do badań, część I

Skąd językoznawca może czerpać materiał do badań? Konieczność rozwiązania tego problemu dotyka każdego badacza języka. Odpowiedzi na postawione pytanie jest wiele. Źródeł naszych poszukiwań dostarczy nam na przykład Internet. Przedmiotem badań językoznawczych może być chociażby materiał pozyskany z korpusów językowych oraz ze słowników.

W tym poście opiszę krótko, gdzie w Internecie możemy znaleźć pierwsze ze wspomnianych przeze mnie źródeł, czyli korpusy językowe.

Wśród internetowych czeluści możemy natknąć się na kilka korpusów języka polskiego (tylko te mnie interesują). Będą to zarówno korpusy bezpłatne, ogólnodostępne, jak i te, za których użytkowanie musimy zapłacić.

Pierwszym z nich jest Korpus IPI PAN.

Korpus IPI PAN - strona startowa
Jest on publicznie dostępny. Został stworzony przez Zespół Inżynierii Lingwistycznej w Instytucie Podstaw Informatyki PAN (IPI PAN). Zawiera około 250 milionów segmentów.

Kolejny korpus języka polskiego to Korpus Języka Polskiego Wydawnictwa Naukowego PWN.

Korpus PWN - strona startowa
W odróżnieniu od poprzedniego jego pełna wersja jest płatna. Oferuje nam ponad 40 milionów segmentów. Możemy skorzystać również z darmowej wersji demonstracyjnej, która udostępnia użytkownikom ponad 7 milionów segmentów. Wersja bezpłatna ma dodatkowo ograniczone możliwości wyszukiwania.

Inny korpus internetowy to Korpus PELCRA.

Korpus PELCRA - strona startowa
Dostęp do niego jest bezpłatny. Obecnie stanowi on część ostatniego z korpusów, które chciałabym przedstawić, mianowicie Narodowego Korpusu Języka Polskiego.

Narodowy Korpus Języka Polskiego - strona startowa
Jest to największy z dostępnych w Internecie korpusów języka polskiego. Dostęp do niego jest darmowy. Jak możemy przeczytać na stronie korpusu, jest on

"wspólną inicjatywą Instytutu Podstaw Informatyki PAN (koordynator), Instytutu Języka Polskiego PAN, Wydawnictwa Naukowego PWN oraz Zakładu Językoznawstwa Komputerowego i Korpusowego Uniwersytetu Łódzkiego, zrealizowaną jako projekt badawczy rozwojowy Ministerstwa Nauki i Szkolnictwa Wyższego".

W kolejnym poście zajmę się najciekawszymi słownikami opublikowanymi w Internecie.

Brak komentarzy:

Prześlij komentarz