U bram lingwistycznej szczęśliwości, czyli kulisy projektu Odkrywka: cyfrowe zasoby kultury jako źródło mas danych językowych

Abstract

Współcześnie coraz większa liczba materiałów historycznych, takich jak gazety, książki i dokumenty archiwalne, poddawana jest procesowi digitalizacji, a następnie udostępniana w formie cyfrowej w Internecie. Federacja Bibliotek Cyfrowych (FBC), gromadząca, przetwarzająca i udostępniająca informacje o internetowych zbiorach polskich instytucji nauki i kultury, liczy ponad 100 źródeł danych, w skład których wchodzą biblioteki cyfrowe, archiwa, repozytoria i inne. Spośród polskich bibliotek cyfrowych można wyodrębnić m.in. Wielkopolską Bibliotekę Cyfrową, Małopolską Bibliotekę Cyfrową, e-bibliotekę Uniwersytetu Warszawskiego i Jagiellońską Bibliotekę Cyfrową. Zbiory udostępniane przez te biblioteki, a także inne teksty elektroniczne są bogatym źródłem wiedzy o historii, kulturze, społeczeństwie i języku. Przedstawione źródła danych stanowią podstawę projektu Odkrywka, realizowanego przez pracowników Instytutu Językoznawstwa i Pracowni Systemów Informacyjnych Uniwersytetu im. Adama Mickiewicza w Poznaniu. Projekt ten ma na celu wykorzystanie bazy zdigitalizowanych tekstów w języku polskim do prowadzenia szybkich i efektywnych badań nad językiem, kulturą i historią Polski. W przedsięwzięciu w charakterze korpusu diachronicznego, liczącego setki tysięcy tekstów XIX i XX w., wykorzystywane są kolekcje upublicznione przez biblioteki cyfrowe oraz inne źródła internetowe. W artykule podane zostały najważniejsze wiadomości dotyczące projektu, zaprezentowano narzędzia wyszukiwania wyrazów i fraz oraz wykresy częstości. Poruszone zostało zagadnienie aktualnych badań oraz perspektywicznych analiz prowadzonych w oparciu o stworzony system.

Authors and Affiliations

Filip Graliński, Daniel Dzienisiewicz, Piotr Wierzchoń

Keywords

Related Articles

Epistemologiczno-fenomenologiczny obraz zjawiska zabójstwa typu podstawowego

Każda jednostka w świetle prawa winna mieć niezbywalne i powszechne zabezpieczenie ochrony swego życia jako wartości podstawowej i uniwersalnej. Przestępstwo zabójstwa typu podstawowego sprowadza się do pozbawienia życia...

Diagnoza przestępczości osądzonej dla Krakowa Krowodrzy… na podstawie analizy akt sądowych

Artykuł podejmuje temat badań nad przestępczością w Krakowie, a dokładniej obszaru znajdującego się we właściwości Sądu Rejonowego dla Krakowa Krowodrzy. Celem badań było ustalenie cech społeczno-demograficznych sprawców...

Digitalizacja i udostępnianie zdigitalizowanych materiałów archiwalnych w polskich archiwach państwowych – ewolucja polityki i przepisów prawa

Polskie archiwa państwowe są, z zasady, instytucjami konserwatywnymi, sceptycznie nastawionymi do nowych trendów i nowinek technologicznych. Wziąwszy pod uwagę charakter, unikatowość przechowywanego zasobu oraz tradycyjn...

Experimental Social Science

My editorial introduction to Selected Topics in Experimental Social Science − the collection of papers which is the bulk of this issue of Studia Sociologica − grew out of the address I delivered at the opening session of...

Przekształcanie ciała – tatuaż i piercing. Motywy osobiste i znaczenie społeczne

Artykuł podejmuje nasilający się współcześnie problem przekształcania ciała poprzez tatuaż i piercing. Stanowi on prezentację wyników badań przeprowadzonych wśród osób stosujących wskazane metody przekształcania ciała. P...

Download PDF file
  • EP ID EP343289
  • DOI -
  • Views 75
  • Downloads 0

How To Cite

Filip Graliński, Daniel Dzienisiewicz, Piotr Wierzchoń (2017). U bram lingwistycznej szczęśliwości, czyli kulisy projektu Odkrywka: cyfrowe zasoby kultury jako źródło mas danych językowych. Annales Universitatis Paedagogicae Cracoviensis. Studia Sociologica, 0(1), 51-62. https://europub.co.uk./articles/-A-343289