i-SLA – Interaktivni atlas slovenskih narečij

applied research project
Osnovni Podatki

Opis

Projekt temelji na enem od ustanovnih znanstveno-raziskovalnih projektov Inštituta za slovenski jezik Frana Ramovša ZRC SAZU, tj. na Slovenskem lingvističnem atlasu (SLA), ki vsebuje skoraj 3000 leksičnih in t. i. gramatičnih (glasoslovnih in oblikoslovnih) vprašanj. Že zapisano in digitalizirano gradivo (okrog 600 zvezkov in skoraj 900.000 listkov) raziskovalna skupina dopolnjuje z manjkajočimi zapisi (okrog 40–50 krajevnih govorov iz mreže 417 krajev v Sloveniji in zunaj nje) in ob tem ureja tudi fonoteko terenskih posnetkov.

Raziskovalni projekt povezuje znanstvena spoznanja naslednjih ved:

– jezikoslovje, tj. dialektologija in geolingvistika ter primerjalno jezikoslovje (gradivsko dopolnjevanje podatkovne zbirke, zlasti z narečnim gradivom, zbranim na robu slovenskega jezikovnega prostora; sinhrono-diahrona jezikovna analiza; geolingvistična predstavitev narečnega besedja),

– informacijska tehnologija (tehnično dopolnjevanje podatkovne zbirke, vpenjanje narečnega gradiva v slovarski portal www.fran.si in priprava programskih orodij za postavitev interaktivnega jezikovnega atlasa v povezavi z vključitvijo zainteresirane javnosti (tudi šolskih ustanov) v množično e-zbiranje gradiva (crowd-sourcing),

– geografija, tj. kartografija in prostorska analiza podatkov, GIS (priprava ustreznih elektronskih kartografskih podlag za geolingvistično predstavitev gradiva, georeferenciranje podatkov),

– digitalna humanistika (povezovanje jezikoslovnih spoznanj, prikazanih in prosto dostopnih na jezikovnih kartah v e-obliki z drugimi prosto dostopnimi elektronskimi viri).

Za projekt bo delovna skupina najprej pripravila besedne indekse za izbrani tematski sklop (s povezavo do skenov arhiviranih zapisov), in jih dopolnila s terenskimi zapisi zlasti v okoljih, kjer skoraj ni več (narečnih) slovensko govorečih govorcev. Sledilo bo ugotavljanje tvorjenosti vsake zapisane besede (predvidoma okrog 1000 leksično različnih narečnih odgovorov na 50 vprašanj), za kar bo treba narediti t. i. morfološko analizo (razčlembo morfemske zgradbe besede), ki je za slovenska narečja zaradi raznorodnih fonetičnih razvojev lahko zelo zapletena. Tako za neprevzeto (iz praslovanščine podedovano ali oblikovano v eni od kasnejših razvojnih stopenj slovenščine) kot za prevzeto besedje (iz ozemeljsko stičnih ali nestičnih idiomov) bo treba podati izvor oz. izhodišče.

Gradivo za SLA bo urejeno v podatkovni zbirki, ki bo ne le povezana z geografskim informacijskim sistemom, ki omogoča vizualizacijo podatkov na jezikovni karti, ampak tudi z drugimi prosto dostopnimi digitalnimi zbirkami in programskimi orodji, ki omogočajo množično zbiranje podatkov in prosti dostop uporabnikov do zbranega in analiziranega gradiva.

Zbrano narečno besedje bo ob koncu projekta opremljeno tudi z etnološkimi pojasnili ter podkrepljeno s slikovnim in zvočnim gradivom.

S pomočjo informacijskih tehnologij bodo preko spletišča interaktivnega atlasa slovenskih narečij oblikovane in prosto dostopne: karta slovenskih narečij, zbirka fonetično transkribiranega narečnega besedja (v obliki indeksov), z izvozom v xml, zbirka morfološko analiziranega narečnega besedja, zbirka kratkih narečnih besedil (zbirka zvočnih datotek), zbirka fonoloških opisov krajevnih govorov.

Glavni cilj raziskave je torej na temelju raziskav za Slovenski lingvistični atlas oblikovati model interaktivnega atlasa slovenskih narečij, ki bo s smernicami za oblikovanje podatkovne baze, georeferenciranje jezikovnih podatkov, povezavo z drugimi prosto dostopnimi spletnimi viri ipd. uporaben tudi za druge (manjše, tj. regionalne, in večje, tj. mednarodne, večjezikovne) geolingvistične projekte. Interaktivnost bo predvidoma nadgrajena z vzpostavitvijo t. i. govorečega atlasa (opremljenost dela kartiranega gradiva z zvočnimi izsečki) in možnostjo sodelovanja javnosti pri množičnem zbiranju gradiva – zapisov narečnih besed, avdio- in videoposnetkov, fotografij ipd. Z narečnim besedjem izbranega tematskega sklopa, ki doslej še ni bilo analizirano in geolingvistično prikazano, bo ob koncu projekta nadgrajen prosto dostopni slovarski portal www.fran.si.


Faze projekta

1. stopnja (9/2020–2/2021)

– priprava besednih indeksov, povezava do skenov arhivskega gradiva (delo skupine dialektologov),

– priprava zvočnih izsečkov za elektronsko različico atlasa (delo skupine dialektologov),

– razvoj podatkovne baze (delo jezikovnega tehnologa v sodelovanju z jezikoslovci),

– razvoj in preizkušanje programske opreme za izdelavo interaktivne jezikovne karte (delo jezikovnega tehnologa v sodelovanju z jezikoslovci),

– priprava e-kartografskih predlog (sodelovanje geografov in strokovnjakov za prostorsko vizualizacijo podatkov pri ZRC SAZU).

2. stopnja (3/2021–8/2021)

– priprava besednih indeksov, povezava do skenov arhivskega gradiva (delo skupine dialektologov),

– priprava zvočnih izsečkov za elektronsko različico atlasa (delo skupine dialektologov),

– morfološka (sinhrono-diahrona) analiza besedja ter kartiranje in komentiranje jezikovnih kart (delo skupine dialektologov in primerjalnih (slovanskih) jezikoslovcev),

– razvoj podatkovne baze (delo jezikovnega tehnologa v sodelovanju z jezikoslovci),

– razvoj in preizkušanje programske opreme za izdelavo interaktivnega jezikovnega atlasa (delo strokovnjaka za jezikovne tehnologije v sodelovanju z jezikoslovci),

– priprava e-kartografskih predlog (sodelovanje geografov in strokovnjakov za prostorsko vizualizacijo podatkov pri ZRC SAZU).

3. stopnja (9/2021–2/2022)

– priprava zvočnih izsečkov za elektronsko različico atlasa (delo skupine dialektologov),

– morfološka (sinhrono-diahrona) analiza besedja ter kartiranje in komentiranje jezikovnih kart (delo skupine dialektologov in primerjalnih (slovanskih) jezikoslovcev),

– pripravljanje, zbiranje in digitalizacija fonoloških opisov krajevnih govorov iz mreže SLA (delo skupine dialektologov),

– pripravljanje, zbiranje in digitalizacija bibliografskih podatkov o raziskavah krajevnih govorov iz mreže SLA (delo skupine dialektologov),

– etnološka obravnava gradiva (delo etnologa v sodelovanju z dialektologi),

– risanje skic (delo zunanjega sodelavca v sodelovanju z dialektologi in etnologom),

– razvoj podatkovne baze (delo jezikovnega tehnologa v sodelovanju z jezikoslovci),

– razvoj in preizkušanje programske opreme za izdelavo interaktivnega jezikovnega atlasa (delo strokovnjaka za jezikovne tehnologije v sodelovanju z dialektologi).

4. stopnja (3/2022–8/2022)

– morfološka (sinhrono-diahrona) analiza besedja ter kartiranje in komentiranje jezikovnih kart (delo skupine dialektologov in primerjalnih (slovanskih) jezikoslovcev),

– priprava zvočnih izsečkov za elektronsko različico atlasa (delo skupine dialektologov),

– pripravljanje, zbiranje in digitalizacija fonoloških opisov krajevnih govorov iz mreže SLA (delo skupine dialektologov),

– pripravljanje, zbiranje in digitalizacija bibliografskih podatkov o raziskavah krajevnih govorov iz mreže SLA (delo skupine dialektologov),

– usklajevanje komentarjev in kart, korekture, tisk, pdf in www.fran.si (delo skupine dialektologov),

– razvoj podatkovne baze (delo jezikovnega tehnologa v sodelovanju z jezikoslovci),

– razvoj in preizkušanje programske opreme za izdelavo interaktivnega jezikovnega atlasa (delo jezikovnega tehnologa v sodelovanju z jezikoslovci),

– opremljanje jezikovnih kart z gradivom za interaktivni atlas (tj. z možnostjo dostopa do digitaliziranega arhivskega gradiva, zvočnih in video posnetkov ter drugih spletnih povezav na bibliografske podatke o raziskavah krajevnega govora, do narečnega korpusa, spletnih slovarjev in podatkov o kraju, ki je točka mreže SLA) (delo vseh sodelavcev projekta).

5. stopnja (9/2022–2/2023)

– opremljanje jezikovnih kart z gradivom za interaktivni jezikovni atlas (delo vseh sodelavcev projekta) in postopno postavljanje izbranih kart interaktivnega jezikovnega atlasa na svetovni splet (testiranje delovanja e-atlasa).

6. stopnja (3/2023–8/2023)

– postavitev izbranih kart interaktivnega jezikovnega atlasa na svetovni splet (delo vseh sodelavcev projekta, zlasti jezikovnega tehnologa).