Raziskovalec v Laboratoriju za korpus slovenskega jezika in njegov vodja

Raziskovalna dejavnost

Njegovo znanstveno in pedagoško delo je predvsem s področja korpusnega jezikoslovja. Povezano je po eni strani z gradnjo in uporabo besedilnega korpusa Nova beseda, po drugi pa s pripravo in spletno uporabo slovarskih del. Vodil je digitalizacijo Slovarja slovenskega knjižnega jezika ter zbranih del Ivana Cankarja, Cirila Kosmača in Draga Jančarja.

 Napisal je več računalniških orodij za pripravo in uporabo besedilnih in slovarskih podatkovnih zbirk, znana sta urejevalnik EVA in spletni iskalnik NEVA. Ukvarja se tudi z informacijsko vsebnostjo jezika, entropijo, njeno zgornjo mejo za slovenska leposlovna besedila je ocenil na 2,2 bita na znak in z numeričnim modelom jezika iz pogostnosti n-terčkov meril razdalje med jeziki.

Izbrane publikacije
  1. GLOŽANČEV, Alenka, JAKOPIN, Primož, MICHELIZZA, Mija, URŠIČ, Lučka, ŽELE, Andreja, ŽELE, Andreja (ur.). Novejša slovenska leksika (v povezavi s spletnimi jezikovnimi viri). Ljubljana: Založba ZRC, ZRC SAZU, 2009. 408 str.
  2. JAKOPIN, Primož. Delež minimalnih parov besed med besednimi oblikami in lemami. Jezikosl. zap., 2009, 15/1–2, str. 87–94.
  3. JAKOPIN, Primož (ur.). Planinska dolina. Ljudje in kraji ob Unici. 1. izd. Planina pri Rakeku: Župnija, 2009. 296 str.
  4. JAKOPIN, Primož, ŽELE, Andreja. English anchors in a Slovenian word resource. V: DAVIES, Matthew (ur.). Proceedings of the Corpus Linguistics Conference, CL2007, University of Birmingham, UK, 27-30 July 2007. Elektronski vir (http://ucrel.lancs. ac.uk/publications/CL2007/paper/271_Paper.pdf). Birmingham, 2007, [7 str.].
  5. JAKOPIN, Primož, MICHELIZZA, Mija. Besedilni korpus Nova beseda. Mostovi (Ljublj.), 2007/08, letn. 41, št. 1/2, str. 165–176.
  6. JAKOPIN, Primož. Entropija v slovenskih leposlovnih besedilih. Ljubljana: ZRC SAZU, Založba ZRC, 2002. V, 208 str.
Vse publikacije (COBISS) >>
Življenjepis

Rojen 30. 6. 1949 v Ljubljani.

Leta 1972 je na Oddelku za matematiko, fiziko in mehaniko Fakultete za naravoslovje in tehnologijo Univerze v Ljubljani diplomiral iz tehnične matematike, leta 1981 je na Centru za podiplomski študij Univerze v Zagrebu magistriral z nalogo Entropija priimkov in imen v Sloveniji, leta 1999 pa na Fakulteti za elektrotehniko Univerze v Ljubljani doktoriral iz teorije informacij s tezo Zgornja meja entropije pri leposlovnih besedilih v slovenskem jeziku.

Od leta 1971 naprej je služboval v Računskem centru Inštituta za matematiko, fiziko in mehaniko, Centru za računalniško obdelavo podatkov Kliničnega centra, Inštitutu za biomedicinsko informatiko Medicinske fakultete, Računskem centru univerze in v Razvojno-tehničnem sektorju Mladinske knjige, vse v Ljubljani, več let je bil tudi samostojni inovator.

Januarja in februarja 1980 se je pri podjetju Digital Equipment Corporation v Bedfordu, ZDA, izpopolnjeval iz Operacijskega sistema TOPS-10.

Od leta 1993 do 2001 je bil zaposlen na Filozofski fakulteti kot asistent, po letu 2001 dopolnilno kot docent na področju jezikovnih tehnologij. Na Oddelku za primerjalno in splošno jezikoslovje predava predmeta Jezikovne in spletne tehnologije in Računalniška analiza besedil, sodeluje pri podiplomskem študiju. Od leta 1989 do 1996 je pogodbeno sodeloval z Inštitutom za slovenski jezik Frana Ramovša ZRC SAZU, od 1996 do 2001 je bil tam dopolnilno zaposlen, od leta 2001 pa s polnim delovnim časom kot vodja Laboratorija za korpus slovenskega jezika.

Raziskovalna področja

Uporabna lingvistika, poučevanje tujih jezikov, sociolingvistika H360 • Statistika, operacijsko raziskovanje, programiranje, aktuarska matematika P160 • Računalništvo, numerična analiza, sistemi, kontrola P170 • Informatika, teorija sistemov P175 

Ključne besede

jezikovne tehnologije • korpusno jezikoslovje • teorija informacij