Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

Språkteknologi blir centrumbildning

Nyhet: 2011-10-04

Lars Borin. Foto: Johan WingborgNu har Centrum för språkteknologi fått officiell status som centrumbildning vid Göteborgs universitet. Men själva verksamheten, där lingvister och datavetare samarbetar, har pågått i decennier.

Redan på 1960-talet började professor Sture Allén samla in stora mängder text för dataanalys. 1974 kom Språkbanken igång och tio år senare började de första studenterna i datalingvistik. Och för några år sedan blev språkteknologi ett av Göteborgs universitets styrkeområden.

– Forskningen bedrivs i tre laboratorier: textteknologi-, grammatikteknologi- och dialogteknologilaboratoriet, förklarar föreståndaren Lars Borin, professor i språkvetenskaplig databehandling. Men de skilda områdena går också in i varandra.

Ett stort projekt är det EU-finansierade MOLTO, som handlar om maskinöversättning.

– Det mest kända översättningssystemet är nog Google translate. Det bygger på analyser av väldiga mängder text där systemet undan för undan lär av sina misstag. Problemet är att språk fungerar enligt vad som kallas Zipfs lag: ett litet antal ord, som pronomen, konjunktioner och några verb, står för kanske 80 procent av en texts innehåll. Men ett mycket stort antal termer används bara någon enstaka gång. Alltså måste man ha väldigt mycket text för att få ett någorlunda stort ordförråd. När det gäller stora språk, som engelska, är det inget problem. Men hur mycket text finns exempelvis på sydsamiska?

Läs hela artikeln i GU Journalen
 

AV:
031 - 786 10 68 / 0766 - 18 10 68

Sidansvarig: |Sidan uppdaterades: 2015-08-17
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?