Till startsida
Webbkarta
Till innehåll Läs mer om hur kakor används på gu.se

Klassisk grammatikmodell kan användas i datoriserad syntaxanalys

Nyhet: 2010-04-22

En klassisk nordisk grammatikmodell kan användas för datoriserade grammatiska analyser och språktekniska tillämpningar av modern svensk text. Det visar en avhandling i lingvistik inom området språkteknologi vid Göteborgs universitet. En av tillämpningarna innebär att när en digital text öppnas kan frågor som besvaras av texten genereras och användas för att söka speciell information i texten.

Språkvetaren Kenneth Wilhelmsson har utvecklat en ny metod som tolkar den grammatiska strukturen i en text med hjälp av ett datorprogram (så kallad syntaxanalys eller parsning). Metoden bygger på dansken Paul Diderichsens traditionella satsschema. Idag är satsschemat vedertaget för beskrivning av de nordiska språken, och för svenska förekommer det i de flesta moderna grammatikböcker.

– Den grammatiska analysen i datorprogrammet görs främst på huvudsatsnivå vilket kan ses som en stor fördel eftersom uppgiften minskar i komplexitet men ändå ger användbara resultat, säger Kenneth Wilhelmsson.

Istället för att göra hela analysen på en gång består tillvägagångssättet av delsteg som kan göras med hög korrekthet. Framförallt är det huvudsatsens finita verb och andra ettordsled som identifieras på huvudsatsnivån. Det i sin tur bereder väg för en identifikation av de komplexa leden (subjekt, objekt/predikativ och adverbial) som kan förlita sig på uteslutningsmetodik och liknande regelformuleringar (heuristik), istället för en uttrycklig full grammatikskrivning.

Kenneth Wilhelmssons nyutvecklade metod kan också användas av språkforskare för att söka efter förekomster av olika grammatiska fenomen som kan beskrivas mer raffinerat än med ord- och strängmatchning.

I avhandlingsprojektet har också olika prototyper av tillämpningar skapats som bygger på den nämnda analystypen skapats. En av dem handlar om automatisk frågegenerering från godtycklig svensk text.

Systemet för automatisk generering av frågor som en valfri svensk text besvarar är unikt. Programmet har tillgång till svenska Wikipedias artikeldatabas och kan användas genom att frågor genereras när en text öppnas. När användaren börjar skriva en fråga kompletteras texten automatiskt: endast besvarade frågor kan ställas.

– Detta är menat som ett alternativ till flera andra moderna frågeprogram där användaren inte kan veta om en fråga egentligen besvaras av kunskapsbasen alls och där variation i själva frågeformuleringen kan göra att befintlig information missas, säger Kenneth Wilhelmsson.


Avhandlingens titel: Heuristisk analys med Diderichsens satsschema. Tillämpningar för svensk text
Avhandlingsförfattare: Kenneth Wilhelmsson, tel: 031-40 82 11
E-post: kw@ling.gu.se
Tid och plats för disputation: Lördagen den 24 april 2010 kl. 10.15, T307, Olof Wijksgatan 6, Göteborg
Fakultetsopponent: Professor Barbara Gawrońska
Avhandlingen distribueras av Institutionen för Filosofi, lingvistik och vetenskapsteori
Den finns även digitalt publicerad på: http://hdl.handle.net/2077/22028

AV:

Sidansvarig: |Sidan uppdaterades: 2015-08-17
Dela:

På Göteborgs universitet använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor.  Vad är kakor?