|
|||||||||||||||
Leksikon, ordsemantikk, grammatikk og oversettelse for norskLOGON er et språkteknologisk prosjekt med utgangspunkt i maskinoversettelse fra norsk til engelsk. Det er en del av satsingen til Norges forskningsråd for å styrke forskning relatert til språkteknologi i Norge. Det er et samarbeidsprosjekt mellom universitetene i Oslo, Bergen og Trondheim. Det vil knyttes flere doktorgradstipendiater til prosjekter, og det vil være aktivt samarbeid med institusjoner i andre land, bl.a. USA og Tyskland. Rammen for prosjektet er maskinoversettelse av tekster fra norsk til engelsk. Maskinoversettelse er et område hvor svært mange ulike aspekter av språkteknologi kommer inn. Tekster må analyseres grammatisk og en må forholde seg til tekstenes mening. Dessuten må likhetene og forskjellene mellom forskjellige språk — i denne sammenheng norsk og engelsk — utforskes. Det har blitt forsket på maskinoversettelse i mer enn femti år, og det er investert store summer. En kan lett bli skuffet når en ser resultatet. Kvaliteten på en tekst oversatt av en maskin er langt fra den samme som på en tekst oversatt av et kyndig menneske, og vil heller ikke bli det i overskuelig fremtid. Likevel begynner maskinoversettelse å spille en stadig større kommersiell rolle, både som hjelpemiddel for menneskelige oversettere og der en lavere kvalitet er akseptabel. Prosjektet vil ta utgangspunkt i forskning som er gjort for andre språk, bl.a. i det store tyske prosjektet VerbMobil. Prosjektet vil gjøre bruk av avanserte modeller og teknologi utviklet for andre språk. Et mål vil være å beskrive og behandle norsk med disse midlene. Det vil være et viktig skritt for at morgendagens språkteknologiske verktøy også blir tilgjengelige for norsk. Samtidig vil prosjektet være en aktør i den internasjonale kumulative forskningsprosessen. De mer teoretiske og teknologiske innsiktene som blir vunnet, vil også ha overføringsverdi til andre språk og språkpar. Hovedstrukturen for oversettelsen vil være en semantisk (meningsbasert) og grammatisk analyse av den norske teksten. Denne analysen resulterer i en abstrakt representasjon av innholdet i den norske teksten som så omformes til en representasjon for den engelske oversettelsen. Fra denne vil så en engelsk tekst bli generert. Dette kalles gjerne en semantisk basert transferstrategi. Noen av utfordringene en møter skyldes at det samme meningsinnhold uttrykkes med forskjellige språklige virkemidler i forskjellige språk. Det er ikke tilstrekkelig med en ord for ord oversettelse. Nærmere opplysninger om prosjektets organisasjon, vitenskapelige tilnærming og arbeidsfordelingen mellom deltagerne er tilgjengelig via prosjektets arbeidsplan for perioden 2002 til 2004 (på norsk) og den utvidede arbeidsplanen for 2005 og 2006 (på engelsk). En mer generell oversikt foreligger i artikkelen Som å kapp-ete med trollet? (på engelsk) fra TMI 2004 sammen med slide-presentasjonen fra samme konferanse. | |||||||||||||||
| |||||||||||||||
Dette dokumentet er skrevet i XHTML 1.0 | Sist oppdatert: 2007-01-26 (05:01) |