Introduktion

Natural Language Processing (NLP) även kallad språkteknologi, språkliga teknik och datorlingvistik syftar till att studera och utveckla metoder genom vilka "naturliga" mänskliga språk kan behandlas effektivt genom datorn.
NLP har potential att göra en mycket betydande bidrag till nyttan av informationsteknik på lång sikt. Några viktiga tillväxtområden är:

  • automatisk lokalisering av programvara och dess dokumentation (via language translation)
  • informationshämtning
  • Maskinen assisterad översättning
  • grammatisk och stilistisk analys
  • naturliga språk gränssnitt för databaser

Det har nyligen varit en explosion på detta område som hårdvara tillgänglig för hemanvändare uppnår en nivå där realtid är möjlig.
Ett växande antal grupper upptäcker potentialen i storskaliga språkliga resurser som maskinläsbara ordböcker, märkta språkliga manuskript och tvåspråkiga texter. Förekomsten av dessa medel har möjliggjort utvecklingen av NLP systemkomponenter såsom en del-av-tal taggare och maskin hanterlig lexikon.
Standarder som fastställts för representation av språkliga komponenter i en maskinläsbar form. Internationellt projekt som stöds till exempel Text Encoding Initiative har nyligen dök upp med det specifika målet att skapa och sprida sådana standarder.
Det är ett steg i riktning mot friare utbyte av information, data och mjukvara mellan grupper. Detta exemplifieras av det ökande antalet elektroniska diskussionsgrupper avsedda för NLP, och genom bildandet av internationella clearingorganisationer såsom konsortiet för Lexikal forskning. Tillgången till dessa resurser har blivit mycket underlättats genom utvidgningen av Internet till Europa.
Fälten av text bearbetning och behandling av naturligt språk successivt konvergerar. Till exempel stil pjäser ofta ingår i ordbehandlare. Utvecklingen av detta slag vilket ökar den potentiella marknaden för NLP produkter.
Det finns ett enormt område som studeras som innebär taligenkänning och talsyntes. Dessa områden är utanför ramen för denna forskning, men det är klart att taligenkänning ska kunna ge högre nivåer av språkförståelse noggrannhet tack vare de extra komponenterna i stress, accenting och pauser.