Analyse linguistique

Maintenant que nous avons une base de comprendre les unités de la langue, nous pouvons commencer à examiner comment un ordinateur peut les traiter. Luger et Stubblefield (1998) d'identifier plusieurs méthodes d'analyse clés pour la compréhension du langage:

Les linguistes ont préféré l'utilisation classique des techniques d'analyse rigides structurés tels que la grammaire, et l'ordre des mots pour étudier la langue. Les informaticiens ont constaté que cette technique ne permet pas suffisamment de souplesse pour traiter "phrases agrammaticales", l'argot et d'entrée brouillé. Ainsi les recherches d'Amnesty International ont établi d'autres approches.

Ils ont introduit plus de flexibilité des structures de données et des techniques d'analyse parallèles qui permettent les techniques d'analyse à plusieurs se dérouler simultanément, tout en mettant en commun leurs résultats.

Les règles de production (IF-THEN règles basées sur la logique qui permettent une certaine compréhension de saisie de texte pour être dérivée) et les réseaux sémantiques ont été utilisés pour réaliser l'égalité de traitement plus.

Sémantiques réseaux réseaux sont une technique générale de représentation et ils sont utilisés en PNL à des fins différentes (Beardon et al, 1991). L'un des plus puissant est la représentation des hiérarchies de type (ou hiérarchies du savoir ) qui nous permettent de saisir les propriétés d'autres objets à travers un processus d'héritage. Voir un graphique exemples.

Toutes ces techniques conduisent à la mise au point même: la nécessité d'être en mesure de traiter le langage d'entrée et de vérifier autant de faits que possible. Certains objectifs de traitement communs sont la détermination:

  • quels objets ont été impliqués
  • ce qui s'est passé
  • quand il s'est produit
  • ce qui était le résultat

Morphologie

L'analyse permet de déterminer la morphologie de l'utilisation d'un mot dans une phrase en analysant l'effet des préfixes et suffixes, donnant ainsi des informations sur temps, le nombre et la partie du discours.

L'analyse morphologique

Une analyse morphologique, les formes de traitement de texte sans tenir compte de contexte. Formulaire Word est défini par Popov tant que "partie d'un texte qui se trouve entre deux flans (les signes de ponctuation sont également considérés comme des formes de mots)".

Étapes normales de MA

  1. la recherche d'une forme de mot dans le dictionnaire
  2. distinguer la tige du mot
  3. la recherche de la tige dans le dictionnaire de tiges
  4. mot-combinaison de traitement
  5. pré-syntaxe

Avec plupart des langues européennes, analyse de la phrase est traditionnellement divisée en des analyses morphologiques, syntaxiques et sémantiques. Analyse de la langue asiatique est un processus très différent et difficile en raison de la structure de ces langues.

Le processeur est donnée des objectifs ou des objectifs pour l'analyse. Les objectifs communs comprennent:

  1. l'identification des mots
  2. déterminer celles qui correspondent à des événements
  3. distinguer et de traitement des groupes nominaux

Grammaire et syntaxe

Les règles de la grammaire peut nous donner des informations sur les événements qui se déroulent. Nous pouvons déterminer combien d'objets ont été touchés et si l'action a eu lieu dans le passé, aura lieu dans le futur ou a seulement une chance de se produire. Parce que le langage est floue, les techniques classiques d'analyse linguistique ne peut pas fournir la profondeur de la compréhension que l'homme d'atteindre. La grammaire est, mais une façon de pour une machine de se rapprocher de cette compréhension.

Analyser fr immédiats constituants (IC)

Ce type d'analyse a été lancée par Bloomfield ( Crystal, 1971 ) qui a illustré la façon dont vous pouvez prendre une phrase et divisé en deux il constituants immédiats. Par exemple, il a utilisé la phrase Pauvre John s'enfuit. Il a d'abord diviser cette place dans un sujet et un prédicat:

Sujet: Pauvre John
Prédicat: s'enfuit

En virage, il a été divisé en pauvres et John, et a couru et à l'écart. Ainsi, il a été l'un des premiers à voir la phrase non pas comme une séquence, mais comme une série de couches sur les constituants. Ainsi les diagrammes d'arbre a commencé à être utilisé pour toute référence visuelle à la structure de la langue.

Points forts: donne un look début à la structure de la langue
Faiblesses: il ne considère pas les relations grammaticales.

Impossible de dire entre les phrases actives et passives, ne démontre pas que «Cet homme a vu la mère de Jean» et «la mère de Jean a été vu par cet homme" sont presque les mêmes.

'Deep' Syntaxe

La syntaxe profonde est une bien meilleure façon de représenter une phrase. Arbres syntaxiques de profondeur (voir ci-dessous) permettent le stockage d'une manière plus systématique et de manière flexible. Leur structure permet à des conversions faciles entre passif et actif, entre temps différents, et ils facilitent également les traductions dans d'autres langues.

Un arbre de syntaxe profonde

Un arbre de syntaxe profonde de la phrase - "John semble connaître la réponse"

Sémantique

En général, la sémantique est l'étude de la signification. Une machine devra analyser en détail, toutes les données d'entrée afin d'en déduire un certain sens de l'. Il a besoin de se séparer de la peine dans les composants syntaxiques, couche par couche. Souvent, il ya plus d'un sens possible à partir de la phrase et donc une machine soit à deviner à l'aide de l'expérience, heuristiques ou en déterminant le sens le plus approprié en fonction des phrases avant et après. Ainsi, parce que une machine a besoin de prendre en compte non seulement le sens de la phrase, mais aussi du discours plus large, il aurait besoin pour soutenir multiples d'analyse.

Pragmatique

En termes généraux, la pragmatique est la façon dont le réglage de la phrase dans un discours est utilisé pour déterminer l'interprétation correcte. Les principales caractéristiques de la pragmatique sont fonction du contexte et de référence. Ceux-ci seront discutées plus tard, sous l'inférence.