言語分析

今、私たちは基本的な言語単位の理解を持っていることを、我々は、コンピュータがそれらを処理できる方法を検討し始めることができます. ルガーとスタッブルフィールド (1998) 言語理解のためにいくつかの重要な分析方法を特定:

言語学者は、古典文法などの硬質構造化分析技法の使用が好ましく、言語を勉強する語順た. コンピュータ科学者はこの技術が十分な柔軟性は、 "文法的文章"、スラング、と文字化けして入力を処理することはできませんことを発見した. したがって、AIの研究は他のアプローチを確立しています.

彼らは、より柔軟なデータ構造とその結果をプールしながら、いくつかの分析技術が同時に実行できるように並列構文解析技術を導入しました.

プロダクションルール(IF-THEN入力テキストのいくつかの理解を可能にするロジックに基づいてルールが導出される)とセマンティックネットワークが大きくなれば、処理の機会を実現するために使用されている.

セマンティック·ネットワークネットワークは、一般的な表現技法であり、それらは、いくつかの異なる目的のためにNLPで使用されている (Beardon、1991). 最も強力なのは、型階層の表現(あるいは知識階層私たちが継承のプロセスを介して他のオブジェクトのプロパティを取得することができます). 参照してください。 グラフィカルな例を。

すべてのこれらの技術は、同じ焦点に導く:入力言語を処理できるように、できるだけ多くの事実として把握する必要がある. いくつかの一般的な処理目標が決定され:

  • どのオブジェクトが関与していた
  • 何が起こったか
  • それが発生したとき
  • 結果は何だったの

形態

形態分析は、したがって、時制、数、およびスピーチの一部に関する情報を与えて、接頭辞と接尾辞の効果を分析することによって、文の単語の使用を決定するのに役立ちます.

形態素解析

形態素解析は、コンテキストを考慮せずにワードのフォームを処理することを意味. Wordのフォームは次式で定義される。 ポポフ "二つのブランクの間にあるテキストのその部分(句読点も単語の形態とみなされる)"として.

マサチューセッツ州の通常の手順

  1. 辞書内の単語の形を探して
  2. 単語の語幹を区別する
  3. 茎のディクショナリ内での幹の検索
  4. ワードの組み合わせ処理
  5. 前の構文

ほとんどのヨーロッパ言語では、文の解析は伝統的に、形態統語と意味解析に分かれています。. アジア言語の分析は、これらの言語の構造に起因する非常に異なった困難なプロセスです。.

プロセッサは、分析のための目標や目標を与えられている. 共通の目標があります:

  1. 識別ワード
  2. イベントに対応するものを決定する
  3. 名目上のグループを区別して処理

文法と構文

文法の規則は私達に起こっているイベントに関する情報を与えることができます. 我々は影響を受けたオブジェクトの数を決定することができ、アクションは、過去に行われたかどうか、将来的に行われるかだけが起こってのチャンスがあります. 言語はあいまいであるため、古典的な言語解析技術は、人間が達成することを理解の深さを提供することはできません. 文法はあるが、その理解に近づくためのマシンの一つの方法に.

直接構成素分析 (IC)

このタイプの分析は、ブルームフィールド(によって開拓されたクリスタルは、1971には文を取ることができますどのように示す)と二つの即時の成分に分割し. たとえば、彼が悪いジョンが逃げ出した文を使用し. 彼は最初の主語と述語にこれを分割:

テーマ: 貧しいジョン
述語:逃げ

順番が悪いジョンに分割し、 走っ離れていた. こうして彼はしない配列としてではなく、成分に関する一連の層としての文を見て最初の一つであった. したがって、ツリー図は、言語の構造体への視覚的な参照のために使用されるようになった.

長所:言語の構造を最初の外観を与えます
短所:それは文法的な関係を考慮していません.

"あの男はジョンの母親を見た"と "ジョンの母親がその男を見た"とほぼ同じであることが表示されません、アクティブとパッシブの文章の間に伝えることはできません.

"ディープ"の構文

深い構文は次の文を表現するためのより良い方法です。. 深い構文木は、(下記参照)、より体系的な方法で柔軟な方法でストレージを許可する. その構造は、さまざまな時制との間で、パッシブとアクティブの間に容易に変換のことが可能となり、彼らはまた、他の言語への翻訳を促進する.

深い構文木

文の深い構文木 - "ジョンは答えを知っているようだ"

意味論

一般的に、意味論は、意味の研究である. マシンはそこからいくつかの意味を推測するために、非常に詳細に分析するために、任意の入力データを持っています。. これは、層ごと、構文の構成要素に文を分割する必要があります. しばしば文から複数の可能な意味がありますので、マシンのいずれかの経験、ヒューリスティックを使用するか、その前と後の文章によると、最も適切な意味を決定することにより推測する必要があります。. マシンは、アカウントに文の意味だけでなく、より広い談話だけでなくを取る必要があるので、したがって、それは複数の解析をサポートする必要があります.

語用論

広い意味では、語用論、談話における文の設定は、その正しい解釈を決定するために使用されている方法です。. 語用論の主要な機能は、コンテキストとリファレンスです。. これらは下に後述する推論.