ジェローム

背景

ジェローム·プロジェクトは、 トランス マキナの多言語データベースであるとのコアコンポーネントですsprawk翻訳スイート. それが一緒に単語と意味を結ぶ複雑な言語のネットワークを表します. たとえば、単語 "ファン"は、いくつかのリンクの意味があります ("冷却装置 "、"狂信的なサポーター"). と "オーブンで焼いた小さな丸いお菓子"があっても、英語でいくつかの単語を持っている意味は、( "ビスケット"と "クッキー")方言に応じて.

言葉はまた、複数形であるため、他の言葉へのリンクは、例えば "犬"が "犬"にリンクされていて、 "食べた"それは過去時制形式であるので、 "食べるため"にリンクされています。 現在、データベースは、基本フォームが含まれています (名詞の単数形、動詞不定詞のために)

目的

、すべての言語のためのすべての単語フォーム内のレコードとのリンクを計算するには.

名詞の場合:複数形やケースを追加する必要があります。自動的にこれらのフォームを生成するためのルールは非常に複雑になるが、多くの場合、ウェブ上で利用可能なことができます。 Transmachinaはすでに我々の焦点言語のため、これらを計算するJavaメソッドを開発しました。

一人一人と数の時制: 動詞の (例えば、JE豚レンサ球菌、TU ES、IL EST、ヌースsommes、ランデブーetes、ILS sont). ラテン系言語の場合、これは不定詞ごとにフォームを何百ものを生成することができます. もう一度、Transmachinaは、当社のコア言語のルーチンを持っています。

形容詞の場合:ジェンダーと複数の契約はほとんどのヨーロッパ言語を生成する必要があり

副詞の場合:comparativenessを生成する必要があり (大きな、大きな、大きな)

すべての生成されたフォームは、WordからWordのリンクを介して基地フォームにリンクする必要があります。我々は単語"をルックアップした場合このように犬を "意味" 4本足の哺乳類は、 "基本単語を経由して到達することができます。また、すべての基本単語がすべての語形変化フォームへのリンクが必要です (リンクの種類は、方向に依存しています。それはベース>変である場合、それが基本フォームであり抑揚->ベースである場合、型は、変です。)

ワードからワードへのリンクは、少なくとも以下のタイプがあります:

  • 抑揚 (デスティネーション·ワードは、ソースWordの曲です。)
  • ベースのフォーム (デスティネーション·ワードは、元のWordの基本形態である)
  • 代替スペル (たとえば、 "カラー" [en_USに] と "カラー" [en_UK])
  • から借用した (単語 "カフェ" [EN] "から借用されカフェ"[FR])
  • から進化した (単語 "猟犬" [EN] ゲルマン "フント"から進化)

これらは、データベースの管理インタフェースを介して設定することができます。