ジェローム
背景
ジェローム·プロジェクトは、 トランス マキナの多言語データベースであるとのコアコンポーネントですsprawkの翻訳スイート. それが一緒に単語と意味を結ぶ複雑な言語のネットワークを表します. たとえば、単語 "ファン"は、いくつかのリンクの意味があります ("冷却装置 "、"狂信的なサポーター"). と "オーブンで焼いた小さな丸いお菓子"があっても、英語でいくつかの単語を持っている意味は、( "ビスケット"と "クッキー")方言に応じて.
言葉はまた、複数形であるため、他の言葉へのリンクは、例えば "犬"が "犬"にリンクされていて、 "食べた"それは過去時制形式であるので、 "食べるため"にリンクされています。 現在、データベースは、基本フォームが含まれています (名詞の単数形、動詞不定詞のために)
目的
、すべての言語のためのすべての単語フォーム内のレコードとのリンクを計算するには.
名詞の場合:複数形やケースを追加する必要があります。自動的にこれらのフォームを生成するためのルールは非常に複雑になるが、多くの場合、ウェブ上で利用可能なことができます。 Transmachinaはすでに我々の焦点言語のため、これらを計算するJavaメソッドを開発しました。
一人一人と数の時制: 動詞の (例えば、JEの豚レンサ球菌は、TU ES、IL EST、ヌースsommes、ランデブーetes、ILS sont). ラテン系言語の場合、これは不定詞ごとにフォームを何百ものを生成することができます. もう一度、Transmachinaは、当社のコア言語のルーチンを持っています。
形容詞の場合:ジェンダーと複数の契約はほとんどのヨーロッパ言語を生成する必要があり
副詞の場合:comparativenessを生成する必要があり (大きな、大きな、大きな)
すべての生成されたフォームは、WordからWordのリンクを介して基地フォームにリンクする必要があります。我々は単語"をルックアップした場合このように犬を "意味" 4本足の哺乳類は、 "基本単語を経由して到達することができます。また、すべての基本単語がすべての語形変化フォームへのリンクが必要です (リンクの種類は、方向に依存しています。それはベース>変である場合、それが基本フォームであり抑揚->ベースである場合、型は、変です。)
ワードからワードへのリンクは、少なくとも以下のタイプがあります:
- 抑揚 (デスティネーション·ワードは、ソースWordの曲です。)
- ベースのフォーム (デスティネーション·ワードは、元のWordの基本形態である)
- 代替スペル (たとえば、 "カラー" [en_USにに] と "カラー" [en_UK])
- から借用した (単語 "カフェ" [EN] "から借用されカフェ"[FR])
- から進化した (単語 "猟犬" [EN] ゲルマン "フント"から進化)
これらは、データベースの管理インタフェースを介して設定することができます。
