Jérôme

Contexte

Le projet Jérôme est transmachinaL 'base de données multilingue et est une composante essentielle de la sprawk translation suite. Il représente un réseau complexe reliant la langue des mots et des significations ensemble. Par exemple, le mot "fan" a plusieurs significations liées ("cooling device", "a fanatic supporter"). Et le sens de "une confiserie petit rond cuit dans un four" a plusieurs mots, même en anglais ("biscuit" et "cookie") en fonction de dialecte.

Les mots ont aussi des liens vers d'autres termes, par exemple "chiens" est liée à «chien», car elle est la forme plurielle, et "mangé" est liée à "manger", car il s'agit d'une forme au passé. Actuellement, la base de données contient des formes de base seulement (singulier pour les noms, et l'infinitif pour les verbes)

Mais

Pour calculer, d'enregistrement et le lien dans toutes les formes de mots pour toutes les langues.

Pour les noms: les pluriels et les cas, devra être ajoutée. Les règles de génération automatique de ces formes peuvent être très complexes, mais sont souvent disponibles sur le web. Transmachina a déjà développé des méthodes Java pour calculer ces pour nos langues de discussion.

Pour verbes: les temps pour chaque personne et le nombre (e.g. je suis, tu es, il est, nous sommes, vous etes, ils sont). Pour les langues latines cela peut générer des centaines de formes par l'infinitif. Une fois encore, Transmachina a des routines pour nos langues de base.

Pour les adjectifs: accord en genre et le pluriel doit être généré pour la plupart des langues européennes

Pour les adverbes: comparativeness doit être généré (gros, plus gros,)

Tous les formulaires générés devez lier de nouveau à la forme de base via une liaison Word-to-Word. Ainsi, si nous devions chercher le mot " chiens "le sens" un mammifère à quatre pattes "peut être atteint via le mot de base. En outre, tous les mots de base devrait avoir des liens vers toutes les formes infléchies (le type de la liaison dépendent de la direction. Si elle est en base> inflexion, le type est d'inflexion, si elle est inflexion-> base, il est sous forme de base.)

Mot-à-Word liens ont des types d'au moins les éléments suivants:

  • Inflexion (la Parole de destination est une inflexion de la Parole de source)
  • forme de base (le mot de destination est une forme de base de la Parole de source)
  • autre orthographe (par exemple "couleur" [fr] et "couleur" [en_UK])
  • emprunté à (le terme "café" [en] est emprunté à "café"[Fr])
  • évolué à partir de (le terme "chien de chasse" [en] évolué à partir du germanique "hund")

Ceux-ci peuvent être configurés via l'interface d'administration de la base de données.