Technologies

Comment repérer la langue d'un texte

Sur Quiproquo, nous avons déjà parlé d'au moins deux outils permettant d'identifier la langue d'un texte ou d'une phrase : LangID et Polyglot 3000. Mais comment fonctionnent-ils ? Et, plus généralement, comment peut-on reconnaître automatiquement la langue d'un texte ?

Étiquettes:

Corriger des textes avec Correctmytext

Correctmytext (www.correctmytext.com) est un site participatif de correction de traductions ou de textes. Soumettez un texte, par exemple un article que vous auriez rédigé dans une langue qui vous est étrangère, ou bien une tentative de traduction, et des locuteurs de cette langue vous corrigeront votre ouvrage.

Étiquettes:

Ibbhath, moteur de recherche en arabe

Ibbhath est un moteur de recherche en langue arabe, accessible sur www.ibbhath.com. Son nom est transparent, "ibbhath" (إبحث) signifiant "recherche" en arabe.

Ce moteur de recherche par mots-clés, réputé rapide et pertinent, est développé par la société tunisienne A2WM (Advice Word Web Marketing), une entreprise spécialisée en programmation informatique, web marketing et création publicitaire.

Étiquettes:

La reconnaissance automatique avec Polyglot 3000

Polyglot 3000 (www.polyglot3000.com) est un logiciel qui permet de déterminer la langue d'un texte, d'une phrase, voire même d'un mot.

Pour l'utiliser, rien de bien compliqué. Il suffit de le télécharger, de lancer l'exécutable puis de copier le texte dont la langue nous est inconnue dans le champ prévu à cet effet. Polyglot 3000 indique alors quelle langue il a reconnu, tout en donnant un indice de confiance. Le programme indique également quelles langues sont proches de la langue identifiée.

GTranslater, un outil de traduction libre

GTranslater est un programme de traduction sous licence GPL, c'est-à-dire libre, qui s'avère capable de traiter des textes issus de 89 langues au moins, notamment grâce à Google Translate, l'outil de traduction de Google.

En effet, GTranslater s'appuie sur l'API (pour "Application Programming Interface") de Google Translate. GTranslater repose également sur la librairie d'exécution de Microsoft .NET 3.5, une librairie qu'il est nécessaire d'installer pour faire fonctionner le logiciel.

Étiquettes:

Apertium se met au breton

Le logiciel libre Apertium permet désormais de traduire des textes du breton vers le français. Ouest-France s'en fait l'écho dans un article daté du 19 mai 2009 : "Un traducteur automatique breton-français".

Apertium (www.apertium.org) est un plate-forme de traduction automatique qui était déjà disponible pour de nombreuses paires de langues européennes, telles que le catalan et le français, le catalan et l'anglais, l'espagnol et le galicien, ou l'anglais et le galicien. Apertium peut aussi traduire des textes du catalan, de l'espagnol ou du français vers l'espéranto, ou encore du gallois vers l'anglais. Autrement dit, les langues régionales et la langue internationale qu'est l'espéranto y ont une place importante.

Identifier la langue d'un texte avec LangId

LangId (http://langid.net/) est un nouveau service internet qui permet d'identifier en quelle langue est écrit un texte donné. Pour cela, il suffit de copier-coller le texte dont on veut reconnaître la langue dans le formulaire puis de cliquer sur 'Identify it'. Le nom de la langue et un drapeau représentatif de cette langue apparaîtront alors.

Ackr : 40 000 sigles, 150 langues et bientôt 50 pays

Ackr, le dictionnaire multilingue des acronymes et sigles du monde, classe désormais ces sigles par pays.

Ackr (http://hades-presse.com/ackr/) est un site internet qui répertorie et classe les sigles de tous les pays du monde, toutes langues confondues, tous systèmes d'écriture confondus. Ces sigles étaient accessibles par thèmes ('Informatique', 'Médecine', 'Linguistique', 'Philosophie', 'Économie', etc.) et par langues (espéranto, français, allemand, tagalog, finnois, roumain). Plus de 300 thèmes et plus de 150 langues étaient déjà représentés.

iTranslate, la traduction sur iPhone

À noter, la sortie d'une nouvelle version d'iTranslate, un logiciel gratuit qui permet de traduire des textes entre 42 langues, depuis un iPhone.

Étiquettes: