Répondre au commentaire

Identifier la langue d'un texte avec LangId

LangId (http://langid.net/) est un nouveau service internet qui permet d'identifier en quelle langue est écrit un texte donné. Pour cela, il suffit de copier-coller le texte dont on veut reconnaître la langue dans le formulaire puis de cliquer sur 'Identify it'. Le nom de la langue et un drapeau représentatif de cette langue apparaîtront alors.

LangID peut aussi être interrogé en téléchargant un fichier (.doc, .pdf, .xls ou .xlsx), via Twitter en twittant @langidbot (http://twitter.com), en envoyant un courriel à auto.id@langid.net (la réponse nous revient alors par courriel) ou bien au travers d'un interface de programmation d'applications (ou API, pour 'Application Programming Interface').

Le service repose sur une API de Google dénommée 'Google AJAX Language API for Translation and Detection'. Par conséquent, fin avril 2009, LangId était capable de reconnaître 85 langues, parmi lesquelles l'afrikaans, l'amharique (notamment parlé en Éthiopie), le basque, le bihari (langue d'un état du nord de l'Inde), le tchérokî (ou langue cherokee), l'espéranto, le guarani (langue amérindiennne), le kirghiz, le sanskrit, le mongol, le swahili, ou encore le tibétain.

Répondre

  • Les adresses de pages web et de messagerie électronique sont transformées en liens automatiquement.
  • Tags HTML autorisés : <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Les lignes et les paragraphes vont à la ligne automatiquement.

Plus d'informations sur les options de formatage