The Project Gutenberg EBook of Le multilinguisme sur le Web, by Marie Lebert

This eBook is for the use of anyone anywhere at no cost and with
almost no restrictions whatsoever.  You may copy it, give it away or
re-use it under the terms of the Project Gutenberg License included
with this eBook or online at www.gutenberg.org

** This is a COPYRIGHTED Project Gutenberg eBook, Details Below **
**     Please follow the copyright guidelines in this file.     **

Title: Le multilinguisme sur le Web

Author: Marie Lebert

Release Date: October 26, 2008 [EBook #27029]

Language: French

Character set encoding: ISO-8859-1

*** START OF THIS PROJECT GUTENBERG EBOOK LE MULTILINGUISME SUR LE WEB ***




Produced by Al Haines









LE MULTILINGUISME SUR LE WEB


MARIE LEBERT


CEVEIL, Montral, 1999 & NEF, University of Toronto, 2001

Copyright  1999 Marie Lebert

Date de fvrier 1999, cette tude s'articule autour de quatre grands thmes: le
multilinguisme, les ressources linguistiques, la traduction et la recherche.
Elle est base sur de nombreux entretiens. Elle est complte par une slection
de sites. Le titre de la version anglaise est: Multilingualism on the Web. Les
versions originales sont disponibles sur le NEF:
http://www.etudes-francaises.net/entretiens/multi.htm


TABLE


1. Introduction

2. Le multilinguisme

3. Ressources linguistiques

4. Traduction

5. Recherche

6. Slection de sites

7. Index des sites et pages web

8. Index des personnes cites


1. INTRODUCTION


On dclare souvent qu'Internet abolit le temps, les distances et les frontires,
mais qu'en est-il des langues?

Ds ses dbuts, la principale langue d'Internet a t l'anglais. Mme si
l'anglais est toujours prdominant en 1998-99, d'autres langues sont maintenant
prsentes, et leur progression est constante. Il reste  souhaiter que, tt ou
tard, la rpartition des langues sur Internet corresponde  la rpartition des
langues dans le monde, et que des logiciels de traduction soient disponibles
gratuitement sur le Web pour traduire instantanment une page dont on ne
comprend pas la langue. Ceci dit, il reste beaucoup  faire pour que ce rve
devienne ralit.

Cette tude s'articule autour de quatre grands thmes: le multilinguisme, les
ressources linguistiques, la traduction et la recherche.

Dans le chapitre concernant le multilinguisme, on tudiera le dveloppement des
langues non anglophones sur le Web, en prenant le franais  titre d'exemple. On
voquera aussi la diversit des langues dans l'Union europenne.

Dans le chapitre relatif aux ressources linguistiques, on donnera quelques
exemples des ressources disponibles sur le Web: sites rpertoriant les
ressources linguistiques, rpertoires de langues, dictionnaires et glossaires,
bases textuelles et terminologiques.

Dans le chapitre ayant trait  la traduction, on explorera les perspectives
apportes par la traduction automatique et la traduction assiste par
ordinateur.

Dans le dernier chapitre consacr  la recherche, on prsentera plusieurs
projets de recherche dans les domaines suivants: traduction automatique,
linguistique computationnelle, ingnierie du langage, internationalisation et
localisation.

En aot puis en dcembre 1998, j'ai envoy une enqute base sur trois questions
 un certain nombre d'organisations et de socits dont j'avais dcouvert les
sites sur le Web. Les trois questions taient les suivantes:

a) Comment voyez-vous le multilinguisme sur le Web?

b) Quel a t le bnfice de l'utilisation d'Internet dans votre vie
professionnelle ou dans l'activit de votre organisme ou socit?

c) Comment voyez-vous l'volution vers un Internet multilingue, dans le cadre de
votre avenir professionnel ou en gnral?

Les rponses reues sont inclues dans les pages qui suivent. Mes remerciements
les plus vifs vont  tous ceux qui ont contribu  cette tude.

En tant que traductrice-ditrice (travaillant essentiellement pour le Bureau
international du Travail (BIT), situ  Genve), je suis fascine par les
langues, et je souhaitais donc en savoir plus sur le multilinguisme sur le Web.
Durant le deuxime semestre 1998, j'ai pass un certain nombre d'heures 
explorer le Web dans cette intention. Date de fvrier 1999, cette tude est le
rsultat de ces recherches. Bien que trs proche de la version anglaise, elle
n'est pas la traduction littrale de celle-ci. Cette tude ne cherche pas non
plus  tre exhaustive. Elle vise seulement  diffuser mes propres recherches
dans les domaines qui m'intressent particulirement. Je m'intresse galement
aux relations entre l'imprim et Internet, objet d'une autre tude.


2. LE MULTILINGUISME


[Dans ce chapitre:]

[2.1. Le Web: d'abord anglais, ensuite multilingue / 2.2. Le franais face au
gant anglais / 2.3. Diversit des langues dans l'Union europenne]


2.1. Le Web: d'abord anglais, ensuite multilingue


A ses dbuts, Internet tait anglophone  pratiquement 100%, ce qui s'explique
par le fait qu'il a t cr aux Etats-Unis en tant que rseau mis en place ds
1969 par le Pentagone avant de se dvelopper dans les organismes gouvernementaux
et les universits.

Aprs la cration du World Wide Web en 1989-90 par Tim Berners-Lee au
Laboratoire europen pour la physique des particules (CERN) (Genve, Suisse) et
la diffusion en novembre 1993 du premier navigateur (Mosaic, anctre de
Netscape), lnternet s'est dvelopp de manire foudroyante, d'abord aux
Etats-Unis grce aux investissements considrables raliss par le gouvernement,
puis au Canada et dans le reste du monde.

En 1997, Babel, une initative conjointe d'Alis Technologies et de l'Internet
Society, a men la premire tude d'ensemble sur la rpartition relle des
langues sur Internet. Les rsultats sont publis dans le Palmars des langues de
la Toile, dat de juin 1997 et qui devrait tre ractualis prochainement. Les
pourcentages taient de 82,3% pour l'anglais, 4% pour l'allemand, 1,6% pour le
japonais, 1,5% pour le franais, 1,1% pour l'espagnol, 1,1% pour le sudois et
1% pour l'italien.

Le fait que l'anglais soit toujours reprsent par un trs fort pourcentage
s'explique par les trois facteurs suivants: 1) l'anglais est la principale
langue d'change internationale, 2) les premires annes ont vu la cration d'un
grand nombre de sites web manant des Etats-Unis, du Canada ou du Royaume-Uni,
3) la proportion de cybernautes est encore particulirement forte en Amrique du
Nord par rapport au reste du monde, pour les raisons suivantes: a) jusque trs
rcemment, le matriel informatique et les logiciels taient bien meilleur
march qu'ailleurs, b) on ne paie qu'un forfait mensuel pour les communications
tlphoniques locales, ce qui rend l'utilisation d'Internet trs conomique par
rapport  l'Europe, o les communications locales sont tarifies  la dure.

Dans La Francophonie en qute d'identit sur le Web, un article de Hugues Henry
publi par le cyberquotidien Multimdium, Jean-Pierre Cloutier, auteur des
Chroniques de Cybrie, expliquait:

"Au Qubec, je passe environ 120 heures par mois en ligne. Mon accs Internet me
cote 30 $ [canadiens], si j'ajoute mon forfait tlphonique d'environ 40 $
(avec les divers services facultatifs dont je dispose), le cot total de mon
branchement s'tablit donc  70 $ par mois. Je vous laisse deviner ce qu'il m'en
coterait en France, en Belgique ou en Suisse, o les communications locales
sont factures  la minute, pour le mme nombre d'heures en ligne."

Il s'ensuit que de nombreux cybernautes europens passent beaucoup moins de
temps sur le Web qu'ils ne le souhaiteraient, ou choisissent de "surfer" la nuit
pour viter les factures trop leves. Fin 1998 et dbut 1999, des mouvements de
grve ont eu lieu dans plusieurs pays d'Europe pour faire pression sur les
socits prestataires de services tlphoniques afin qu'elles baissent leur prix
et qu'elles proposent des forfaits.

Dans un article dat du 21 juillet 1998 et publi dans ZDNN (ZD Network News),
Martha L. Stone prcisait:

"Cette anne, le nombre de nouveaux sites non anglophones va probablement
dpasser celui de nouveaux sites anglophones, et le monde cyber est en train de
vritablement devenir une toile  l'chelle mondiale. [...] Selon Global Reach,
les groupes de nouveaux sites web qui se dveloppent le plus vite sont les
groupes non anglophones: on note une progression de 22,4% pour les sites
espagnols, 12,3% pour les sites japonais, 14% pour les sites allemands et 10%
pour les sites francophones. On estime  55,7 millions le nombre de personnes
non anglophones ayant accs au Web. [...] Alors que 6% seulement de la
population mondiale est de langue maternelle anglaise (et 16% d'hispanophones),
80% des pages web sont en anglais."

En contrepartie, mme si l'anglais est encore prdominant, il faut cependant
noter que de plus en plus de socits et d'organismes anglophones prennent
conscience du fait que tout le monde ne comprend pas l'anglais. Les sites
bilingues ou multilingues sont de plus en plus nombreux, ce pour des raisons
aussi bien commerciales que culturelles.

Sensible  ce problme, AltaVista, moteur de recherche utilis par douze
millions d'internautes, mettait en place en dcembre 1997 AltaVista Translation,
un service de traduction automatise de l'anglais vers cinq autres langues
(allemand, espagnol, franais, italien et portuguais), et vice versa. Aliment
par des dictionnaires multilingues contenant plus de 2,5 millions de termes, ce
service, gratuit et instantan, a t cr par Systran, socit
franco-amricaine pionnire dans le domaine de la traduction automatique.

La traduction tant entirement automatise, elle est videmment approximative.
Le texte  traduire doit tre de trois pages maximum, et la page originale et la
traduction apparaissent en vis--vis sur l'cran. Cet outil a videmment ses
limites, mais il a le mrite d'exister et il prfigure ceux de demain.

De par sa vocation internationale, Internet doit tre multilingue. On dispose
enfin d'un instrument qui peut abolir les frontires au lieu d'en crer
d'autres. De plus en plus de sites offrent des prsentations bilingues ou
trilingues, voire multilingues, pour toucher un public le plus large possible.
Le site du quotidien belge Le Soir, par exemple, offre une prsentation du
journal en six langues: franais, allemand, anglais, espagnol, italien et
nerlandais. Le Club des potes, lui, prsente son site en anglais, en espagnol
et en portugais.

Robert Ware est le crateur de OneLook Dictionaries, qui permet une recherche
rapide dans 2.058.544 mots appartenant  425 dictionnaires couvrant plusieurs
domaines: affaires, informatique et Internet, mdecine, religion, sciences et
techniques, sports, gnralits et argot. Dans son courrier lectronique du 2
septembre 1998, il crivait:

"Un fait intressant s'est produit dans le pass qui a t trs instructif pour
moi.

En 1994, je travaillais pour un tablissement scolaire et j'essayais d'installer
un logiciel sur un modle d'ordinateur particulier. J'ai trouv une personne qui
tait en train de travailler sur le mme problme, et nous avons commenc 
changer des courriers lectroniques. Soudain, cela m'a frapp... Le logiciel
avait t crit  40 km de l, mais c'tait une personne situe de l'autre ct
de la plante qui m'aidait. Les distances et les considrations gographiques
n'importaient plus!

Et bien, ceci est formidable, mais  quoi cela nous mne-t-il? Je ne puis
communiquer qu'en anglais mais, heureusement, mon correspondant pouvait utiliser
aussi bien l'anglais que l'allemand qui tait sa langue maternelle. Internet a
supprim une barrire, celle de la distance, mais il subsiste la barrire de la
langue, bien relle.

Il semble qu'Internet propulse simultanment les gens dans deux directions
diffrentes. Internet, anglophone  l'origine, relie les gens dans le monde
entier. Par l mme il favorise une langue commune pour communiquer. Mais il
cre aussi des contacts entre des personnes de langue diffrente et permet ainsi
le dveloppement d'un intrt plus grand pour le multilinguisme. Si une langue
commune est apprciable, elle ne remplace en aucun cas cette ncessit.

Internet favorise ainsi  la fois une langue commune et le multilinguisme, et
ceci est un facteur qui aide  trouver des solutions. L'intrt croissant pour
les langues et le besoin qu'on en a stimulent de par le monde la cration de
cours de langues et d'instruments d'aide linguistique, et Internet fournit la
possibilit de les rendre disponibles rapidement et  bon march."


2.2. Le franais face au gant anglais


Comme on l'a vu plus haut, le fort pourcentage de l'anglais - 100%  l'origine,
environ 80% maintenant - est  la baisse. Comme il s'tend progressivement 
tous les continents et  de nombreux pays non anglophones, Internet devient peu
 peu multilingue. Le franais est pris ici comme "exemple de langue non
anglophone".

Les sites francophones ont enregistr une forte expansion depuis 1996. Au dbut
de 1998, les Qubcois attendaient de pied ferme l'arrive en masse de sites
franais, surtout dans le domaine du commerce lectronique. Le 10 fvrier 1998 ,
lors d'un entretien avec le cyberquotidien Multimdium, Louise Beaudouin,
ministre de la Culture et des Communications du Qubec, dclarait: "J'attendais
depuis deux ans que la France se rveille. Aujourd'hui, je ne m'en plaindrai
pas. A cette date, le Qubec (6 millions d'habitants) proposait plus de sites
web que la France (60 millions d'habitants). La ministre attribuait le retard de
la France  deux facteurs: d'une part les tarifs levs du tlphone et du
Minitel, d'autre part les transactions commerciales possibles sur le Minitel
depuis plusieurs annes, ce qui a ralenti l'expansion du commerce lectronique
sur Internet.

"En voulant trop en faire une affaire nationale, qui exprimerait aussi par
ailleurs l'antipathie qu'ils ont envers les Anglais, les Franais ont tendance 
freiner la propagation de leur culture. Cela est trs regrettable, lit-on le 7
novembre 1996 dans Yomiyuri Shimbun, le plus grand quotidien japonais avec ses
dix millions d'exemplaires (cit dans un article de Pierre Perroud, crateur de
la cyberbibliothque Athena). Ce clich a-t-il jamais t vrai, si ce n'est
pendant la Guerre de cent ans?

Plus optimiste, Tim Berners-Lee, crateur du World Wide Web, dclarait cependant
en dcembre 1997  Pierre Ruetschi dans la Tribune de Genve: "Pourquoi les
francophones ne mettent-ils pas davantage d'informations sur le Web ? Est-ce
qu'ils pensent que personne ne veut la lire, que la culture franaise n'a rien 
offrir? C'est de la folie, l'offre est videmment norme." Ces remarques
sont-elles une critique, un encouragement, ou les deux ? On aurait pu les
comprendre il y a deux ou trois ans, mais il n'est pas sr qu'elles soient
encore de mise aujourd'hui, il suffit de naviguer sur le Web francophone pour
s'en rendre compte.

Le franais n'est pas seulement la langue de la France, du Qubec et d'une
partie de la Belgique et de la Suisse. Il est la langue officielle de 49 tats,
dont un certain nombre de pays africains, ce qui reprsente 500 millions de
personnes. Un exemple parmi d'autres de la coopration francophone est l'Agence
de la francophonie. Cre en 1970 pour regrouper 21 tats francophones, elle en
comptait 47 en 1997. "Instrument de coopration multilatrale ne d'un idal,
celui de crer une communaut qui fasse entendre sa voix dans le concert des
nations, [elle] participe aujourd'hui  l'avnement d'un Secrtariat gnral de
la Francophonie."

S'il est la langue des pays francophones, le franais est aussi la deuxime
langue utilise dans les organisations internationales. Malgr la pression
anglophone, relle ou suppose selon les cas, des francophones veillent  ce que
leur langue ait sa place en Europe et dans le monde, au mme titre que les
autres grandes langues de communication que sont l'anglais, l'arabe, le chinois
et l'espagnol. L aussi, l'optique est aussi bien la dfense d'une langue que le
respect du multilinguisme et de la diversit des peuples.

C'est l'Annuaire de l'UREC (UREC: Unit rseaux du CNRS - Centre national de la
recherche scientifique) qui, en France, a t le premier annuaire de sites web
en langue franaise. Travail de pionnier, il a permis aux cybernautes
francophones d'une part de se familiariser avec le Web sans se noyer dans la
masse d'informations mondiale, d'autre part de connatre les sites qui petit 
petit fleurissaient dans le monde francophone. Cr au dbut de 1994, il a
d'abord recens les sites acadmiques, puis son contenu est devenu plus
gnraliste.

Comme l'expliquait Claude Gross sur le site  l'automne 1997, la gestion de
l'annuaire est ensuite devenue trs difficile du fait de l'accroissement
constant du nombre de sites web, et notamment de sites commerciaux. Par la
suite, d'autres annuaires ont vu le jour, dont certains dbuts avec l'aide de
l'UREC. En juillet 1997, considrant que la mission qu'elle s'tait donne tait
accomplie, l'UREC a donc arrt la mise  jour de cet annuaire gnraliste. Il
est maintenant remplac par un annuaire spcialis consacr  l'enseignement
suprieur et  la recherche.

Nombreux sont ceux qui travaillent  une meilleure reprsentation du franais
sur le Web, en prnant un Web francophone intgr dans un Web international et
multilingue tenant compte de la diversit des langues en Europe et dans le
monde.

La Dlgation gnrale  la langue franaise (DGLF) s'est donne plusieurs
missions: veiller  la promotion et  l'emploi du franais en France, favoriser
son utilisation comme langue de communication internationale, et dvelopper le
plurilinguisme, garant de la diversit culturelle. La rubrique: "France langue"
propose trois listes de diffusion consacres  la langue franaise: "France
langue", "France langue assistance" et "France langue technologies". Gre et
modre par la DGLF, France langue se veut "un lieu convivial d'changes
d'informations et d'ides (manifestations, colloques, publications, etc.), ainsi
qu'un lieu de discussion sur les thmes lis  la langue franaise,  la
diversit linguistique,  la dynamique des langues,  la politique
linguistique", et elle accueille toutes les questions d'ordre linguistique
(grammaire, orthographe, usage, etc.).

La DGLF a galement men plusieurs actions pour assurer la place du franais sur
les nouveaux rseaux, notamment l'dition de guides techniques sur l'utilisation
dans les logiciels des caractres typographiques et des accents propres  la
langue franaise, ce en liaison avec l'AFNOR (Association franaise de
normalisation), ou la francisation de ceux qui sont commercialiss en France.

Le site de la Maison de la Francit, association belge sans but lucratif
subventionne depuis 1976 par la Commission communautaire franaise, souhaite
prsenter la ralit socio-linguistique de Bruxelles, seconde capitale
internationale de langue franaise aprs Paris, tout en agissant pour la dfense
et la promotion de la langue franaise  Bruxelles et au sein de la Communaut
franaise Wallonie-Bruxelles.

Au Qubec, l'Office de la langue franaise (OLF),organisme gouvernemental charg
d'assurer la promotion du franais, veille  l'implantation et au maintien du
franais dans les milieux de travail et des affaires et dans l'administration.
Il dfinit et conduit la politique qubcoise en matire de linguistique et de
terminologie.

Les instances politiques ont galement contribu  favoriser l'accs des
autoroutes de l'information aux francophones. En application de la Rsolution
sur la socit de l'information adopte par les chefs d'Etat et de gouvernement
 Cotonou (Bnin) en dcembre 1995, la Confrence des ministres francophones
chargs des inforoutes s'est droule  Montral (Qubec) du 19 au 21 mai 1997.
Date du 21 mai 1997, la Dclaration de Montral proposait de "dvelopper une
aire francophone d'ducation, de formation et de recherche; soutenir la cration
et la circulation de contenus francophones et contribuer  la sauvegarde et  la
valorisation des patrimoines; encourager la promotion de l'aire francophone de
dveloppement conomique; mettre en place une vigie francophone (veille active);
sensibiliser prioritairement la jeunesse ainsi que les utilisateurs, les
producteurs et les dcideurs; assurer la prsence et la concertation des
francophones dans les instances spcialises."

La propagation d'une langue passe aussi par l'tude dynamique de celle-ci.
Internet ouvre des horizons sans prcdent sur l'utilisation de bases de donnes
linguistiques et les possibilits de recherche textuelle, tmoin le site de
l'Institut national de la langue franaise (INaLF), qui prsente ses recherches
sur la langue franaise, notamment le discours littraire des 14e au 20e sicles
(contenu, smantique, thmatique), la langue courante (langue crite, langue
parle, argot), le discours scientifique et technique et ses ressources
terminologiques.

Christiane Jadelot, ingnieur d'tudes  l'INaLF-Nancy, expliquait dans son
courrier lectronique du 8 juin 1998:

"Les premires pages sur l'INaLF ont t mises sur l'Internet au milieu de
l'anne 96,  la demande de Robert Martin, directeur de l'INaLF. Je peux en
parler, car j'ai particip  la mise sous Internet de ces pages, avec des outils
qui ne sont pas comparables  ceux que l'on utilise aujourd'hui. J'ai en effet
travaill avec des outils sous UNIX, qui n'taient pas trs faciles
d'utilisation. Nous avions peu d'exprience de la chose,  l'poque, et les
pages taient trs verbeuses. Mais la direction a senti la ncessit urgente de
nous faire connatre par l'Internet, que beaucoup d'autres entreprises
utilisaient dj pour promouvoir leurs produits. Nous sommes en effet "Unit de
recherche et de service" et nous avons donc  trouver des clients pour nos
produits informatiss, le plus connu d'entre eux [tant] la base textuelle
FRANTEXT. Il me semble que la base FRANTEXT tait dja sur Internet [depuis
dbut 1995], ainsi qu'une maquette du tome 14 du TLF [Trsor de la langue
franaise]. Il tait donc ncessaire de faire connatre l'ensemble de l'INaLF
par ce moyen. Cela correspondait  une demande gnrale."

Organisme  but non lucratif, le Centre d'expertise et de veille Inforoutes et
Langues (CEVEIL) existe depuis 1995. Sa cration dcoule du dsir du
gouvernement du Qubec de mieux cerner la problmatique de l'utilisation et du
traitement des langues sur les inforoutes - dans une optique plus spcifiquement
francophone - par le biais d'activits de veille stratgique et la cration d'un
rseau d'changes et d'expertise.

Le CEVEIL s'est donn les objectifs suivants : sensibiliser les entreprises
qubcoises aux bnfices associs  une gestion lectronique et stratgique de
leurs savoirs; transfrer aux entreprises qubcoises les pratiques utiles pour
assurer cette gestion lectronique et stratgique; mettre en vidence le
plurilinguisme et l'importance des normes et standards, dans un contexte
d'enjeux technologiques et stratgiques relis  la gestion des savoirs;
valoriser l'expertise qubcoise et susciter des collaborations entre les
diffrents acteurs, au Qubec ou ailleurs.

Guy Bertrand, directeur scientifique du CEVEIL, et Cynthia Delisle, consultante,
ont rpondu  mes questions dans leur courrier lectronique du 23 aot 1998.

ML: "Comment voyez-vous le multilinguisme sur le Web?"

CEVEIL: "Le multilinguisme sur Internet est la consquence logique et naturelle
de la diversit des populations humaines. Dans la mesure o le Web a d'abord t
dvelopp et utilis aux Etats-Unis, il n'est gure tonnant que ce mdium ait
commenc par tre essentiellement anglophone (et le demeure actuellement).
Toutefois, cette situation commence  se modifier et le mouvement ira en
s'amplifiant,  la fois parce que la plupart des nouveaux usagers du Rseau
n'auront pas l'anglais comme langue maternelle et parce que les communauts dj
prsentes sur le Web accepteront de moins en moins la "dictature" de la langue
anglaise et voudront exploiter Internet dans leur propre langue, au moins
partiellement.

On peut prvoir que l'on arrivera sans doute, d'ici quelques annes,  une
situation semblable  ce qui prvaut dans le monde de l'dition en ce qui a
trait  la rpartition des diffrentes langues. Ceci signifie nanmoins que seul
un nombre relativement restreint de langues seront reprsentes (comparativement
aux quelques milliers d'idiomes qui existent). Dans cette optique, nous croyons
que le Web devrait chercher, entre autres,  favoriser un renforcement des
cultures et des langues minoritaires, en particulier pour les communauts
disperses.

Enfin, l'arrive de langues autres que l'anglais sur Internet, si elle constitue
un juste rquilibre et un enrichissement indniable, exaspre videmment le
besoin d'outils de traitement linguistique aptes  grer efficacement cette
situation, d'o la ncessit de poursuivre les travaux de recherche et les
activits de veille dans des secteurs comme la traduction automatique, la
normalisation, le reprage de l'information, la condensation automatique
(rsums), etc."

ML: "Quel a t le bnfice de l'utilisation d'Internet pour votre organisme?"

CEVEIL: "Mentionnons, tout d'abord, que l'existence du Web constitue en soi une
des raisons d'tre du CEVEIL, puisque nous concentrons nos activits
principalement autour de la thmatique de l'utilisation et du traitement des
langues sur Internet.

Par ailleurs, le Web est notre principal terrain de cueillette d'information sur
les thmatiques qui nous proccupent. Nous procdons notamment  une
frquentation assidue des sites abordant nos thmatiques de travail - plus
particulirement des sites diffusant des nouvelles quotidiennes et/ou
hebdomadaires. A ce niveau, on peut affirmer sans hsitation que nous exploitons
davantage Internet que les diverses ressources crites disponibles pour raliser
nos activits.

Dans un ordre d'ides un peu diffrent, nous utilisons abondamment le courriel
pour entretenir des relations avec les intervenants du milieu et ainsi obtenir
des informations et mener  bien divers projets. Le CEVEIL est un
"structure-rseau" qui survivrait difficilement sans Internet pour relier toutes
les personnes impliques.

Enfin, il convient de signaler que le Web constitue galement notre plus
important outil pour la diffusion de nos produits aux clientles-cibles: envoi
de bulletins lectroniques de nouvelles  nos abonns, cration d'un priodique
lectronique, diffusion d'information et de documents via notre site web, etc."

ML: "Comment voyez-vous l'volution vers un Internet multilingue?"

CEVEIL: "Internet est l pour demeurer; l'apparition de langues autres que
l'anglais sur ce mdium constitue galement un phnomne irrversible. Il sera
donc ncessaire de tenir compte de ces nouvelles ralits aux points de vue
conomique, social, politique, culturel, etc. Des secteurs comme la publicit,
la formation professionnelle, le travail en groupes et en rseaux, la gestion
des connaissances devront voluer en consquence. Cela nous ramne, tel que nous
l'avons mentionn plus haut,  la ncessit de dvelopper des technologies et
des outils vraiment performants qui faciliteront les changes dans un Village
global terriblement plurilingue..."


2.3. Diversit des langues dans l'Union europenne


Henri Slettenhaar, professeur  la Webster University (Genve, Suisse), est un
Europen trilingue. Il est hollandais, il enseigne l'informatique en anglais et
il parle couramment le franais puisqu'il vit en France. Dans son courrier
lectronique du 21 dcembre 1998, il expliquait:

"Je vois le multilinguisme comme un facteur fondamental. Les communauts locales
prsentes sur le Web devraient en tout premier lieu utiliser leur langue pour
diffuser des informations. Si elles veulent galement prsenter ces informations
 la communaut mondiale, celles-ci doient aussi tre disponibles en anglais. Je
pense qu'il existe un rel besoin de sites bilingues.

[...] Je suis enchant qu'il existe maintenant tant de documents disponibles
dans leur langue originale. Je prfre de beaucoup lire l'original avec
difficult plutt qu'une traduction mdiocre."

Selon Global Reach, 15% seulement des Europens (qui reprsentent 500 millions
d'habitants) sont de langue maternelle anglaise, et 28% seulement parlent
anglais. Le site mentionne aussi une tude rcente dmontrant que 32% seulement
des cybernautes europens consultent le Web anglophone.

Crateur de Euro-Marketing Associates (qui englobe Global Reach), Bill Dunlap,
qui dfend le commerce lectronique europen auprs de ses compatriotes
amricains, crivait dans son courrier lectronique du 12 dcembre 1998, que
contrairement  l'Amrique du Nord, "ici en Europe (j'cris de France), les pays
sont petits, si bien que, depuis des sicles, une perspective internationale est
ncessaire."

De nombreux organismes traitent de multilinguisme, par exemple l'Association
europenne pour les ressources linguistiques (ELRA), le European Network in
Language and Speech (ELSNET) et le programme Multilingual Information Society
(MLIS) de la Communaut europenne.

Etablie  Luxembourg en Fvrier 1995, l'Association europenne pour les
ressources linguistiques (ELRA) est une association  but non lucratif qui a
pour but de fournir une organisation centralise pour la validation, la gestion
et la distribution des ressources et outils en parole, texte et terminologie, et
de promouvoir leur utilisation au sein de la communaut europenne de recherche
et dveloppement en tlmatique.

Le European Network in Language and Speech (ELSNET) (Rseau europen pour le
langage et la parole) regroupe plus d'une centaine d'institutions universitaires
et industrielles. L'objectif technologique commun aux participants de ELSNET est
de construire des systmes multilingues pour la parole et le langage naturel,
avec couverture illimite de la langue parle et crite.

Dans son courrier lectronique du 23 septembre 1998, Steven Krauwer,
coordinateur d'ELSNET, expliquait:

"En tant que citoyen europen je pense que le multilinguisme sur le Web est
absolument essentiel. A mon avis, ce n'est pas une situation saine  long terme
que seuls ceux qui ont une bonne matrise de l'anglais puissent pleinement
exploiter les bnfices du Web.

En tant que chercheur (spcialis dans la traduction automatique), je vois le
multilinguisme comme un dfi majeur: pouvoir garantir que l'information sur le
Web soit accessible  tous, indpendamment des diffrences de langue.

Internet est l'instrument que j'utilise le plus pour communiquer avec les
autres, et c'est ma source principale d'information. [...] Je compte passer le
reste de ma vie professionnelle  utiliser la technologie de l'information pour
supprimer ou rduire les barrires des langues."

Lanc en novembre 1996, le programme Multilingual Information Society (MLIS)
(Socit d'information multilingue) de la Commission europenne soutient la
ralisation d'une infrastructure favorisant des ressources linguistiques
europennes, mobilise et accrot le dveloppement des industries du langage, et
favorise l'utilisation d'outils linguistiques dans le secteur public europen.
Les entreprises, les organismes du secteur public, les industries du langage et
les citoyens peuvent bnficier de ce programme.

"Afin de promouvoir 'concrtement' une Europe multilingue, dans un contexte
d'volution rapide et permanent des nouvelles technologies de communication, et
d'attirer largement l'intrt sur ce programme, ce site est accessible dans les
11 langues officielles de l'Union europenne [allemand, anglais, danois,
espagnol, finlandais, franais, grec, hollandais, italien, portugais et
sudois]. Nous renvoyons  des rfrences et  des liens encore plus larges...
Nous essayons de fournir autant d'information que possible dans ces onze
langues, et nous vous demandons de rester comprhensif pour le retard existant
parfois entre la publication d'un document officiel dans sa langue initiale et
sa traduction dans les autres langues de l'UE."

Le multilinguisme est l'affaire de tous, tmoin cet Appel du Comit europen
pour le respect des cultures et des langues en Europe (CERCLE) qui, diffus dans
les onze langues officielles de l'Union europenne, dfend "une Europe
humaniste, plurilingue et riche de sa diversit culturelle". Il propose aux
rviseurs du Trait de l'Union europenne douze amendements prenant en compte le
respect des cultures et des langues:

"La diversit et le pluralisme linguistiques ne sont pas un obstacle  la
circulation des hommes, des ides et des marchandises ou services, comme veulent
le faire croire certains, allis objectifs, conscients ou non, de la culture et
de la langue dominantes. C'est l'uniformisation et l'hgmonie qui sont un
obstacle au libre panouissement des individus, des socits et de l'conomie de
l'immatriel, source principale des emplois de demain. Le respect des langues, 
l'inverse, est la dernire chance pour l'Europe de se rapprocher des citoyens,
objectif toujours affich, presque jamais mis en pratique. L'Union doit donc
renoncer  privilgier la langue d'un seul groupe."

Dans Language Futures Europe, Paul Treanor propose des liens sur la politique
linguistique, le multilinguisme, les structures linguistiques globales, et la
domination de l'anglais. Le site dbute par un commentaire sur les structures
linguistiques. Il offre des textes et des essais, des sections consacres  la
politique europenne, aux politiques nationales et aux sites de recherche, et
des documents sur le "mouvement monolingue" mergeant aux Etats-Unis.

Dans son courrier lectronique du 18 aot 1998, Paul Treanor exposait ses
rflexions sur les questions poses:

"Vous parlez du Web au singulier. Comme vous l'avez sans doute lu, je pense que
"Le Web" est un concept politique, non technologique. Une civilisation est
possible avec des ordinateurs trs sophistiqus mais pas d'interconnexion.
L'ide qu'il devrait exister "Un Web" est drive de la tradition librale du
march unique ouvert, de prfrence mondial.

J'ai dj suggr qu'Internet devrait tre tout simplement dcoup, et que
l'Europe devrait couper ses liens avec les Etats-Unis, et construire un autre
Net spcifique et incompatible avec le premier. Ds qu'on envisage la
possibilit de Nets multiples, les thmes correspondant aux diffrents chapitres
de votre tude sont souvent hors de propos. Rappelez-vous qu'il y a quinze ans
tout le monde pensait qu'il n'y aurait qu'un metteur de tlvision  l'chelle
mondiale, CNN. Or il existe maintenant des chanes de tlvision nationales
franaises, allemandes ou espagnoles. La rponse  votre question est donc que
l'entit "Un Web" sera de toute manire divise, probablement en quatre parties:

a) un Net interne aux Etats-Unis et au Canada, avec nombre des caractristiques
actuelles;

b) des Nets nationaux spars, avec des liens limits avec l'extrieur;

c) un nouveau Net gnral pour relier entre eux les Nets de la catgorie 2;

d) et peut-tre un Net spcifique  l'Union europenne.

Comme vous voyez, cette structure est parallle  celle qui existe en
gopolitique. Toute l'infrastructure des tlcommunications a suivi des modles
similaires.

Je pense qu'il n'est pas possible d'approcher le Web de la manire neutre et
apolitique envisage dans votre tude. La politique actuelle de l'Union
europenne prtend tre neutre, mais elle supporte en fait le dveloppement de
l'anglais comme langue de contact pour communiquer."


3. RESSOURCES LINGUISTIQUES


[Dans ce chapitre:]

[3.1. Sites indexant des ressources linguistiques / 3.2. Rpertoires
linguistiques / 3.3. Dictionnaires et glossaires / 3.4. Bases de donnes
textuelles / 3.5. Bases de donnes terminologiques]


3.1. Sites indexant des ressources linguistiques


Prpar par le programme Tlmatique pour les bibliothques de la Commission
europenne, Multilingual Tools and Services (Outils et services multilingues)
propose une srie de dictionnaires, instruments d'aide multilingues, projets,
moteurs de recherche par langue, banques de donnes terminologiques, thsaurus
et systmes de traduction.

Cre par Tyler Chambers en mai 1994, The Human-Languages Page (La page des
langues humaines) est un catalogue dtaill de 1.800 ressources linguistiques
dans plus de 100 langues diffrentes. Les diffrentes sections sont: langues et
littrature, coles et institutions, ressources linguistiques, produits et
services, organismes, emplois et stages, dictionnaires et cours de langues.

Tyler Chambers mne aussi un autre projet relatif aux langues, l'Internet
Dictionary Project (Projet de dictionnaire Internet). Sur le site web, il
explique:

"Le but de l'Internet Dictionary Project est de crer des dictionnaires de
traduction grce  l'aide des internautes. Ce site permet aux individus du monde
entier de consulter et de participer  la traduction de termes anglais dans
d'autres langues. Les listes de termes anglais et leurs correspondants dans
d'autres langues sont ensuite mis  la disposition de tous sur ce site, sans
restriction d'aucune sorte. [...]

The Internet Dictionary Project a dbut en 1995 pour combler une lacuune et
procurer  la communaut d'Internet et  tous ceux qui s'intressent 
l'informatique des dictionnaires de traduction gratuits. Non seulement il est
trs utile d'avoir immdiatement accs  des dictionnaires via le World Wide
Web, mais ceci permet aussi le dveloppement de logiciels pouvant tirer parti de
tels dictionnaires, que ce soit des programmes de traduction ou des
vrificateurs d'orthographe ou encore des guides d'apprentissage des langues. En
facilitant la cration de ces dictionnaires en ligne par des milliers de
volontaires, et en les mettant gratuitement  la disposition de tous, l'Internet
Dictionary Project espre imprimer sa marque sur Internet et susciter d'autres
projets qui seront plus bnfiques que des revenus purement financiers."

Tyler Chambers a rpondu  mes questions dans son courrier lectronique du 14
septembre 1998.

ML: "Comment voyez-vous le multilinguisme sur le Web?"

TC: "Le multilinguisme sur le Web tait invitable bien avant que ce mdium ne
se dveloppe vraiment. Mon premier vrai contact avec Internet date de 1994, un
peu aprs ses dbuts mais bien avant son expansion. 1994 a t aussi l'anne o
j'ai dbut mon premier projet web multilingue, et il existait dj un nombre
significatif de ressources linguistiques en ligne. Ceci tait antrieur  la
cration de Netscape. Mosaic tait le seul navigateur sur le Web, et les pages
web taient essentiellement des documents textuels relis par des hyperliens.
Suite  l'exprience acquise maintenant par les navigateurs et les cybernautes,
je ne pense pas qu'il existe une langue vivante qui ne soit pas reprsente sur
le Web, que ce soit la langue des Indiens d'Amrique ou les dialectes
moyen-orientaux. De mme une plthore de langues mortes peut maintenant trouver
une audience nouvelle avec des rudits et autres spcialistes en ligne. A ma
connaissance, trs peu de jeux de caractres ne sont pas disponibles en ligne:
les navigateurs ont maintenant la possibilit de visualiser les caractres
romains, asiatiques, cyrilliques, grecs, turcs, etc. Accent Software a un
produit appel "Internet avec accents" qui prtend tre capable de visualiser
plus de 30 codages diffrents. S'il existe encore des obstacles  la diffusion
d'une langue spcifique sur le Web, ceci ne devrait pas durer."

ML: "Quel a t le bnfice de l'utilisation d'Internet dans votre vie
professionnelle?"

TC: "Ma vie professionnelle est en ce moment compltement distincte de mon
activit sur Internet. Je suis un programmeur/technicien informatique, je trouve
cela stimulant et cela me permet de payer les factures. Mon activit en ligne a
t de rendre l'information linguistique accessible  davantage de gens par le
biais de deux de mes projets sur le Web. Bien que je ne sois pas multilingue, ni
mme bilingue moi-mme, je suis conscient du fait que trs peu de domaines ont
une importance comparable  celle des langues et du multilinguisme. Internet m'a
permis de toucher des millions de personnes et de les aider  trouver ce
qu'elles cherchaient, chose que je suis heureux de faire. Je suis devenu aussi
une sorte de clbrit, ou au moins quelqu'un de familier dans certains cercles.
Je viens de dcouvrir qu'un de mes projets est brivement mentionn dans les
ditions asiatique et internationale de Time Magazine. Dans l'ensemble, je pense
que le Web a t important pour la sensibilisation aux langues et pour les
questions culturelles. Dans quel autre endroit peut-on chercher au hasard
pendant vingt minutes et trouver des informations susceptibles de vous
intresser dans trois langues diffrentes sinon plus? Les mdias de
communication rendent le monde plus petit en rapprochant les gens; je pense que
le Web est le premier mdium - bien plus que le courrier, le tlgraphe, le
tlphone, la radio ou la tlvision -  rellement permettre  l'usager moyen
de franchir les frontires nationales et culturelles. Isral n'est plus  des
milliers de kilomtres, mais seulement  quelques clics de souris. Notre monde
est maintenant suffisamment petit pour tenir sur un cran d'ordinateur."

ML: "Comment voyez-vous l'volution vers un Internet multilingue?"

TC: "Comme je l'ai dit plus haut, je pense que l'avenir d'Internet rside dans
davantage de multilinguisme et d'exploration et de comprhension
multiculturelles que nous n'en avons jamais vu. Cependant Internet sera
seulement le mdium au travers duquel l'information circule. Comme le papier qui
sert de support au livre, Internet lui-mme augmente trs peu le contenu de
l'information. Par contre il augmente normment la valeur de celle-ci dans la
capacit qu'il a  communiquer cette information. Dire qu'Internet aiguillonne
le multilinguisme est  mon sens une opinion fausse. C'est la communication qui
aiguillonne le multilinguisme et l'change multiculturel, Internet est seulement
le mode de communication le plus rcent rendu accessible aux gens plus ou moins
ordinaires. Internet a un long chemin  parcourir avant d'tre omniprsent dans
le monde entier, mais il est vraissemblable que lui-mme ou un mdium de la mme
ligne y arrive. Les langues deviendront encore plus importantes qu'elles ne le
sont quand tout le monde pourra communiquer  l'chelle de la plante ( travers
le Web, les discussions, les jeux, le courrier lectronique, ou toute
application appartenant encore au domaine de l'avenir), mais je ne sais pas si
ceci mnera  un renforcement des attaches linguistiques ou  une fusion des
langues jusqu' ce qu'il n'en subsite plus que quelques-unes ou mme une seule.
Une chose qui m'apparat certaine est qu'Internet sera toujours la marque de
notre diversit, y compris la diversit des langues, mme si cette diversit
diminue. Et c'est une des choses que j'aime au sujet d'Internet, c'est un
exemple  l'chelle mondiale du dicton: 'Cela n'a pas vraiment disparu tant que
quelqu'un s'en souvient.' Et les gens se souviennent."

Depuis ses dbuts en 1989, le CTI (Computer in Teaching Initiative) Centre for
Modern Languages (Centre pour l'utilisation des ordinateurs dans l'enseignement
des langues modernes) est inclus dans l'Institut des langues de l'Universit
d'Hull (Royaume-Uni) et vise  promouvoir l'utilisation des ordinateurs dans
l'apprentissage et l'enseignement des langues. Le Centre procure des
informations sur la manire dont l'apprentissage des langues assist par
ordinateur peut tre effectivement intgr  des cours existants en offrant un
soutien aux professeurs qui utilisent, ou souhaitent utiliser, l'informatique
dans l'enseignement qu'ils dispensent.

June Thompson, responsable du Centre, a rpondu  mes questions dans son
courrier lectronique du 14 dcembre 1998.

ML: "Comment voyez-vous le multilinguisme sur Internet?"

JT: "Avec Internet, on a la possibilit d'accrotre l'utilisation des langues
trangres, et notre organisation ne soutient absolument pas la suprmatie de
l'anglais en tant que langue d'Internet. Une intressante confrence sur ce
sujet a t donne par Madanmohan Rao  la Confrence WorldCALL de Melbourne en
juillet 1998. [Voir la prsention de l'ouvrage  paratre suite  la
confrence.]

ML: "Quel a t le bnfice de l'utilisation d'Internet dans votre activit?"

JT: "L'utilisation d'Internet a apport une nouvelle dimension  notre tche qui
consiste  soutenir les professeurs de langue dans l'utilisation de la
technologie correspondante."

ML: "Comment voyez-vous l'volution vers un Internet multilingue?"

JT: "Je pense que dans un avenir proche l'utilisation de supports linguistiques
sur Internet va continuer  se dvelopper en mme temps que d'autres activits
lies  la technologie (par exemple l'utilisation de CD-ROM - certains
tablissements n'ont pas suffisamment de matriel informatique en rseau). A
l'avenir il me semble que l'utilisation d'Internet jouera un rle plus grand,
mais seulement si ces activits sont  caractre pdagogique. Notre organisme
travaille troitement avec le WELL project [Web Enhanced Language Learning -
Apprentissage des langues grce au Web], qui se consacre  ces problmes."

Hberg par le CTI Centre for Modern Languages et l'Universit d'Hull
(Royaume-Uni), EUROCALL (European Association for Computer Assisted Language
Learning) (Association europenne pour l'apprentissage des langues assist par
ordinateur) regroupe des professionnels de l'enseignement des langues exerant
en Europe et dans le monde entier. Ses objectifs sont de favoriser l'utilisation
des langues trangres en Europe, ainsi qu'une vision europenne de
l'utilisation de la technologie pour l'apprentissage des langues et
l'laboration et la diffusion d'un matriel de qualit.

EUROCALL soutient aussi deux groupes: CAPITAL (Computer Assisted Pronunciation
Investigation Teaching and Learning) (Investigation, enseignement et
apprentissage de la prononciation assists par ordinateur), qui est un groupe de
chercheurs et de praticiens souhaitant utiliser l'informatique dans le domaine
de la prononciation pris dans le sens le plus large du terme, et WELL (Web
Enhanced Language Learning) (Apprentissage des langues grce au Web), qui
procurera l'accs  des ressources web de qualit dans douze langues
diffrentes. Slectionnes et dcrites par des experts, ces ressources seront
compltes par des informations et des exemples sur la manire de les utiliser
pour l'enseignement et l'apprentissage d'une langue.

Internet Resources for Language Teachers and Learners (Ressources Internet pour
l'enseignement et l'apprentissage des langues) propose plusieurs catgories de
liens: ressources linguistiques gnrales (centres et dpartements,
dictionnaires et grammaires, listes de discussion, apprentissage des langues 
distance, caractres, compte-rendus, linguistique, listes et index, divers,
journaux et priodiques, organismes, ressources, sites linguistiques
multilingues, moteurs de recherche et index, sites linguistiques commerciaux
(audiovisuels, coles de langue, ressources et rpertoires, logiciels).

Gr par l'Institut des sciences phontiques d'Amsterdam (Pays-Bas), Speech on
the Web (Parole sur le Web) est un rpertoire de liens organiss en diffrentes
sections: congrs, runions et ateliers, liens et listes, phontique et parole,
traitement de la langue naturelle, sciences cognitives et intelligence
artificielle, linguistique computationnelle, dictionnaires, lettres
d'information lectroniques, revues et publications.

Travlang est un site ddi  la fois aux voyages et aux langues. Cr par
Michael C. Martin en 1994 sur le site de son universit alors qu'il tait
tudiant en physique (il est maintenant chercheur au Lawrence Berkeley National
Laboratory, en Californie), Foreign Languages for Travelers (Langues trangres
pour les voyageurs), inclus dans Travlang en 1995, donne la possibilit
d'apprendre 60 langues diffrentes sur le Web. Translating Dictionaries
(Dictionnaires de traduction) donne accs  des dictionnaires gratuits dans
diverses langues (afrikaans, allemand, danois, espagnol, espranto, finnois,
franais, frison, hollandais, hongrois, italien, latin, norvgien, portugais et
tchque). Le site offre aussi de nombreux liens vers des dictionnaires de
langue, services de traduction, coles de langue, librairies multilingues, etc.

Michael C. Martin a rpondu  mes questions dans son courrier lectronique du 25
aot 1998.

ML: "Comment voyez-vous le multilinguisme sur le Web?"

MCM: "Je pense que le Web est un endroit idal pour rapprocher les cultures et
les personnes, et ceci inclut d'tre multilingue. Notre site Travlang est trs
populaire pour cette raison, et les gens souhaitent se sentir en contact avec
d'autres parties du monde."

ML: "Quel a t le bnfice de l'utilisation d'Internet dans votre activit?"

MCM: "Et bien, nous en avons fait une petite affaire! Internet est vraiment un
outil important pour communiquer avec des gens avec lesquels vous n'auriez pas
l'occasion de dialoguer autrement. J'apprcie vraiment la collaboration gnrale
qui a rendu possibles les pages de Foreign Languages for Travelers (Langues
trangres pour les voyageurs)."

ML: "Comment voyez-vous l'volution vers un Internet multilingue?"

MCM: "Je pense que les traductions intgrales informatises vont devenir monnaie
courante, et qu'elles permettront de communiquer  la base avec davantage de
gens. Ceci aidera aussi  amener davantage Internet au monde non anglophone."

La LINGUIST List est la section linguistique de la WWW Virtual Library. Elle
donne une srie complte de liens sur les ressources linguistiques: profession
(confrences, associations linguistiques, programmes, etc.), recherche et
soutien  la recherche (articles, rsums de mmoires, projets, bibliographies,
dossiers, textes), publications, pdagogie, ressources linguistiques (langues,
familles linguistiques, dictionnaires, information rgionale), et soutien
informatique (polices de caractres et logiciels).

Helen Dry, modratrice de la LINGUIST List, expliquait dans son courrier
lectronique du 18 aot 1998:

"La LINGUIST List, que je modre, a pour politique d'accepter les informations
dans toutes les langues, puisque c'est une liste pour linguistes. Nous ne
souhaitons cependant pas que le message soit publi dans plusieurs langues, tout
simplement  cause de la charge de travail que cela reprsenterait pour notre
personnel de rdaction (nous ne sommes pas une liste fourre-tout, mais une liste
modre: avant d'tre publi, chaque message est class par nos
tudiants-rdacteurs dans une section comprenant des messages du mme type).
Notre exprience nous montre que pratiquement tout le monde choisit de publier
en anglais. Mais nous relions ces informations  un systme de traduction qui
prsente nos pages dans cinq langues diffrentes. Ainsi un abonn ne lit
LINGUIST en anglais que s'il le souhaite. Nous essayons aussi d'avoir au moins
un tudiant-diteur qui soit rellement multilingue, afin que les lecteurs
puissent correspondre avec nous dans d'autres langues que l'anglais."

Gr par le Yamada Language Center de l'Universit d'Oregon (USA), Yamada WWW
Language Guides (Guides Yamada de langues sur le WWW) est un rpertoire de
ressources linguistiques par famille gographique et par ordre alphabtique. Il
comprend des organismes, des coles de langues, du matriel d'enseignement, des
rfrences culturelles, et des liens WWW.

Language today (La langue aujourd'hui) est un nouveau magazine pour ceux qui
travaillent dans les langues appliques: traducteurs, interprtes,
terminologues, lexicographes et rdacteurs techniques. C'est une ralisation
commune de Logos, qui procure le site web, et Praetorius, service d'expertise
britannique qui suit l'actualit des dveloppements concernant les langues
appliques. Le site procure des liens vers des associations de traducteurs, des
coles de langues et des dictionnaires.

Geoffrey Kingscott, directeur gnral de Praetorius, a rpondu  mes questions
dans son courrier lectronique du 4 septembre 1998.

ML: "Comment voyez-vous le multilinguisme sur le Web?"

GK: "Les caractristiques propres au Web sont la multiplicit de gnrateurs de
sites et le bas prix de l'mission de messages. Ceci favorisera donc le
multilinguisme au fur et  mesure du dveloppement du Web. Comme celui-ci a vu
le jour aux Etats-Unis, il est encore principalement en anglais, mais ce n'est
qu'un phnomne temporaire. Pour expliquer ceci plus en dtail, je dirais que
quand nous comptions sur l'imprim ou l'audiovisuel (film, tlvision, radio,
vido, cassettes), l'information ou le divertissement que nous attendions
dpendait d'agents (diteurs, stations de tlvision ou de radio, producteurs de
cassettes ou de vidos) qui devaient subsister commercialement et, dans le cas
de la radiotldiffusion du service public, avec de svres contraintes
budgtaires. Ceci signifie que la quantit de clients est primordiale, et
dtermine la ncessit de langues autres que l'omniprsent anglais. Ces
contraintes disparaissent avec le Web. Pour ne donner qu'un exemple mineur tir
de notre exprience, nous publions la version imprime de Language Today
uniquement en anglais, dnominateur commun de nos lecteurs. Quand nous utilisons
un article qui tait originellement dans une langue autre que l'anglais, ou que
nous relatons un entretien men dans une langue autre que l'anglais, nous le
traduisons en anglais et nous ne publions que la version anglaise, pour la
raison suivante: le nombre de pages que nous pouvons imprimer est limit, et
dtermin en fonction de notre clientle (annonceurs et abonns). Par contre,
dans notre version Web, nous proposons aussi la version originale."

ML: "Quel a t le bnfice de l'utilisation d'Internet dans votre activit?"

GK: "Internet n'a pas apport de changement majeur dans notre socit. C'est un
mdium de plus plutt qu'un mdium visant  remplacer les autres."

ML: "Quelle est l'volution prvue dans les prochaines annes?"

GK: "Nous continuerons d'avoir un site web pour notre socit, et de publier une
version de notre revue sur le Web, mais ceci ne sera qu'un secteur de notre
travail. Nous utilisons Internet comme une source d'information que nous
distillons ensuite  nos lecteurs, qui autrement seraient confronts au problme
majeur du Web: faire face  un flux incontrl d'informations."


3.2. Rpertoires linguistiques


The Ethnologue est la version lectronique deThe Ethnologue, 13e d., (ditrice:
Barbara F. Grimes, avec la collaboration de Richard S. Pittman and Joseph E.
Grimes), publi en 1996 par le Summer Institute of Linguistics (Dallas, Texas,
USA). Ce catalogue de plus de 6.700 langues parles dans 228 pays est accessible
au moyen de deux outils de recherche: le Ethnologue Name Index (Index des noms
de l'Ethnologue), qui donne la liste des noms de langues et de dialectes et de
leurs synonymes, et le Ethnologue Language Family Index (Index des familles
linguistiques de l'Ethnologue), qui organise les langues en fonction des
familles linguistiques.

Barbara F. Grimes, ditrice de The Ethnologue, crivait dans son courrier
lectronique du 18 aot 1998:

"Les pages web multilingues sont de plus en plus utiles, mais elles sont plus
onreuses  grer. Nous avons eu des demandes nous demandant l'accs  The
Ethnologue dans plusieurs autres langues, mais nous n'avons pas le personnel ni
les fonds pour la traduction ou la ractualisation, indispensable puisque notre
site est constamment mis  jour.

Internet nous est utile, c'est un outil pratique qui apporte un complment 
notre travail. Nous l'utilisons principalement pour le courrier lectronique.

C'est aussi un moyen commode pour mettre notre documentation  la disposition
d'une audience plus large que celle de The Ethnologue imprim.

D'un autre ct, The Ethnologue sur Internet n'atteint en fait qu'une audience
limite disposant d'ordinateurs. Or, dans les personnes que nous souhaitons
atteindre, nombreux sont ceux qui n'ont pas accs  des ordinateurs. Je pense
particulirement aux habitants du dit 'Tiers-monde'."

Cr en dcembre 1995 par Yoshi Mikami, de Asia Info Network , The Languages of
the World by Computers and the Internet (Les langues du monde par ordinateur ou
sur Internet), communment appel Logos Home Page ou Kotoba Home Page, donne,
pour chaque langue, un bref historique, les caractristiques, le systme
d'criture, le jeu de caractres et la configuration du clavier pour
l'utilisation de l'ordinateur et d'Internet dans la langue donne.

Dans son courrier lectronique du 17 dcembre 1998, Yoshi Mikami crivait:

"Ma langue maternelle est le japonais. Comme j'ai suivi mes tudes de troisime
cycle aux Etats-Unis et que j'ai travaill dans l'informatique, je suis devenu
bilingue japonais/anglais amricain. J'ai toujours t intress par diffrentes
langues et cultures, aussi j'ai appris le russe, le franais et le chinois dans
la foule. A la fin de 1995, j'ai cr sur le Web The Languages of the World by
Computers and the Internet et j'ai tent de donner - en anglais et en japonais -
un bref historique de toutes ces langues, ainsi que les caractristiques propres
 chaque langue et  sa phontique. Suite  l'exprience acquise, j'ai invit
mes deux associs  crire un livre sur la conception, la cration et la
prsentation de pages web multilingues, livre qui fut publi en aot 1997 sous
le titre: The Multilingual Web Guide (dition japonaise), le premier livre au
monde sur un tel sujet.

Il y a des milliers d'annes de cela, en Egypte, en Chine et ailleurs, les gens
taient plus sensibles au fait de communiquer leurs lois et leurs rflexions non
seulement dans une langue mais dans plusieurs. Dans notre monde moderne, chaque
Etat a adopt plus ou moins une seule langue de communication. A mon avis,
Internet verra l'utilisation plus grande de langues diffrentes et de pages
multilingues (et pas seulement une gravitation autour de l'anglais amricain) et
un usage plus cratif de la traduction informatique multilingue. 99% des sites
web crs au Japon sont en japonais!"

Disponible sur le site de l'Institut Sabhal Mr Ostaig (Ile de Skye, Ecosse) et
gr par Caoimhn P.  Donnale, European Minority Languages est une liste de
langues minoritaires - ou rendues minoritaires - disponible par ordre
alphabtique et par famille linguistique. Ce site procure aussi des liens avec
des sites du mme type dans le monde entier.

Caoimhn P.  Donnale crivait dans son courrier lectronique du 18 aot 1998:

"Internet a contribu et contribuera au dveloppement fulgurant de l'anglais
comme langue mondiale.

Internet peut grandement aider les langues minoritaires. Ceci ne se fera pas
tout seul, mais seulement si les gens choisissent de dfendre une langue.

Le Web est trs utile pour dispenser des cours de langues, et la demande est
grande.

La norme UNICODE (ISO 10646) pour les jeux de caractres est trs importante et
elle va grandement favoriser le multilinguisme sur le Web."


3.3. Dictionnaires et glossaires


Les dictionnaires en ligne sont de plus en plus nombreux. Voici trois exemples
(francophone, anglophone et multilingue).

Le Dictionnaire francophone en ligne, corpus lexical du Dictionnaire universel
francophone, est publi conjointement par Hachette et l'Agence universitaire de
la Francophonie (AUPELF-UREF), qui expliquent sur le site:

"Voici enfin prsents, sur un pied d'galit, le franais dit 'standard' et les
mots et expressions en franais tel qu'on le parle sur les cinq continents.
Voici les termes de la flore et de la faune qui apportent vie et couleur  cet
ouvrage. Ce dictionnaire s'adresse  tous ceux qui,  travers le monde, veulent
voir dans la Francophonie une ralit que l'on dsire qualifier de charnelle."

Dans Merriam-Webster Online: the Language Center (Merriam-Webster en ligne: le
centre linguistique), un grand diteur britannique de dictionnaires met en accs
libre sa collection de ressources en ligne pour la langue anglaise: dfinition
des mots, orthographe, prononciation, synonymes, exercices de vocabulaire, etc.
Les ouvrages de rfrence disponibles en ligne sont le WWWebster Dictionary, le
WWebster Thesaurus, le Webster's Third (lexique), le Guide to International
Business Communications, le Vocabulary Builder (questions de vocabulaire
interactives), et le Barnhart Dictionary Companion (nouveaux mots).

Le Logos Dictionary est un dictionnaire multilingue d'environ 8 millions
d'entres dans toutes les langues. Logos, une socit de traduction
internationale dont le sige est  Modne (Italie), met en accs libre les
outils linguistiques utiliss par ses traducteurs: 200 traducteurs sur place,
2.500 traducteurs en ligne dans le monde, environ 200 textes traits
quotidiennement. Outre le Logos Dictionary, ces outils comprennent la
Wordtheque, une base de donnes multilingue de 325 millions de mots provenant de
romans, documents techniques et textes traduits et prsents dans leur contexte,
Linguistic Resources (Ressources linguistiques), qui regroupe 536 glossaires, et
le Universal Conjugator (Conjugaison universelle), qui propose des tableaux de
conjugaison dans 17 langues diffrentes.

Dans Les mots pour le dire, un article du quotidien Le Monde en date du 7
dcembre 1997, Annie Kahn crivait:

"Le site de Logos est beaucoup plus qu'un dictionnaire ou qu'un rpertoire de
liens vers d'autres dictionnaires en ligne. L'un des piliers du systme est un
logiciel de recherche documentaire fonctionnant sur un corpus de textes
littraires disponibles gratuitement sur Internet. Lorsque l'on recherche la
dfinition ou la traduction d'un mot, 'didactique' par exemple, on trouve non
seulement le rsultat recherch, mais aussi une phrase d'une oeuvre littraire
utilisant ce mot (en l'occurence, un essai de Voltaire). Un simple clic permet
d'accder au texte intgral de l'oeuvre ou de commander le livre grce  un
partenariat avec Amazon.com, le libraire en ligne bien connu. Il en est de mme
avec les traductions trangres. Si aucun texte utilisant ce mot n'a t trouv,
le systme fonctionne alors comme un moteur de recherche et renvoie aux sites
web concernant ce mot. Pour certains termes, il est propos d'en entendre la
prononciation. Si une traduction manque, le systme fait un appel au peuple. A
chacun d'enrichir la base, les traducteurs de l'entreprise valident ensuite les
traductions proposes."

Logos a t cr par Rodrigo Vergara, un rfugi politique chilien qui a migr
en Italie quand il tait tudiant en agronomie pour chapper au rgime Pinochet.
Aujourd'hui,  45 ans, il dirige une entreprise de traduction offrant des
services dans plus de 35 langues, avec un rseau de 300 traducteurs dans le
monde et un chiffre d'affaires de 60 millions de FF.

Dans le mme article, Rodrigo Vergara expliquait:

"Nous voulions que nos traducteurs aient tous accs aux mmes outils de
traduction. Nous les avons donc mis  leur disposition sur Internet, et tant
qu' faire nous avons ouvert le site au public. Cela nous a rendus trs
populaires, nous a fait beaucoup de publicit. L'opration a drain vers nous de
nombreux clients, mais aussi nous a permis d'toffer notre rseau de traducteurs
grce aux contacts tablis  la suite de cette initiative."

Les rpertoires de dictionnaires sont des outils inapprciables pour les
linguistes. Voici par exemple Dictionnaires lectroniques, OneLook Dictionaries
et A Web of Online Dictionaries.

Prpar par la Section franaise des Services linguistiques centraux (SLC-f) de
la Chancellerie fdrale suisse, Dictionnaires lectroniques est class en cinq
secteurs: dictionnaires monolingues, dictionnaires bilingues, dictionnaires
multilingues, abrviations et acronymes, et informations gographiques.

Dans son courrier lectronique du 14 janvier 1999, Marcel Grangier, responsable
de cette section, rpondait  mes questions.

ML: "Comment voyez-vous le multilinguisme sur le Web?"

MG: "Le multilinguisme sur Internet peut tre considr comme une fatalit
heureuse et surtout irrversible. C'est dans cette optique qu'il convient de
creuser la tombe des rabat-joie dont le seul discours est de se plaindre d'une
suprmatie de l'anglais. Cette suprmatie n'est pas un mal en soi, dans la
mesure o elle rsulte de ralits essentiellement statistiques (plus de PC par
habitant, plus de locuteurs de cette langue, etc.). La riposte n'est pas de
'lutter contre l'anglais' et encore moins de s'en tenir  des jrmiades, mais
de multiplier les sites en d'autres langues. Notons qu'en qualit de service de
traduction, nous prconisons galement le multilinguisme des sites eux-mmes."

ML: "Quel a t le bnfice de l'utilisation d'Internet dans votre activit?"

MG: "Travailler sans Internet est devenu tout simplement impossible: au-del de
tous les outils et commodits utiliss (messagerie lectronique, consultation de
la presse lectronique, activits de services au profit de la profession des
traducteurs). Internet reste pour nous une source indispensable et inpuisable
d'informations dans ce que j'appellerais le 'secteur non structur' de la toile.
Pour illustrer le propos, lorsqu'aucun site comportant de l'information
organise ne fournit de rponse  un problme de traduction, les moteurs de
recherche permettent dans la plus grande partie des cas de retrouver le chanon
manquant quelque part sur le rseau."

ML: "Comment voyez-vous l'volution vers un Internet multilingue?"

MG: "La multiplication des langues prsentes sur Internet est invitable, et ne
peut que bnficier aux changes multiculturels. Pour que ces changes prennent
place dans un environnement optimal, il convient encore de dvelopper les outils
qui amlioreront la compatibilit: la gestion complte des diacritiques ne
constitue qu'un exemple de ce qui peut encore tre entrepris."

Disponible depuis avril 1996, OneLook Dictionaries (Dictionnaires tous-dans-un),
de Robert Ware, est un moteur de recherche rapide puisant dans plus de 2
millions de mots disponibles dans 425 dictionnaires traitant des domaines
suivants: affaires, informatique/Internet, mdecine, divers, religion, sciences,
sports, technologie, gnralits et argot.

Dans son courrier lectronique du 2 septembre 1998, Robert Ware expliquait:

"A titre personnel, je suis presque uniquement en contact avec des gens qui ne
pratiquent qu'une langue et qui n'ont pas beaucoup de motivation pour dvelopper
leurs aptitudes linguistiques. Etre en contact avec le monde entier change cette
approche des choses. Et la change en mieux! [...] J'ai t long  inclure des
dictionnaires non anglophones (en partie parce que je suis monolingue). Mais
vous en trouverez maintenant quelques-uns."

Le Web of Online Dictionaries (Le Web des dictionnaires en ligne), de Robert
Beard, est un index de plus de 800 dictionnaires en ligne dans 150 langues
diffrentes, auquel s'ajoutent d'autres sections: dictionnaires multilingues,
dictionnaires anglophones spcialiss, thsaurus et vocabulaires, grammaires en
ligne, et outils linguistiques pour non spcialistes.

Robert Beard a rpondu  mes questions dans son courrier lectronique du 1er
septembre 1998.

ML: "Comment voyez-vous le multilinguisme sur le Web?"

RB: "On a d'abord craint que le Web reprsente un danger pour le multilinguisme,
tant donn que le HTML [hypertext markup language] et d'autres langages de
programmation sont bass sur l'anglais et qu'on trouve tout simplement plus de
sites web en anglais que dans toute autre langue. Cependant, les sites web que
je gre montrent que le multilinguisme est trs prsent et que le Web peut en
fait permettre de prserver des langues menaces de disparition. Je propose
maintenant des liens vers des dictionnaires dans 150 langues diffrentes et des
grammaires en 65 langues diffrentes. De plus, comme ceux qui dveloppent les
navigateurs manifestent une attention nouvelle pour la diversit des langues
dans le monde, ceci favorisera la prsence de davantage encore de sites web dans
diffrentes langues."

ML: "Quel a t le bnfice de l'utilisation d'Internet dans votre vie
professionnelle?"

RB: "En tant que professeur de langues, je pense que le Web prsente une
plthore de nouvelles ressources disponibles dans la langue tudie, de nouveaux
instruments d'apprentissage (exercices interactifs Java et Shockwave) et de
test, qui sont  la disposition des tudiants quand ceux-ci en ont le temps ou
l'envie, 24 heures par jour et 7 jours par semaine. Aussi bien pour mes
collgues que pour moi, et bien sr pour notre tablissement, Internet nous
permet aussi de publier pratiquement sans limitation."

ML: "Comment voyez-vous l'volution vers un Internet multilingue?"

RB: "Internet nous offrira tout le matriel pdagogique dont nous pouvons rver,
y compris des notes de lecture, exercices, tests, valuations et exercices
interactifs plus efficaces que par le pass parce que reposant davantage sur la
notion de communication. Le Web sera une encyclopdie du monde faite par le
monde pour le monde. Il n'y aura plus d'informations ni de connaissances utiles
qui ne soient pas diponibles, si bien que l'obstacle principal  la
comprhension internationale et interpersonnelle et au dveloppement personnel
et institutionnel sera lev. Il faudrait une imagination plus dbordante que la
mienne pour prdire l'effet de ce dveloppement sur l'humanit."

Depuis 1995,  l'initiative du WorldWide Language Institute (Institut des
langues du monde entier), NetGlos (The Multilingual Glossary of Internet
Terminology) (Le glossaire multilingue de la terminologie d'Internet) est le
projet commun d'un certain nombre de traducteurs et autres professionnels. Ce
glossaire est prpar dans les langues suivantes: allemand, anglais, chinois,
croatien, espagnol, franais, grec, hbreu, hollandais/flamand, italien, maori,
norvgien et portugais.

Brian King, directeur du WorldWide Language Institute, a rpondu  mes questions
dans son courrier lectronique du 15 septembre 1998.

ML: "Comment voyez-vous le multilinguisme sur le Web?"

BL: "Bien que l'anglais soit la langue la plus importante du Web et d'Internet
en gnral, je pense que le multilinguisme fait invitablement partie des
futures orientations du cyberespace.

Voici quelques-uns des lments qui,  mon sens, permettront que le Web
multilingue devienne une ralit:

a) La popularisation de la technologie de l'information

La technologie des ordinateurs a longtemps t le seul domaine d'une lite
'technicienne',  l'aise  la fois dans des langages de programmation complexes
et en anglais, la langue universelle des sciences et techniques. A l'origine,
les ordinateurs n'ont jamais t conus pour manier des systmes d'criture ne
pouvant tre traduits en ASCII. Il n'y avait pas de place pour autre chose que
les 26 lettres de l'alphabet anglais dans un systme de codage qui,  l'origine,
ne pouvait mme pas reconnatre les accents aigus et les trmas, sans parler de
systmes non alphabtiques comme le chinois.

Mais la tradition a t bouleverse, et la technologie popularise. Des
interfaces graphiques tels que Windows et Macintosh ont acclr le processus.
La stratgie de marketing de Microsoft a consist  prsenter son systme
d'exploitation comme facile  utiliser par le client moyen. A l'heure actuelle
cette facilit d'utilisation s'est tendue au-del du PC vers le rseau
Internet, si bien que maintenant mme ceux qui ne sont pas programmeurs peuvent
insrer des applets Java dans leurs pages web sans comprendre une seule ligne de
programmation.

b) La comptition des grandes socits pour une part de 'march global'

L'extension de cette popularisation locale est l'exportation de la technologie
de l'information dans le monde entier. La popularisation est maintenant
effective  l'chelon mondial, et l'anglais n'est plus ncessairement la langue
oblige de l'utilisateur. Il n'y a plus vraiment de langue indispensable, mais
seulement les langues personnelles des utilisateurs. Une chose est certaine: il
n'est plus ncessaire de comprendre l'anglais pour utiliser un ordinateur, de
mme qu'il n'est plus ncessaire d'avoir un diplme d'informatique.

La demande des utilisateurs non anglophones et l'effort entrepris par les
socits high-tech se faisant concurrence pour obtenir les marchs mondiaux a
fait de la localisation un secteur en expansion rapide dans le dveloppement des
logiciels et du matriel. Le premier pas a t le passage de l'ASCII  l'ASCII
tendu. Ceci signifie que les ordinateurs commenaient  reconnatre les accents
et les symboles utiliss dans les variantes de l'alphabet anglais, symboles qui
appartenaient le plus souvent aux langues europennes. Cependant une page ne
pouvait tre affiche qu'en une seule langue  la fois.

c) L'innovation technologique

L'innovation la plus rcente est UNICODE. Bien qu'il soit encore en train
d'voluer et qu'il ait tout juste t incorpor dans les derniers logiciels, ce
nouveau systme de codage traduit chaque caractre en 16 octets. Alors que
l'ASCII tendu  8 octets pouvait prendre en compte un maximum de 256
caractres, UNICODE peut prendre en compte plus de 65.000 caractres uniques et
il a donc la possibilit de traiter informatiquement tous les systmes
d'criture du monde.

Les instruments sont maintenant plus ou moins en place. Ils ne sont pas encore
parfaits, mais on peut dsormais surfer sur le Web en utilisant le chinois, le
japonais, le coren, et de nombreuses autres langues qui n'utilisent pas
l'alphabet occidental. Comme Internet s'tend  des parties du monde o
l'anglais est trs peu utilis, par exemple la Chine, il est naturel que ce soit
le chinois et non l'anglais qui soit utilis. La majorit des usagers en Chine
n'a pas d'autre choix que sa langue maternelle.

Une priode intermdiaire prcde bien sr ce changement. Une grande partie de
la terminologie technique disponible sur le Web n'est pas encore traduite dans
d'autres langues. Et, comme nous nous en sommes rendus compte dans NetGlos,
notre glossaire multilingue de la terminologie d'Internet, la traduction de ces
termes n'est pas toujours facile. Avant qu'un nouveau terme ne soit accept
comme le terme correct, il y a une priode d'instabilit avec plusieurs
candidats en comptition. Souvent un terme emprunt  l'anglais est le point de
dpart et, dans de nombreux cas, il est aussi le point d'arrive. Finalement
merge un vainqueur qui est ensuite utilis aussi bien dans les dictionnaires
techniques que dans le vocabulaire quotidien de l'usager non spcialiste. La
dernire version de NetGlos est la version russe et elle devrait tre disponible
dans deux semaines environ [fin septembre 1998]. Elle sera sans nul doute un
excellent exemple du processus dynamique en cours pour la russification de la
terminologie du Web.

d) La dmocratie linguistique

Dans un rapport de l'UNESCO du dbut des annes 50, l'enseignement dispens dans
sa langue maternelle tait considr comme un droit fondamental de l'enfant. La
possibilit de naviguer sur Internet dans sa langue maternelle pourrait bien
tre son quivalent  l'Age de l'information. Si Internet doit vraiment devenir
le rseau mondial qu'on nous promet, tous les usagers devraient y avoir accs
sans problme de langue. Le considrer comme la chasse garde de ceux qui, par
accident historique, ncessit pratique ou privilge politique, connaissent
l'anglais, est injuste  l'gard de ceux qui ne connaissent pas cette langue.

e) Le commerce lectronique

Bien qu'un Web multilingue soit souhaitable sur le plan moral et thique, un tel
idal ne suffit pas pour en faire une ralit dpassant les limites actuelles.
De mme que l'utilisateur non anglophone peut maintenant avoir accs  la
technologie dans sa propre langue, l'impact du commerce lectronique peut
constituer une force majeure qui fasse du multilinguisme la voie la plus
naturelle vers le cyberespace.

Les vendeurs de produits et services dans le march virtuel mondial que devient
Internet doivent tre prpars  faire face  un monde virtuel qui soit aussi
multilingue que le monde physique. S'ils veulent russir, ils doivent s'assurer
qu'ils parlent bien la langue de leurs clients!"

ML: "Quel a t le bnfice de l'utilisation du Web dans votre activit?"

BK: "Le principal service que nous offrons est l'enseignement des langues par le
biais du Web. Notre organisme est dans la position unique d'en tre venu 
exister du fait d'Internet!"

ML: "Comment voyez-vous l'volution vers un Internet multilingue?"

BK: "Comme l'existence de notre organisme est lie  l'importance attache aux
langues, je pense que son avenir sera excitant et stimulant. Mais il est
impossible de pratiquer l'autosuffisance  l'gard de nos russites et de nos
ralisations. La technologie change  une allure frntique. L'apprentissage
durant toute la vie est une stratgie que nous devons tous adopter si nous
voulons rester en tte et tre comptitifs. C'est une tche qui est dj assez
difficile dans un environnement anglophone. Si nous ajoutons  cela la
complexit apporte par la communication dans un cyberespace multilingue et
multiculturel, la tche devient encore plus astreignante. Probablement plus
encore que par le pass, la coopration est aussi indispensable que la
concurrence.

Les germes d'une coopration par le biais d'Internet existent dj. Notre projet
NetGlos a dpendu du bon vouloir de traducteurs volontaires de nombreux pays:
Canada, Etats-Unis, Autriche, Norvge, Belgique, Isral, Portugal, Russie,
Grce, Brsil, Nouvelle-Zlande, etc. Je pense que les centaines de visiteurs
qui consultent quotidiennement les pages de NetGlos constituent un excellent
tmoignage du succs de ce type de relations de travail. Les relations de
coopration s'accrotront encore  l'avenir, mais pas ncessairement sur la base
du volontariat."


3.4. Bases de donnes textuelles


Des bases de donnes textuelles sont accessibles par abonnement payant, par
exemple FRANTEXT et l'ARTFL Project pour la langue franaise.

FRANTEXT, prsent sur le Web depuis dbut 1995, est l'oeuvre de l'Institut
national de la langue franaise (INaLF), une branche du CNRS (Centre national de
la recherche scientifique, France). La base comprend, en mode interactif, 180
millions de mots-occurrences rsultant du traitement informatique d'une
collection reprsentative de 3.500 units textuelles en arts, sciences et
techniques couvrant cinq sicles (16e-20e sicles). Dbut 1998, 82 centres de
recherche et bibliothques universitaires d'Europe, d'Australie, du Japon et du
Canada taient abonns, ce qui reprsentait 1.250 postes de travail ayant accs
 la base. Le nombre de sessions d'interrogations tait d'une cinquantaine par
jour.

Dans son courrier lectronique du 11 juin 1998, Arlette Attali indiquait les
changements apports par Internet dans sa vie professionnelle:

"Etant moi-mme plus spcialement affecte au dveloppement des bases textuelles
 l'INaLF, j'ai t amene  explorer les sites du Web qui proposaient des
textes lectroniques et  les 'tester'. Je me suis donc transforme en 'touriste
textuelle' avec les bons et mauvais cts de la chose. La tendance au zapping et
au survol tant un danger permanent, il faut bien cibler ce que l'on cherche si
l'on ne veut pas perdre son temps. La pratique du Web a totalement chang ma
faon de travailler: mes recherches ne sont plus seulement livresques et donc
d'accs limit, mais elles s'enrichissent de l'apport des textes lectroniques
accessibles sur Internet.

[A l'avenir je pense] contribuer  dvelopper des outils linguistiques associs
 la base FRANTEXT et  les faire connatre auprs des enseignants, des
chercheurs, des tudiants et aussi des lycens."

En janvier 1998, elle a men une enqute auprs des utilisateurs de FRANTEXT
pour mieux connatre ses utilisateurs. Les rsultats de cette enqute sont
disponibles en ligne.

L'ARTFL Project (ARTFL: American and French Research on the Treasury of the
French Language - Recherche franco-amricaine sur les trsors de la langue
franaise) est un projet commun du Centre national de la recherche scientifique
(CNRS, France) et de l'Universit de Chicago (Illinois, USA), qui vise 
constituer une base de donnes de 2.000 textes du 13e au 20e sicle concernant
la littrature, la philosophie, les arts ou les sciences.

L'ARTFL travaille aussi  la version en ligne exhaustive de la premire dition
(1751-1772) de l'Encyclopdie ou Dictionnaire raisonn des sciences, des mtiers
et des arts de Diderot et d'Alembert. 72.000 articles crits par plus de 140
collaborateurs (dont Voltaire, Rousseau, d'Alembert, Marmontel, d'Holbach,
Turgot, etc.) ont fait de cette encyclopdie un monumental ouvrage de rfrence
pour les arts et les sciences. Destine  rassembler puis divulguer les
connaissances de l'poque, elle porte la marque des courants intellectuels et
sociaux du 18e sicle, et c'est grce  elle qu'ont t propages les ides du
Sicle des Lumires.

Les chiffres sont loquents quant  l'ampleur du travail: l'Encyclopdie
comprend 17 volumes de texte et 11 volumes de planches, 18.000 pages de texte et
20.736.912 mots. La base de donnes correspondant au premier volume est
accessible en ligne  titre exprimental. La recherche peut tre effectue par
mot, portion de texte, auteur ou catgorie, ou par la combinaison de ces
critres entre eux. On dispose de renvois d'un article  l'autre, et des liens
permettent d'aller d'une planche au texte, ou du texte au fac-simil des pages
originales. L'automatisation complte des procdures de saisie a entran
quelques erreurs typographiques et des erreurs d'identification qui seront
corriges plus tard. La recherche d'images par mot, portion de texte ou
catgorie sera galement possible  l'avenir.

L'ARTFL travaille aussi  un projet de base de donnes pour le Dictionnaire de
l'Acadmie franaise, dont les diffrentes ditions se sont chelonnes entre
1694 et 1935. Ce projet inclut la saisie et l'dition du texte, ainsi que le
dveloppement d'un moteur de recherche spcifique. Les diffrentes ditions
pourront tre combines dans une seule base de donnes qui permettra de
consulter aussi bien une dition particulire que l'ensemble de celles-ci pour
juger de l'volution d'un terme. Pour le moment, seules deux ditions, la
premire (1694) et la cinquime (1798), sont disponibles pour une recherche par
mot. Une fonction de recherche en texte intgral est prvue par la suite.

Une rubrique prsente une liste des autres projets de l'ARTFL, notamment la
version image de l'dition de 1740 du Dictionnaire historique et critique de
Philippe Bayle, le Roget's Thesaurus de 1911, le Webster's Revised Unabridged
Dictionary de 1913, le Thresor de la langue franaise de Jean Nicot (1606), un
projet multilingue sur La Bible comprenant La Bible franaise de Louis Segond
(1910), etc.

De par la quantit d'oeuvres dactylographies  cette intention, le Project
Gutenberg est la plus ancienne et la plus grande cyberbibliothque qui existe.
Cre en 1971 par Michael Hart aux Etats-Unis, elle a pour but de mettre
gratuitement le plus grand nombre possible de textes  la disposition du plus
grand nombre possible de lecteurs,  raison d'environ 45 titres par mois. Ses
objectifs pour 2001 sont un stock de 10.000 textes littraires et une
transmission de 1.000 milliards de textes lectroniques, soit 10.000 livres
numriques vers 100 millions de lecteurs.

Le projet dbuta en 1971 quand on donna  Michael Hart un compte de 100 millions
de dollars de "temps machine" au Materials Research Lab de l'Universit
d'Illinois (USA). Immdiatement aprs avoir reu ce crdit, il dcida de le
consacrer  la recherche et au stockage des oeuvres conserves dans les
bibliothques. Il dcida aussi de stocker des textes lectroniques de la manire
la plus simple possible, en format ASCII, avec des lettres capitales pour les
termes en italique, gras ou souligns, afin que ces textes puissent tre lus
quels que soient la machine et le logiciel utiliss.

Cinquante heures environ sont ncessaires pour slectionner, dactylographier,
corriger et mettre en page un texte lectronique. La dactylographie des textes
est l'oeuvre de volontaires. Un ouvrage de taille moyenne - par exemple un roman
de Stendhal ou de Jules Verne - est compos de deux fichiers ASCII.

Le Project Gutenberg inclut trois grands secteurs: la littrature de
divertissement (Light Literature), comme Alice au pays des merveilles, Peter Pan
ou les Fables d'Esope, la littrature "srieuse" (Heavy Literature) comme La
Bible, les oeuvres de Shakespeare ou Moby Dick, et la littrature de rfrence
(Reference Literature), compose d'encyclopdies et de dictionnaires, par
exemple le Thesaurus de Roget.

Sur le site web, Michael Hart explique que la collection de littrature de
divertissement est destine  amener devant l'cran aussi bien un enfant d'ge
pr-scolaire qu'une personne du troisime ge. Des enfants ou des grand-parents
vont rechercher le texte lectronique de Peter Pan aprs avoir vu Hook au
cinma, ou bien ils lisent Alice au pays des merveilles aprs l'avoir regard 
la tlvision. Pratiquement tous les pisodes de Star Trek ont mentionn des
livres qui ont leur correspondant lectronique dans le Project Gutenberg (Moby
Dick, Peter Pan...). L'objectif est que les gens puissent retrouver des
citations qu'ils ont entendues dans des conversations, des films, des musiques,
d'autres livres, et ce  l'aide d'une bibliothque contenant tous ces lments
dans un format facile pour la recherche.

En juillet 1997, le Projet Gutenberg ftait son vingt-sixime anniversaire avec
la mise en ligne des Merry Adventures of Robin Hood de Howard Pyle. En septembre
1997, il ftait son millime texte lectronique avec la version anglaise de la
Divine comdie de Dante. Dans sa lettre d'information d'octobre 1997, Michael
Hart annonait son intention de complter la collection d'Oscar Wilde, de
"sparer" les oeuvres compltes de Shakespeare en fichiers individuels pour
chaque oeuvre, et de mettre en ligne des ouvrages non anglophones.

Outre l'anglais, on trouve quelques oeuvres en allemand, espagnol, franais,
italien et latin, mais elles ne sont pas encore lgion. En janvier 1998, si on
lanait une recherche sur les ouvrages disponibles en langue franaise, on
trouvait neuf titres, dont six romans de Stendhal (L'Abbesse de Castro, La
Chartreuse de Parme, La Duchesse de Palliano, Le Rouge et le Noir, Les Cenci,
Vittoria Accorambani), deux romans de Jules Verne (De la terre  la lune et Le
tour du monde en 80 jours) et French Cave Paintings, un ouvrage sur les
peintures prhistoriques. A part ce dernier ouvrage, disponible depuis 1995,
tous ces ouvrages n'ont t intgrs  la bibliothque que dbut 1997. Si aucun
titre de Stendhal n'tait disponible en anglais, il existait trois oeuvres de
Jules Verne dans cete langue: 20,000 Leagues Under the Sea (disponible depuis
septembre 1994), Around the World in 80 Days (disponible depuis janvier 1994) et
From the Earth to the Moon (disponible depuis septembre 1993).

Dbut septembre 1998, le nombre de titres d'ouvrages en langue franaise tait
mont  onze, avec Cyrano de Bergerac, d'Edmond Rostand, disponible depuis mars
1998, et La Rvolution franaise, de Thomas Carlyle, disponible depuis mai 1998.

La lettre d'information d'octobre 1997 annonait le dveloppement des
collections trangres du Projet Gutenberg. Dans celle de mars 1998, Michael
Hart indiquait que les volontaires du projet prparaient maintenant des textes
lectroniques en allemand, espagnol, franais et portugais. Ces prochains mois,
il esprait aussi recevoir des textes dans les langues suivantes: arabe,
catalan, chinois, coren, danois, espranto, grec, hbreu, hollandais, hongrois,
italien, japonais, latin, lituanien, polonais, roumain, russe, slovaque et
slovne.


3.5. Bases de donnes terminologiques


La consultation gratuite sur le Web de bases terminologiques est trs apprcie
des linguistes. Voici par exemple quatre bases terminologiques gres par des
organisations internationales: Eurodicautom, gr par le Service de traduction
de la Commission europenne, ILOTERM, gr par l'Organisation internationale du
Travail (OIT), TERMITE (Base de donnes terminologique des Tlcommunications de
l'UIT), gr par l'Union internationale des tlcommunications (UIT) et WHOTERM
(WHO Terminology Information System), gr par l'Organisation mondiale de la
sant (OMS).

Eurodicautom est la base de terminologie multilingue prpare par le Service de
traduction de la Commission europenne. Mise en place  l'origine pour aider les
traducteurs de la Commission, elle est consulte aujourd'hui par un nombre
croissant de fonctionnaires de l'Union europenne autres que des traducteurs,
ainsi que par des professionnels des langues dans le monde entier. Constamment
mise  jour, cette base est disponible dans douze langues: allemand, anglais,
danois, espagnol, finnois, grec, hollandais, italien, latin, portugais et
sudois, et elle couvre de nombreux sujets.

ILOTERM est une base de donnes terminologique quadrilingue (allemand, anglais,
espagnol et franais) qui est gre par l'Unit de terminologie et de rfrences
du Service des documents officiels (OFFDOC) de l'Organisation internationale du
Travail (OIT). Comme l'indique le site web,

"sa principale finalit est d'apporter des solutions, conformes  l'usage
courant,  des problmes terminologiques dans le domaine du travail et des
questions sociales. Les termes figurent en anglais avec leurs quivalents en
franais, espagnol et/ou allemand. La base de donnes contient galement (dans
une  quatre langues) des articles concernant la structure et les programmes de
l'OIT, les noms officiels d'institutions internationales, d'organismes nationaux
et d'organisations nationales d'employeurs et de travailleurs, ainsi que les
titres de runions et d'instruments internationaux."

Gr par la section de traduction de l'Union internationale des
tlcommunications (UIT), TERMITE (Base de donnes terminologique des
Tlcommunications de l'UIT) est galement quadrilingue (anglais, espagnol,
franais et russe).

"TERMITE contient tous les termes qui apparaissent dans tous les glossaires de
l'UIT imprims depuis 1980, ainsi que des termes plus rcents en rapport avec
les diffrentes activits de l'Union (en tout quelques 59.000 entres).
Normalement les collaborateurs qui s'occupent de l'amlioration et de la mise 
jour de cete base de donnes sont des traducteurs ou des diteurs techniques.
TERMITE est surtout visit par les traducteurs internes mais aussi par des
utilisateurs externes, travaillant dans le domaine des tlcommunications."

Gr par l'Organisation mondiale de la sant (OMS), le systme d'information
terminologique WHOTERM (WHO Terminology Information System) est trilingue
(anglais, espagnol et franais). Il est constitu  partir des expressions et
concepts des documents de l'OMS afin d'"amliorer la rigueur et la cohrence des
textes rdigs, prpars ou traduits. Il permet galement  tous ceux qui
collaborent  des programmes techniques de l'OMS d'enrichir les terminologies
nouvelles, de promouvoir leur normalisation et de garantir leur diffusion."


4. TRADUCTION


[Dans ce chapitre:]

[4.1. Services de traduction / 4.2. Traduction automatique / 4.3. Traduction
assiste par ordinateur]


4.1. Services de traduction


Cr par Vorontsoff, Wesseling & Partners (Amsterdam, Pays-Bas), Aquarius est un
rpertoire de traducteurs et interprtes incluant 6.100 traducteurs, 800
socits de traduction, 91 domaines d'expertise et 369 combinaisons de langues.
Ce site non commercial permet de localiser et de contacter les meilleurs
traducteurs directement, sans intermdiaire ni agence. La recherche est possible
par lieu, combinaison de langues et spcialit.

Fond by Bill Dunlap, Euro-Marketing Associates propose Global Reach, une
mthode permettant aux socits d'tendre leur prsence sur Internet dans un
contexte international, ce qui comprend la traduction de leur site web dans
d'autres langues, le promotion de ce site et l'utilisation de bandeaux
publicitaires nationaux pour augmenter la consultation locale. Bill Dunlap
prcise:

"Promouvoir votre site est aussi important que de le crer, sinon plus. Vous
devez tre prpar  utiliser au moins autant de temps et d'argent  promouvoir
votre site que vous en avez pass  l'origine  le crer. Le programme Global
Reach vous permettra de promouvoir votre site dans des pays non anglophones,
afin d'atteindre une clientle plus large... et davantage de ventes. Il existe
de nombreuses bonnes raisons pour considrer srieusement le march
international. Global Reach est pour vous le moyen d'tendre votre site web  de
nombreux pays, de le prsenter  des visiteurs en ligne dans leur propre langue,
et d'atteindre les marchs en ligne de ces pays."

Dans son courrier lectronique du 11 dcembre 1998, il expliquait aussi comment
il en tait venu  intgrer Internet dans sa vie professionnelle:

"Depuis 1981, dbut de ma vie professionnelle, j'ai t impliqu dans la venue
de socits amricaines en Europe. Ceci est pour beaucoup un problme de langue,
puisque leurs informations commerciales doivent tre disponibles dans les
langues europennes pour tre prises en compte ici, en Europe. Comme le Web est
devenu populaire en 1995, j'ai donn  ces activits une dimension 'en ligne',
et j'en suis venu  promouvoir le cybercommerce europen auprs de mes
compatriotes amricains. Rcemment, lors de l'Internet World  New York, j'ai
parl du cybercommerce europen et de la manire d'utiliser un site web pour
toucher les diffrents marchs d'Europe."


4.2. Traduction automatique


La traduction automatique (TA) analyse le texte dans la langue-source et gnre
automatiquement le texte correspondant dans la langue-cible. L'tre humain
n'intervient pas au cours du processus, contrairement  la traduction assiste
par ordinateur, qui exige une certaine interaction entre l'homme et la machine.

SYSTRAN, socit spcialise dans les logiciels de traduction, explique sur son
site web:

"Un logiciel de traduction automatique traduit une langue naturelle dans une
autre langue naturelle. La traduction automatique prend en compte la structure
grammaticale de chaque langue et elle utilise des rgles pour transfrer la
structure grammaticale de la langue-source (texte  traduire) vers la
langue-cible (texte traduit). La traduction automatique ne remplace pas et n'est
pas destine  remplacer le traducteur humain."

La European Association for Machine Translation (EAMT) (Association europenne
pour la traduction automatique) donne la dfinition suivante:

"La traduction automatique (TA) est l'utilisation de l'ordinateur pour la
traduction de textes d'une langue naturelle  une autre. Elle fut un des
premiers domaines de recherche en informatique. Il s'est avr que cet objectif
tait difficile  atteindre. Cependant il existe aujourd'hui un certain nombre
de systmes produisant un rsultat qui, s'il n'est pas parfait, est de qualit
suffisante pour tre utile dans certaines applications spcifiques, en gnral
dans le domaine de la documentation technique. De plus, les logiciels de
traduction, qui sont essentiellement destins  aider le traducteur humain 
produire des traductions, jouissent d'une popularit croissante auprs
d'organisations de traduction professionnelles."

Voici l'historique donn sur le site de Globalink, socit spcialise dans les
logiciels et services de traduction :

"Ds leurs dbuts, la traduction automatique et le traitement de la langue
naturelle ont progress de pair avec l'volution de l'informatique quantitative.
Le dveloppement des premiers ordinateurs programmables pendant la Seconde
guerre mondiale a t men et acclr par les premiers efforts cryptographiques
pour tenter de fissurer les codes secrets allemands et autres codes de guerre.
Suite  la guerre, la traduction et l'analyse du texte en langue naturelle
procura une base de travail au secteur mergent de la thorie de l'information.

Pendant les annes 50, la recherche sur la traduction automatique prit forme
dans le sens de traduction littrale, ou traduction mot  mot, sans utiliser de
rgles linguistiques.

Le projet russe dbut  l'Universit de Georgetown au dbut des annes 50
reprsentait la premire tentative systmatique pour crer un systme de
traduction automatique utilisable.Tout au long des annes 50 et au dbut des
annes 60, un certain nombre de recherches universitaires et recherches
finances par les gouvernements furent menes aux Etats-Unis et en Europe. Au
mme moment, les progrs rapides dans le domaine de la linguistique thorique
culminaient en 1965 avec la publication de Aspects of the Theory and Syntax
(Aspects de la thorie et de la syntaxe) de Noam Chomsky, et transformaient
radicalement la structure permettant de discuter et comprendre la phonologie, la
morphologie, la syntaxe et la smantique du langage humain.

En 1966, le rapport ALPAC du gouvernement des Etats-Unis faisait une estimation
prmaturment ngative de la valeur et des perspectives des systmes
d'application pratique de la traduction automatique, mettant ainsi fin au
financement et  l'exprimentation dans ce domaine pour la dcennie suivante. Ce
fut seulement  la fin des annes 70, avec le dveloppement de la technologie de
l'informatique et des langues, que des tentatives srieuses furent  nouveau
entreprises. Cette priode d'intrt renouvel vit aussi le dveloppement du
modle de transfert de la traduction automatique et l'mergence des premiers
systmes commerciaux de traduction automatique.

Des entreprises commerciales comme SYSTRAN et METAL commenaient  prouver que
la traduction automatique tait viable et utile. Paralllement  la mise sur le
march de produits et services de traduction automatique, ces systmes lis  un
processeur central mettaient aussi en lumire de nombreux problmes. Des cots
levs de dveloppement, une lexicographie manant d'un travail intensif et son
implmentation linguistique, le lent dveloppement de nouvelles combinaisons de
langues, l'inaccessibilit pour l'utilisateur moyen et l'incapacit d'accder
aisment  de nouveaux stades de dveloppement sont les caractristiques de ces
systmes de la seconde gnration."

Un certain nombre de socits sont spcialises dans le dveloppement de la
traduction automatique, par exemple Lernout & Hauspie, Globalink, Logos ou
SYSTRAN.

Bas  Ypres (Belgique) et Burlington (Massachussets, USA), Lernout & Hauspie
(L&H), leader international dans ce domaine, dveloppe une technologie avance
du langage dans diverses applications et produits commerciaux. La socit offre
quatre technologies de base: la reconnaissance automatique de la langue, la
compression numrique de la parole, le passage du texte  la parole et le
passage du texte au texte. Les produits manant des trois premires technologies
sont vendus aux grandes socits des industries suivantes: tlcommunications,
informatique, multimdias, lectronique grand public et lectronique
automotrice. Les services de traduction (passage du texte au texte) sont 
destination des socits de technologie de l'information, des marchs verticaux
et des marchs d'automatisation.

Le Machine Translation Group (Groupe de traduction automatique) de Lernout &
Hauspie comprend des entreprises qui dveloppent, produisent et vendent des
systmes de traduction automatique hautement sophistiqus: L&H Language
Technology, AppTek, AILogic, NeocorTech et Globalink. Chaque entreprise est un
leader international dans sa propre partie.

Fond en 1990, Globalink est une socit amricaine spcialise dans les
logiciels et services de traduction. Elle offre des solutions sur mesure 
partir d'une gamme de logiciels, options en ligne et services de traduction
professionnelle. La socit diffuse ses logiciels de traduction en allemand,
anglais, espagnol, franais, italien et portugais, et propose des solutions aux
problmes de traduction  tous niveaux: particuliers, petites socits,
multinationales et gouvernements, que ce soit pour un produit individuel donnant
une traduction prliminaire rapide ou un systme complet permettant de grer des
traductions de documents professionnels.

Le site web donne les informations suivantes:

"Avec les logiciels d'application de Globalink, l'ordinateur utilise trois
ensembles de donnes : le texte  traiter, le programme de traduction et un
dictionnaire de mots et d'expressions dans la langue-source, ainsi que des
informations sur les concepts voqus par le dictionnaire et les rgles
applicables  la phrase: rgles de syntaxe et de grammaire, y compris des
algorithmes gouvernant la conjugaison des verbes, l'adaptation de la syntaxe,
les accords de genre et de nombre et la mise en ordre des mots.

Une fois que l'utilisateur a slectionn le texte et lanc le processus de
traduction, le programme commence  comparer les mots du texte  traiter avec
ceux qui sont stocks dans le dictionnaire. Une fois l'adquation trouve,
l'application prpare une notice complte qui inclut des informations sur les
significations possibles du mot et, d'aprs le contexte, ses relations avec les
autres mots dans la mme phrase. Le temps requis pour la traduction dpend de la
longueur du texte. Un document de trois pages et 750 mots demande un traitement
de trois minutes environ pour une premire traduction."

Randy Hobler est directeur de marketing pour les produits et services Internet
de Globalink. Dans son courrier lectronique du 3 septembre 1998, il crivait:

"En 1998, 85 % du contenu du Web est en anglais, et ce chiffre est  la baisse.
Il y a non seulement plus de sites web et d'internautes non anglophones, mais
aussi une localisation plus grande de sites de socits et d'organismes, et un
usage accru de la traduction automatique pour traduire des sites web  partir ou
vers d'autres langues.

Comme Internet n'a pas de frontires nationales, les internautes s'organisent
selon d'autres critres propres au mdium. En termes de multilinguisme, vous
avez des communauts virtuelles, par exemple ce que j'appelle les 'nations des
langues', tous ces internautes o qu'ils soient qu'on peut regrouper selon leur
langue maternelle. Ainsi la nation de la langue espagnole inclut non seulement
les internautes d'Espagne et d'Amrique latine, mais aussi tous les
hispanophones vivant aux Etats-Unis, ou encore ceux qui parlent espagnol au
Maroc.

Concernant la transparence de la langue, nous arrivons rapidement au point o
une traduction trs fidle du texte et de la parole sera si commune qu'elle
pourra faire partie des plate-formes ou mme des puces. A ce point, quand le
dveloppement d'Internet aura atteint sa vitesse de croisire, que la fidlit
de la traduction atteindra plus de 98% et que les diffrentes combinaisons de
langues possibles auront couvert la grande majorit du march, la transparence
de la langue (toute communication d'une langue  une autre) sera une vision trop
restrictive pour ceux qui vendent cette technologie. Le dveloppement suivant
sera la 'transparence transculturelle et transnationale' dans laquelle les
autres aspects de la communication humaine, du commerce et des transactions
au-del du seul langage entreront en scne. Par exemple, les gestes ont un sens,
les mouvements faciaux ont un sens, et ceci varie en fonction des socits. La
lettre O ralise avec le pouce et l'index signifie 'OK' aux Etats-Unis alors
qu'en Argentine c'est un geste obscne.

Quand se produira l'invitable dveloppement de la vidoconfrence multilingue
multimdias, il sera ncessaire de corriger visuellement les gestes. Le Media
Lab du MIT [MIT: Massachussets Institute of Technology], Microsoft et bien
d'autres travaillent  la reconnaissance informatique des expressions faciales,
l'identification des caractristiques biomtriques par le biais du visage, etc.
Il ne servira  rien  un homme d'affaires amricain de faire une excellente
prsentation  un Argentin lors d'une vidoconfrence multilingue sur le Web,
avec son discours traduit dans un espagnol argentin parfait, s'il fait en mme
temps le geste O avec le pouce et l'index. Les ordinateurs pourront intercepter
ces types de messages et les corriger visuellement.

Les cultures diffrent de milliers de faons, et la plupart d'entre elles
peuvent tre modifies par voie informatique lorsqu'on passe de l'une  l'autre.
Ceci inclut les lois, les coutumes, les habitudes de travail, l'thique, le
change montaire, les diffrences de taille dans les vtements, les diffrences
entre le systme mtrique et le systme de mesures anglophone, etc., etc. Les
socits dynamiques rpertorieront et programmeront ces diffrences, et elles
vendront des produits et services afin d'aider les habitants de la plante 
mieux communiquer entre eux. Une fois que ceux-ci seront largement rpandus, ils
contribueront rellement  une meilleure comprhension  l'chelle
internationale."

Base aux Etats-Unis, au Canada et en Europe, Logos est une socit
internationale spcialise dans la traduction automatique depuis 25 ans. Elle
procure diffrents outils de traduction, des systmes de traduction automatique
et des services de soutien.

SYSTRAN (acronyme de System Translation) est galement une socit spcialise
dans les logiciels de traduction automatique. Son sige est situ 
Soisy-sous-Montmorency (France). C'est sa succursale, situe  La Jolla
(Californie), qui assure les ventes, le marketing et le dveloppement des
logiciels. Une des ralisations de la socit est AltaVista Translation, un
service de traduction automatique de pages web de l'anglais vers les langues
suivantes : allemand, franais, espagnol, italien et portugais, et vice versa.
Ce service a t mis en place en dcembre 1997  la demande d'AltaVista, moteur
de recherche utilis par douze millions d'internautes, suite au problme des
langues devenu sensible sur Internet.

Base  Montral (Qubec), Alis Technologies dveloppe et commercialise des
solutions et services de traitement linguistique au moyen de logiciels,
priphriques et solutions de traduction qui transforment des systmes
informatiques unilingues en outils multilingues.

Une autre ralisation intressante est SPANAM/ENGSPAN, un systme de traduction
automatique dvelopp par les linguistes computationnels, les traducteurs et le
programmeur systmes de l'Organisation panamricaine de la sant (PAHO) (Bureau
rgional de l'Organisation mondiale de la sant pour les Amriques, situ 
Washington, D.C., USA). Depuis 1980, le service de traduction utilise SPANAM (de
l'espagnol vers l'anglais) et ENGSPAN (de l'anglais vers l'espagnol), ce qui lui
a permis de traiter plus de 25 millions de mots dans les deux langues de travail
de la PAHO. Le personnel et les traducteurs extrieurs post-ditent ensuite
l'information brute avec un gain de productivit de 30  50%. Le systme est
install sur le rseau local du sige de l'organisation et dans un certain
nombre de bureaux rgionaux pour pouvoir tre utilis par le personnel des
services techniques et administratifs. Il est galement diffus auprs
d'organismes publics et d'organismes  but non lucratif aux Etats-Unis, en
Amrique latine et en Espagne.

Des associations contribuent au dveloppement de la traduction automatique.

L'Association for Computational Linguistics (ACL) (Association pour la
linguistique computationnelle) est le principal organisme international  la
fois scientifique et professionnel rassemblant ceux qui travaillent sur les
problmes de la langue naturelle et de la computation. Publie par la MIT Press,
la revue trimestrielle de l'ACL, Computational Linguistics (ISSN 0891-2017) est
un forum de premier plan dans le domaine de la linguistique computationnelle et
du traitement de la langue naturelle. Cette revue est complte par la lettre
d'information The Finite String. La branche europenne de l'ACL est l'European
Chapter of the Association of Computational Linguistics (EACL).

L'International Association for Machine Translation (IAMT) (Association
internationale pour la traduction automatique) regroupe trois associations
couvrant les Amriques, l'Europe et l'Asie/Pacifique: l'Association for Machine
Translation in the Americas (AMTA), la European Association for Machine
Translation (EAMT) et l'Asia-Pacific Association for Machine Translation (AAMT).

L'Association for Machine Translation in the Americas (AMTA) (Association pour
la traduction automatique dans les Amriques) est  la disposition de tous ceux
s'intressent  la traduction automatique en Amrique latine, au Canada et aux
Etats-Unis. Ses membres comprennent des demandeurs de traductions, des
dveloppeurs de systmes commerciaux, des chercheurs, des sponsors et des
personnes impliques dans la science de la traduction automatique et sa
diffusion.

Base  Genve (Suisse), l'European Association for Machine Translation (EAMT)
(Association europenne pour la traduction automatique) est galement une
organisation  la disposition de ceux qui s'intressent  la traduction
automatique et aux outils de traduction, y compris les utilisateurs de ces
techniques, les dveloppeurs et les chercheurs.

Cre en 1991, la Japan Association for Machine Translation, devenue ensuite
l'Asia-Pacific Association for Machine Translation (AAMT) (Association de l'Asie
et du Pacifique pour la traduction automatique), comprend des chercheurs, des
fabricants et des utilisateurs de systmes de traduction automatique.
L'association participe au dveloppement des technologies de traduction
automatique, ainsi qu' leur amlioration, leur enseignement et leur diffusion.

Dans Web embraces language translation (La traduction des langues sur le Web),
un article de ZDNN (ZD Network News) paru le 21 juillet 1998, Martha L. Stone
expliquait:

"Parmi les nouveaux produits d'un secteur de traduction reprsentant 10
milliards de dollars [60 milliards de FF], on trouve les traducteurs instantans
de sites web, de groupes de discussion, de courrier lectronique et d'intranets
d'entreprise.

Les principales socits de traduction se mobilisent pour saisir les
opportunits du march. Voici quelques exemples.

SYSTRAN s'est associ avec AltaVista pour produire
babelfish.altavista.digital.com, avec 500  600 mille visiteurs quotidiens et
environ un million de traductions par jour, traductions qui vont des recettes 
des pages web compltes.

15.000 sites environ ont un lien vers babelfish, qui peut traduire [de
l'anglais] vers le franais, l'italien, l'allemand, l'espagnol et le portugais,
et vice versa. Le japonais est prvu pour bientt.

"Cette popularit est simple. Avec Internet, on peut maintenant utiliser
l'information provenant des Etats-Unis. Tout ceci contribue  une demande en
hausse", dclare de chez lui  Paris Dimitros Sabatakakis, directeur gnral de
SYSTRAN.

Alis a mis au point le systme de traduction du Los Angeles Times qui doit
bientt tre lanc sur le site et qui proposera des traductions [de l'anglais]
vers l'espagnol et le franais, et plus tard le japonais. D'un clic de souris,
une page web complte peut tre traduite dans la langue dsire.

Globalink propose des logiciels, des systmes de traduction de pages web, un
service de messagerie lectronique gratuit et des logiciels permettant de
traduire le texte des groupes de discussion.

Cependant, alors que ces systmes de traduction automatique deviennent
populaires dans le monde entier, les directeurs des socits qui les dveloppent
admettent qu'ils ne peuvent rpondre  toutes les situations.

Les porte-parole de Globalink, Alis et SYSTRAN utilisent des expressions comme
"pas parfait" et "approximatif" quand ils dcrivent la qualit des traductions,
et prcisent bien que les phrases soumises  la traduction doivent tre simples,
grammaticalement correctes et sans tournures idiomatiques.

"Les progrs raliss en traduction automatique rpondent  la loi de Moore: la
qualit double tous les dix-huit mois, dclare Vin Crosbie, un analyste de
l'industrie du Web bas  Greenwich, dans le Connecticut [USA]. "Ce n'est pas
parfait, mais certains de mes correspondants ne se rendent mme pas compte que
j'utilise un logiciel de traduction."

Ces traductions font souffrir la syntaxe et l'utilisation des mots  bon
escient, parce que les bases de donnes-dictionnaires ne peuvent dchiffrer la
diffrence entre les homonymes [...].

"La traduction humaine coterait entre 50 et 60 dollars [300  360 FF] par page
web, ou environ 20 cents [1,15 FF] par mot", explique Sabatakis, directeur de
SYSTRAN.

Alors que cette dernire solution peut convenir pour les pages 'statiques'
d'information sur l'entreprise, la traduction automatique, elle, est gratuite
sur le Web, et le logiciel cote souvent moins de 100 dollars [600 FF], selon le
nombre de langues disponibles pour traduction et les caractristiques propres au
logiciel."


4.3. Traduction assiste par ordinateur


Contrairemant  la traduction automatique (TA) qui, sans intervention humaine,
analyse le texte dans la langue-source et gnre automatiquement le texte
correspondant dans la langue-cible, la traduction assiste par ordinateur (TAO)
exige une certaine interaction entre l'homme et la machine.

Le Bureau des services linguistiques de l'Organisation mondiale de la sant
(OMS) (Genve, Suisse) travaille dans les six langues officielles de
l'organisation: anglais, arabe, chinois, espagnol, franais et russe.

Des expriences de traduction automatique ont t tentes  plusieurs reprises,
mais les traductions obtenues demandaient un travail de rvision trop important,
si bien que, au stade actuel de son dveloppement et compte tenu du type de
documents  traduire, cette technologie n'a pas t juge suffisamment rentable.

L'Unit de Traduction assiste par ordinateur et de Terminologie (CTT) explore
donc les possibilits techniques qu'offrent les systmes les plus rcents de
traduction assiste par ordinateur, reposant sur la notion de "mmoire de
traduction". Comme il est expliqu sur le site web,

"ces systmes permettent au traducteur d'avoir immdiatement accs au patrimoine
du 'dj traduit' dans lequel il peut puiser, quitte  rejeter ou modifier les
solutions retenues par ses prdcesseurs, son choix dfinitif venant ensuite
enrichir la mmoire. Ainsi, en archivant la production quotidienne, le
traducteur aurait vite  sa disposition une 'mmoire' colossale de solutions
toutes faites  un nombre important de problmes de traduction."

Le CTT a entrepris l'valuation de plusieurs applications dans les domaines
suivants: archivage lectronique et recherche en texte intgral, alignement de
textes bilingues et multilingues, traduction assiste par ordinateur, gestion de
mmoires de traduction et de bases de donnes terminologiques, et reconnaissance
vocale.

Contrairement aux prvisions optimistes d'il y a cinquante ans annonant
l'apparition imminente de la machine  traduire universelle, les systmes de
traduction automatique ne produisent toujours pas de traductions de bonne
qualit. Pourquoi? Pierre Isabelle et Patrick Andries, du Laboratoire de
recherche applique en linguistique informatique (RALI) (Montral, Qubec)
expliquent ce chec dans La traduction automatique, 50 ans aprs, un article
publi dans les Dossiers du cyberquotidien Multimdium:

"L'objectif ultime de construire une machine capable de rivaliser avec le
traducteur humain n'a cess de fuir par devant les lentes avances de la
recherche. Les approches traditionnelles  base de rgles ont conduit  des
systmes qui tendent  s'effondrer sous leur propre poids bien avant de s'lever
au-dessus des nuages de l'ambigut smantique. Les aproches rcentes  base de
gros ensembles de textes, appels corpus - qu'elles soient fondes sur les
mthodes statistiques ou les mthodes analogiques - promettent bien de rduire
la quantit de travail manuel requise pour construire un systme de TA
[traduction automatique], mais il est moins sr qu'elles promettent des
amliorations substantielles de la qualit des traductions machine."

Reprenant les ides de Yehochua Bar-Hillel exprimes dans The State of Machine
Translation (L'tat de la traduction automatique), article publi en 1951,
Pierre Isabelle et Patrick Andries dfinissent trois stratgies d'application de
la traduction automatique:

a) une aide pour "balayer" la production crite et fournir des traductions
approximatives,

b) des situations de "sous-langues naturelles simples", comme l'implantation
russie en 1977 du systme METEO qui traduit les prvisions mtorologiques du
ministre de l'Environnement canadien,

c) pour de trs bonnes traductions de textes complexes, le couplage de l'humain
et de la machine avant, pendant et aprs le processus de traduction automatique,
couplage qui n'est pas forcment conomique compar  la traduction
traditionnelle.

Les auteurs penchent plus pour "un poste de travail pour le traducteur humain"
que pour un "traducteur robot":

"Les recherches rcentes sur les mthodes probabilistes ont en effet permis de
dmontrer qu'il tait possible de modliser d'une manire extrmement efficace
certains aspects simples du rapport traductionnel entre deux textes. Par
exemple, on a mis au point des mthodes qui permettent de calculer le bon
"appariement" entre les phrases d'un texte et de sa traduction, c'est--dire
d'identifier  quelle(s) phrase(s) du texte d'origine correspond chaque phrase
de la traduction. Appliques  grande chelle, ces techniques permettent de
constituer,  partir des archives d'un service de traduction, un mmoire de
traduction qui permettra souvent de recycler des fragments de traduction
antrieures. Des systmes de ce genre ont dj commenc  apparatre sur le
march (Translation Manager II de IBM, Translator's Workbench de Trados,
TransSearch du RALI, etc.).

Les recherches les plus rcentes se concentrent sur des modles capables
d'tablir automatiquement les correspondances  un niveau plus fin que celui de
la phrase: syntagmes et mots. Les rsultats obtenus laissent entrevoir toute une
famille de nouveaux outils pour le traducteur humain, dont les aides au
dpouillement terminologique, les aides  la dicte et  la frappe des
traductions ainsi que les dtecteurs de fautes de traduction."


5. RECHERCHE


[Dans ce chapitre:]

[5.1. Traduction automatique et recherche / 5.2. Linguistique computationnelle /
5.3. Ingnierie du langage / 5.4. Internationalisation et localisation]


5.1. Traduction automatique et recherche


Au sein du Laboratoire CLIPS (Communication langagire et interaction
personne-systme) de la Fdration IMAG (France), le Groupe d'tude pour la
traduction automatique (GETA) est une quipe pluridisciplinaire forme
d'informaticiens et de linguistes. Les thmes de recherche du GETA concernent
tous les aspects thoriques, mthodologiques et pratiques de la traduction
assiste par ordinateur (TAO), et plus gnralement de l'informatique
multilingue. Le GETA est issu du CETA (1961- 1971), laboratoire pionnier de la
traduction automatique en France.

Actuellement, le GETA reste actif en TAO du rviseur, mais roriente sa
recherche, depuis 1988, vers la TAO individuelle, qui comporte deux volets, la
TAO du traducteur et celle du rdacteur. Les dfinitions de ces deux TAO sont
donnes sur le site:

"La TAO du traducteur consiste  offrir des outils de bureautique linguistique 
des traducteurs (professionnels ou occasionnels). C'est l'homme qui traduit.
Dans ce domaine, nous travaillons en coopration avec d'autres groupes de
recherche, qui apportent des donnes ou outils linguistiques (lexiques,
lemmatiseurs), et nous nous intressons aux problmes informatiques lis 
l'intgration de ces lments sous une forme utilisable par des traducteurs
occasionnels, dsireux de les employer depuis leurs applications favorites. Nous
avons rcemment labor et propos en collaboration avc SITE-Eurolang, le projet
Montaigne, qui vise  mettre  disposition de la communaut scientifique le
logiciel Eurolang-Optimizer, via Internet, et  l'utiliser pour constituer des
grosses bases terminologiques pouvant ensuite aussi alimenter des systmes
automatiques.

La TAO du rdacteur est l'objectif principal des travaux en cours, regroups
dans le projet LIDIA. L'ide de base est d'offrir  un rdacteur unilingue la
possibilit de rdiger dans sa langue, et, au prix d'un dialogue de
standardisation et de dsambigusation (qu'il conviendra de rendre le moins
lourd et le plus convivial possible), d'tre traduit dans plusieurs langues,
sans rvision ou avec une rvision minimale. Il s'agit donc de TAO fonde sur le
dialogue (DBMT, pour dialogue-based machine translation) et de prdition
indirecte, mais c'est bien la machine qui traduit. Une premire maquette,
LIDIA-1, partant du franais et allant vers l'allemand, le russe et l'anglais, a
t spcifie et ralise au cours des trois dernires annes.

Le GETA participe aussi au projet de l'Universal Networking Language (UNL) sous
l'gide de l'Universit des Nations Unies (UNU). Voici la prsentation du projet
prpare en septembre 1998 par Christian Boitet, directeur du GETA:

"Il s'agit non de TAO habituelle, mais de communication et recherche
d'information multilingue. 14 groupes ont commenc le travail sur 12 langues
(plus 2 annexes) depuis dbut 97. L'ide est:

- dvelopper un standard, dit UNL, qui serait le HTML du contenu linguistique.

- pour chaque langue, dvelopper un gnrateur (dit 'dconvertisseur')
accessible sur un ou plusieurs serveurs, et un 'enconvertisseur'.

L'UNU (Universit des Nations Unies, Tokyo) finance 50% du cot. D'aprs notre
valuation sur la premire anne, c'est plutt 30  35%, car le travail
(linguistique et informatique) est norme, et le projet passionnant: les
permanents des laboratoires s'y investissent plus que prvu. [...]

La dconversion tourne pour le japonais, le chinois, l'anglais, le portugais,
l'indonsien, et commence  tourner pour le franais, l'allemand, le russe,
l'italien, l'espagnol, l'hindi, l'arabe, et le mongol.

Chaque langue a une base lexicale de 30.000  120.000 liens UW [universal
word]--lexme.

L'enconversion n'est pas (si on veut de la qualit pour du tout venant) une
analyse classique. C'est une mthode de fabrication de graphes UNL qui suppose
une bonne part d'interaction, avec plusieurs possibilits :

- analyse classique multiple suivie d'une dsambigusation interactive en langue
source,

- entre sous langage contrl,

- encore plus sduisant (et encore pas clair, au niveau recherche pour
l'instant), entre directe via une interface graphique relie  la base lexicale
et  la base de connaissances.

Applications possibles :

- courriel multilingue

- informations multilingues

- dictionnaires actifs pour la lecture de langues trangres sur le Web

- et bien sr TA [traduction automatique] de mauvaise qualit (ce qu'on trouve
actuellement, mais pour tous les couples  cause de l'architecture  pivot) pour
le surf web et la veille.

On travaille actuellement sur les informations sportives sur le Web, surtout sur
le foot. On construit une base de documents, o chaque fichier est structur (
la HTML) et contient, pour chaque nonc, l'nonc original, sa structure UNL,
et autant de traductions qu'on en a obtenu. Un tel document peut tre recherch
dans une base en traduisant la question en UNL, puis affich (le UNL viewer
existe depuis un an) dans autant de fentres d'un brauser Web que de langues
slectionnes.

Perspectives:

Le projet a un problme de volume: grande surface, pas assez d'paisseur. Il
faudrait 3  5 fois plus de monde partout pour que a avance assez vite (pour
que Microsoft et d'autres ne finissent pas par tout reprendre et revendre, alors
qu'on vise une utilisation ouverte, du type de ce qu'on fait avec les serveurs
et clients Web). Les subventions des socits japonaises  l'UNU pour ce projet
(et d'autres) se tarissent  cause de la crise japonaise. Le groupe central est
beaucoup trop petit (4 personnes qui font le logiciel, le japonais, l'anglais,
l'administration, c'est peu mme avec de la sous-traitance).

De plus, le plan gnral est d'ouvrir aux autres langues de l'ONU en 2000. Il
faudrait arriver  un tat satisfaisant pour les 13 autres avant.

Du point de vue politique et culturel, ce projet est trs important, en ce qu'il
montre pour la premire fois une voie possible pour construire divers outils
soutenant l'usage de toutes les langues sur Internet, qu'elles soient
majoritaires ou minoritaires. En particulier, ce devrait tre un projet majeur
pour la francophonie.

Dans l'tat actuel des choses, je pense que l'lan initial a t donn, mais que
la premire phase (d'ici 2000) risque de retomber comme un souffl si on ne
consolide pas trs vite le projet, dans chaque pays participant.

Et donc:

L'UNU cherche comment monter un soutien puissant  la mesure de cette ambition.
Je pense que, pour la francophonie par exemple, il faudrait un groupe d'une
dizaine de personnes ne se consacrant qu' ce projet pendant au moins 10 ans,
plus des stagiaires et des collaborateurs sur le rseau, bnvoles ou intresss
par la mise  disposition gratuite de ressources et d'outils."

Voici quelques groupes de recherche anglophones.

Cr  la fin des annes 80, le CL/MT Research Group (Computational Linguistics
(CL) and Machine Translation (MT) Group - Groupe de linguistique
computationnelle et de traduction automatique) est un groupe de recherche du
Dpartement des langues et de linguistique de l'Universit d'Essex
(Royaume-Uni).

Fond en 1986, le Center for Machine Translation (CMT) (Centre pour la
traduction automatique) est un centre de recherche inclus dans le nouvel
Institut des technologies des langues de l'Universit Carnegie Mellon
(Pittsburgh, Pennsylvanie, USA). Il est spcialis dans les technologies de
traitement de la langue naturelle, particulirement la traduction automatique
multilingue de haute qualit.

Le Computing Research Laboratory (CRL) (Laboratoire de recherche informatique) 
la New Mexico State University (NMSU) (Universit d'Etat du Nouveau Mexique -
Etats-Unis) est un centre de recherche  but non lucratif qui se consacre  la
recherche de base et au dveloppement de logiciels dans les applications
informatiques avances du traitement de la langue naturelle, de l'intelligence
artificielle et de la conception d'interfaces graphiques pour les utilisateurs.
Les applications dveloppes  partir de cette recherche de base incluent un
ensemble de configurations de traduction automatique, extraction d'information,
acquisition du savoir, enseignement intelligent, et systmes de traduction pour
poste de travail.

Gr par le Dpartement de linguistique du Groupe de recherche sur la traduction
de l'Universit Brigham Young (Utah, USA), TTT.org (Translation, Theory and
Technology) (Traduction, thorie et technologie) procure des informations sur la
thorie et la technologie de la langue, particulirement dans le domaine de la
traduction. La technologie de la traduction inclut les outils de traduction pour
poste de travail et la traduction automatique.

TTT.org s'intresse aussi aux normes d'changes de donnes permettant  divers
outils de fonctionner en lien les uns avec les autres, ce qui permet
l'intgration d'outils de la part de vendeurs multiples dans la chane
multilingue de production de documents. Dans ce domaine, TTT.org est impliqu
dans le dveloppement de MARTIF (machine-readable terminology interchange format
- format d'change de terminologie lisible par la machine), un format permettant
de faciliter l'interaction de donnes terminologiques entre les systmes de
gestion de terminologie. Ce format est le rsultat de plusieurs annes de
collaboration internationale intense entre les terminologues et les experts en
bases de donnes de plusieurs organisations, incluant les organismes
universitaires, la Text Encoding Initiative (TEI) (Initiative pour le codage du
texte) et la Localisation Industry Standards Association (LISA) (Association
pour les normes de l'industrie de la localisation).

Le Natural Language Group (NLG) (Groupe de langue naturelle) de l'USC/ISI
(University of Southern California/Information Sciences Institute - Universit
de la Californie du Sud/Institut des sciences de l'information) traite de
plusieurs aspects du traitement de la langue naturelle: traduction automatique,
rsum automatique de texte, accs multilingue aux verbes et gestion du texte,
dveloppement de taxonomies de concepts (ontologies), discours et gnration de
texte, laboration de grands lexiques pour plusieurs langues, et communication
multimdias.

Eduard Hovy, directeur du Natural Language Group, expliquait dans son courrier
lectronique du 27 aot 1998:

"Le plan de votre tude me parat trs intressant. Je me demande cependant o
vous prsentez les applications et fonctionnalits n'ayant pas trait  la
traduction, comme la recherche documentaire et le rsum automatique de texte.
On ne peut rien trouver sur le Web sans recherche documentaire, et tous les
engins de recherche (AltaVista, Yahoo!, etc.) sont bass sur cette technologie.
De mme, bien que ceci soit plus rcent, il y a des chances pour que beaucoup de
gens utilisent bientt des fonctions de rsum automatique pour condenser ou
extraire le contenu principal d'un document long ou d'un ensemble de documents.
[...]

Dans ce contexte, le multilinguisme sur le Web est un autre facteur de
complexit. Les gens crivent dans leur propre langue pour diverses raisons:
commodit, discrtion, communication locale, mais ceci ne signifie pas que
d'autres personnes ne soient pas intresses de lire ce qu'ils ont  dire! Ceci
est particulirement vrai pour les socits impliques dans la veille
technologique (disons, une socit informatique qui souhaite connatre tous les
articles de journaux et priodiques japonais relatifs  son activit) et des
services de renseignements gouvernementaux (ceux qui procurent l'information la
plus rcente qui sera ensuite utilise par les fonctionnaires pour dcider de la
politique, etc.). Un des principaux problmes auquel ces services doivent faire
face est la trs grande quantit d'informations. Ils recrutent donc du personnel
bilingue 'passif' qui peut scanner rapidement les textes afin de supprimer ce
qui est sans intrt avant de donner les documents significatifs  des
traducteurs professionnels. Manifestement, une combinaison de rsum automatique
de texte et de traduction automatique sera trs utile dans ce cas; comme la
traduction automatique est longue, on peut d'abord rsumer le texte dans la
langue trangre, puis faire une traduction automatique rapide  partir du
rsultat obtenu, laissant  un tre humain ou un classificateur de texte (type
recherche documentaire) le soin de dcider si on doit garder l'article ou le
rejeter.

Pour ces raisons, durant ces cinq dernires annes, le gouvernement des
Etats-Unis a financ des recherches en traduction automatique, en rsum
automatique de texte et en recherche documentaire, et il s'intresse au
lancement d'un nouveau programme de recherche en informatique documentaire
multilingue. On sera ainsi capable d'ouvrir un navigateur tel que Netscape ou
Explorer, entrer une demande en anglais, et obtenir la liste des textes dans
toutes les langues. Ces textes seront regroups par sous-catgorie avec un
rsum pour chacun et une traduction pour les rsums trangers, toutes choses
qui seraient trs utiles.

En consultant le MuST Multilingual Information Retrieval, Summarization, and
Translation System (Systme MuST de recherche documentaire, rsum et traduction
multilingues), vous aurez une dmonstration de notre version de ce programme de
recherche, qui utilise l'anglais comme langue de l'utilisateur sur un ensemble
d'environ 5.000 textes en anglais, japonais, arabe, espagnol et indonsien.

Entrez votre demande (par exemple, 'baby', ou ce que vous voulez) et appuyez sur
la touche 'Retour'. Dans la fentre du milieu vous verrez les titres (ou bien
les mots-cls, traduits). Sur la gauche vous verrez la langue de ces documents:
'Sp' pour espagnol, 'Id' pour indonsien, etc. Cliquez sur le numro situ sur
la partie gauche de chaque ligne pour voir le document dans la fentre du bas.
Cliquez sur 'Summarize' pour obtenir le rsum. Cliquez sur 'Translate' pour
obtenir la traduction (attention, les traductions en arabe et en japonais sont
extrmement lentes! Essayez plutt l'indonsien pour une traduction rapide mot 
mot).

Ce programme de dmonstration n'est pas (encore) un produit. Nous avons de
nombreuses recherches  mener pour amliorer la qualit de chaque tape. Mais
ceci montre la direction dans laquelle nous allons."


5.2. Linguistique computationnelle


Le Laboratoire de recherche applique en linguistique informatique (RALI)
(Montral, Qubec) runit des informaticiens et des linguistes d'exprience dans
le traitement automatique de la langue tant par des mthodes symboliques
"classiques" que par de nouvelles mthodes probabilistes.

Un rapide historique du RALI est donn sur le site web: grce au laboratoire
Incognito fond en 1983, le dpartement d'informatique et de recherche
oprationnelle (DIRO) de l'Universit de Montral avait acquis une stature de
premier plan en matire de recherche en traitement automatique de la langue
naturelle. En juin 1997, le DIRO a obtenu du ministre de l'Industrie du
gouvernement canadien l'impartition du programme de recherche en traduction
assiste par ordinateur (TAO) poursuivi depuis 1984 par le Centre d'innovation
en technologie de l'information (CITI). C'est dans ce cadre qu'a t mis sur
pied le RALI qui permet de mettre en valeur les rsultats de ces recherches.

Les domaines de comptence du RALI sont les suivants: outils d'aide  la
traduction, appariement automatique de textes, gnration automatique de texte,
raccentuation automatique, recherche d'information aide par des outils
linguistiques, extraction d'information, identification de la langue et du
codage, et transducteurs  tats finis.

Dans le cadre du Projet TransX, le RALI labore une nouvelle gnration d'outils
d'aide aux traducteurs (TransType, TransTalk, TransCheck et TransSearch). Ces
outils sont tous fonds sur des modles de traduction probabilistes qui
calculent automatiquement les correspondances entre le texte produit par le
traducteur et le texte en langue de dpart.

"TransType acclre la saisie de la traduction en anticipant les choix du
traducteur et, au besoin, en les critiquant. L'outil propose ses choix en tenant
compte  la fois du texte en langue de dpart et de la traduction partielle dj
produite par le traducteur.

TransTalk effectue la transcription automatique d'une traduction dicte. Cet
outil se sert d'un modle de traduction probabiliste pour amliorer la
performance du module de reconnaissance vocale.

TransCheck dtecte automatiquement certaines erreurs de traduction en vrifiant
que les correspondances entre les segments d'une bauche de traduction et les
segments du texte en langue de dpart respectent les proprits souhaites d'une
bonne traduction.

TransSearch permet au traducteur d'effectuer des recherches dans des bases de
donnes de traductions pr-existantes pour y retrouver des solutions toutes
faites  ses problmes de traduction. Les bases de donnes requises ncessitent
un appariement entre la traduction et le texte en langue de dpart."

Financs par le socit XEROX, les projets du Xerox Palo Alto Research Center
(PARC) incluent deux projets relatifs aux langues: Inter-Language Unification
(ILU) et Natural Language Theory and Technology (NLTT).

L'Inter-Language Unification (ILU) System (Systme d'unification inter-langues)
est un systme d'interface-objet multi-langues. Les interfaces-objet fournis par
l'ILU dissimulent les diffrences d'implmentation entre les diffrentes
langues, les diffrents espaces d'adresse et les types de systmes
d'exploitation. ILU peut tre utilis pour construire des bibliothques
multilingues orientes vers l'objet ("bibliothques de catgorie") avec des
interfaces bien spcifis indpendants des langues. Il peut tre utilis aussi
pour raliser des systmes distribus, ou pour dfinir et tablir les documents
des interfaces entre les modules de programmes non distribus.

Le but de la Natural Language Theory and Technology (NLTT) (Thorie et
technologie de la langue naturelle) est de dvelopper des thories sur la faon
dont l'information est code dans la langue naturelle et dans la technologie
pour organiser l'information vers et  partir des reprsentations en langue
naturelle. Le but est le maniement efficace et intelligent du texte en langue
naturelle dans les phases critiques du traitement du document, comme
l'identification, le rsum, l'indexation, l'extraction et la prsentation des
faits, le stockage et la recherche des documents ainsi que la traduction, et
permettra galement plus de puissance et de commodit dans la communication en
langue naturelle avec les machines.

Bas  Cambridge (Royaume-Uni) et Grenoble (France), le Xerox Research Centre
Europe (XRCE) est lui aussi un laboratoire de recherche de la socit XEROX. Les
travaux mens ont pour but d'amliorer la productivit sur le lieu de travail,
grce  la mise en oeuvre de nouvelles technologies centres sur le document.

Un des projets du XRCE est Thories et technologies multilingues (MLTT), qui
tudie l'analyse et la gnration de textes pour une grande varit de langues
(allemand, anglais, arabe, espagnol, franais, italien, russe, etc.). L'quipe
du MLTT cre des outils de base pour l'analyse linguistique multilingue, tels
que analyseurs morphologiques, tiqueteurs morpho-syntaxiques, plate-formes pour
le parsage et la gnration, ou encore outils d'analyse de corpus. Ces outils
sont utiliss pour dcrire diverses langues ainsi que les relations d'une langue
 l'autre. Les projets en cours incluent des analyses syntaxiques  tats finis
pour le franais et l'allemand, une grammaire LFG (lexical functional grammar -
grammaire fonctionnelle lexicale) du franais ainsi que des projets en recherche
documentaire multilingue, en gnration et en traduction.

Cre en 1979, l'American Association for Artificial Intelligence (AAAI)
(Association amricaine pour l'intelligence artificielle) est une socit
scientifique  but non lucratif visant une meilleure comprhension scientifique
des mcanismes sous-jacents de la pense et du comportement intelligent et de
leur incorporation dans les machines. L'AAAI a galement pour but de favoriser
la comprhension de l'intelligence artificielle par le grand public, d'amliorer
l'enseignement et la formation des praticiens en intelligence artificielle, et
de procurer des conseils aux planificateurs de recherches et financeurs sur
l'importance des dveloppements en cours sur l'intelligence artificielle, les
possibilits qui en dcoulent et les orientations futures.

Rattach  l'Universit de Genve (Suisse), l'Institut Dalle Molle pour les
tudes smantiques et cognitives (ISSCO) mne des recherches thoriques et
appliques en linguistique computationnelle et en intelligence artificielle.

Cr par la Fondation Dalle Molle en 1972 pour mener des recherches en cognition
et en smantique, l'Institut en est venu  se spcialiser dans le traitement de
la langue naturelle et, en particulier, dans le traitement multilingue des
langues dans un certain nombre de domaines: traduction automatique,
environnement linguistique, gnration multilingue, traitement du discours,
collection de donnes, etc. Si l'universit de Genve procure un soutien
administratif et une infrastructure  l'ISSCO, la recherche est uniquement
finance par des subventions et des contrats avec des organismes publics et
privs.

L'Institut est multidisciplinaire et multinational, avec un petit groupe de
permanents complt par un certain nombre de personnes sous contrat
(spcialises en informatique, linguistique, mathmatiques, psychologie et
philosophie) restant de six mois  deux ans, ce qui permet une grande
flexibilit et un change continuel d'ides.

L'International Committee on Computational Linguistics (ICCL) (Comit
international de linguistique computationnelle) organise l'International
Conference on Computational Linguistics (COLING) (Confrence internationale de
linguistique computationnelle). L'ICCL a t mis sur pied dans les annes 60 par
David Hays en tant qu'organisme permanent

"pour organiser des confrences internationales en linguistique computationnelle
d'une manire originale, sans secrtariat permanent, inscriptions ou financement
propre. Pour ces raisons et d'autres, cette dmarche tait en avance sur son
temps. Les COLINGs ont toujours t des lieux de rendez-vous caractriss par
une atmosphre agrable, plutt que des rassemblements  l'efficacit clinique
se droulant dans un htel d'aroport. [...] Ces dernires annes, l'ACL
[Association for Computational Linguistics - Association de linguistique
computationnelle] a beaucoup contribu  la ralisation des compte-rendus de
confrences et  leur diffusion."


5.3. Ingnierie du langage


Lanc en janvier 1999 par la Commission europenne, le site HLTCentral (HLT:
Human Languages Technologies - Technologies des langues humaines) propose une
courte dfinition de l'ingnierie du langage:

"L'ingnierie du langage permet de vivre en toute convivialit avec la
technologie. Nous pouvons utiliser notre connaissance du langage pour dvelopper
des systmes capables de reconnatre  la fois la parole et l'crit, de
comprendre un texte suffisamment en profondeur pour tre capable de slectionner
des informations, de le traduire dans diffrentes langues et de gnrer aussi
bien un discours oral qu'un texte imprim.

L'application de ces technologies nous permet de repousser les limites actuelles
de notre utilisation du langage. Les systmes  commande vocale sont appels 
jouer un rle prpondrant et  faire partie intgrante de notre vie
quotidienne."

Une prsentation trs complte de l'ingnierie du langage est galement propose
dans L'ingnierie linguistique, ou comment exploiter la puissance du langage.

Cr par le projet LINGLINK, HLTCentral (HLT: Human Language Technologies -
Technologies du langage humain) veut rassembler les ressources en technologies
des langues prsentes sur le Web: informations, actualits, fichiers 
tldcharger, liens, vnements, groupes de discussion et tudes commissionnes
(commerce lectronique, tlcommunications, localisation, etc.).

Le secteur HLT fait partie du programme IST (Information Society Technologies -
Technologies de la socit de l'information) lanc par la Commission europenne
pour la priode 1999-2002. Il succde  Ingnierie linguistique, dvelopp entre
1992 et 1998 par le Programme d'applications tlmatiques. Son but tait de
faciliter l'utilisation d'applications tlmatiques et d'augmenter les
possibilits de communication entre langues europennes. Les travaux de RTD
(recherche et dveloppement technologique) concernaient principalement des
projets pilotes intgrant les technologies de la langue dans les applications et
services d'information et de communication.

FRANCIL (Rseau francophone de l'ingnierie de la langue) est un programme mis
en place en juin 1994 par l'Agence universitaire de la francophonie
(AUPELF-UREF) pour renforcer ses activits dans le domaine du gnie
linguistique, dfini ainsi sur le site:

"Le Gnie Linguistique est une partie du traitement lectronique de
l'information. Dans ce contexte, le traitement automatique des langues est un
secteur en plein dveloppement. Il comprend les recherches et dveloppement en
matire d'analyse et de gnration de textes, de reconnaissance, de
comprhension et de synthse de la parole. Il inclut les applications relatives
 la gestion de documents,  la communication entre l'humain et la machine, 
l'aide  la rdaction,  la traduction assiste par ordinateur. Il comporte des
enjeux de type industriel et conomique, de type scientifique et technologique
mais prsente aussi une dimension culturelle trs spcifique. Il est toujours
prfrable de matriser la langue qui sert  exprimer les rsultats des
recherches, surtout si cette recherche porte sur la langue elle-mme. La langue
franaise et la francophonie sont donc trs directement concernes par cet
enjeu."

Comme son nom l'indique, la Multilingual Application Interface for Telematic
Services (MAITS) (Interface pour les applications multilingues des services
tlmatiques) est un consortium form pour dvelopper un API (applications
programming interface - interface pour la programmation des applications) pour
les applications multilingues des services tlmatiques.


5.4. Internationalisation et localisation


"Vers la communication sur Internet dans toutes les langues..." Babel est un
projet conjoint d'Alis Technologies et de l'Internet Society traitant de
l'internationalisation d'Internet. Son site multilingue (allemand, anglais,
espagnol, franais, italien, portugais et sudois) comprend deux grands
secteurs: langues (les langues du monde; glossaire typographique et
linguistique; Francophonie), et Internet et multilinguisme (dvelopper votre
site web multilingue; le codage des critures du monde).

La Localisation Industry Standards Association (LISA) (Association pour les
normes de l'industrie de la localisation) est une organisation majeure pour
l'industrie de localisation et d'internationalisation. Ses 130 membres
comprennent des diteurs de logiciels, des fabricants de matriel, des vendeurs
de services de localisation, et un nombre croissant de socits venant des
secteurs voisins de technologie de l'information. La mission de LISA est de
promouvoir l'industrie de la localisation et de l'internationalisation et de
procurer un mcanisme et des services permettant aux socits d'changer et de
partager l'information dans le dveloppement de processus, outils, technologies
et modles de socits en rapport avec la localisation, l'internationalisation
et les domaines voisins. Son site est hberg par l'Universit de Genve, en
Suisse.

W3C Internationalization/Localization est un secteur du World Wide Web
Consortium (W3C), consortium international de l'industrie fond en 1994 pour
dvelopper les protocoles communs du World Wide Web. Le site donne en
particulier une dfinition des protocoles utiliss pour l'internationalisation
et la localisation: HTML (hypertext markup language), jeu de base de caractres,
nouveaux attributs, HTTP (hypertext transfer protocol), ngociation de la
langue, URL (uniform resource locator) et autres identificateurs incluant des
caractres non-ASCII (American standard code for information interchange). Le
site propose aussi une aide pour crer un site multilingue.


6. SELECTION DE SITES


[Dictionnaires - exemples / Dictionnaires - rpertoires / Ingnierie de la
langue / Internationalisation et localisation / Langue franaise - promotion et
recherche / Langues - enseignement / Langues - rpertoires / Langues appliques
/ Linguistique computationnelle / Multilinguisme - chiffres / Multilinguisme en
Europe / Outils linguistiques - rpertoires / Terminologie / Terminologie -
informatique / Terminologie - Internet / Traduction / Traduction automatique -
associations / Traduction automatique - recherche / Traduction automatique -
services gratuits sur le Web / Traduction automatique - socits]

#Dictionnaires - exemples

= Dictionnaire universel francophone en ligne

Publi par Hachette et l'AUPELF-UREF (Agence francophone pour l'enseignement
suprieur et la recherche). "Voici enfin prsents, sur un pied d'galit, le
franais dit "standard" et les mots et expressions en franais tel qu'on le
parle sur les cinq continents." [franais]

= The Internet Dictionary Project (IDP)

Cr en 1995 par Tyler Chambers, un projet coopratif en cours pour la
constitution de dictionnaires en accs libre sur le Web - de l'anglais vers
d'autres langues (allemand, espagnol, franais, italien, latin et portugais).
Tout internaute peut y participer. A suivre pour juger de la qualit. [menu en
anglais]

= The Logos Dictionary

Un dictionnaire multilingue d'environ 7,5 millions d'entres gr par Logos,
une socit de traduction internationale dont le sige est  Modne (Italie) et
qui met en accs libre sur son site tous les outils utiliss par ses
traducteurs. Outre le Logos Dictionary, on a aussi la Wordtheque, une base de
donnes multilingue de 400 millions de mots prsents dans leur contexte (le
texte de romans, documents techniques et crits divers), Linguistic Resources
(Ressources linguistiques), qui regroupe 650 glossaires, et enfin le Universal
Conjugator (Conjugaison universelle), qui propose des tableaux de conjugaison
dans 17 langues diffrentes. [anglais]

= Merriam-Webster Online: The Language Center

Un grand diteur amricain de dictionnaires met en accs libre deux ouvrages
de rfrence, le Webster Dictionary et le Webster Thesaurus. [anglais]

#Dictionnaires - rpertoires

= Dictionnaires lectroniques

Prpar par la Section franaise des Services linguistiques centraux (SLC-f)
de la Chancellerie fdrale suisse. Propose cinq rubriques: dictionnaires
monolingues, dictionnaires bilingues, dictionnaires multilingues, abrviations
et acronymes, et informations gographiques. [franais]

= OneLook Dictionaries

Cr en avril 1996 par Robert Ware, un moteur de recherche rapide puisant dans
2,5 millions de mots disponibles dans 530 dictionnaires traitant des domaines
suivants: affaires, informatique/Internet, mdecine, religion, sciences, sports,
technologie, gnralits et argot. [anglais]

= Travlang's Translating Dictionaries

Sur le site de Michael C. Martin, ddi  la fois aux voyages et aux langues,
une section donnant accs  des dictionnaires gratuits dans diverses langues
(afrikaans, allemand, danois, espagnol, espranto, finnois, franais, frison,
hollandais, hongrois, italien, latin, norvgien, portugais et tchque).
[anglais]

= A Web of Online Dictionaries

Oeuvre de Robert Beard, un index des dictionnaires en ligne dans plus de 170
langues diffrentes, auquel s'ajoutent d'autres sections: dictionnaires
multilingues, dictionnaires anglophones spcialiss, thsaurus et vocabulaires,
grammaires en ligne, et outils linguistiques pour non spcialistes. [anglais]

#Ingnierie de la langue

= HLTCentral (HLT: Human Language Technologies)

Lanc en janvier 1999 par le projet LINGLINK de la Commission europenne,
HLTCentral veut rassembler les ressources en technologies des langues prsentes
sur le Web: informations, actualits, fichiers  tlcharger, liens, vnements,
groupes de discussion et tudes commissionnes (commerce lectronique,
tlcommunications, localisation, etc.). HLT fait partie du programme IST
(Information Society Technologies) lanc par la Commission europenne pour la
priode 1999-2002, et qui succde au programme Ingnierie linguistique
(1992-1998). [anglais]

= Multilingual Application Interface for Telematic Services (MAITS)

Consortium form pour dvelopper un API (applications programming interface =
interface de programmation d'application) pour les applications multilingues des
services tlmatiques. [franais, rsums dans plusieurs langues]

= FRANCIL

FRANCIL (Rseau francophone de l'ingnierie de la langue) est un programme mis
en place en juin 1994 par l'Agence universitaire de la francophonie
(AUPELF-UREF) pour renforcer ses activits dans le domaine du gnie
linguistique, notamment le traitement automatique des langues. [franais]

#Internationalisation et localisation

= Babel

Projet conjoint d'Alis Technologies et de l'Internet Society traitant de
l'internationalisation d'Internet. Propose deux grands secteurs: 1) Langues (Les
langues du monde - Glossaire typographique et linguistique - La Francophonie),
2) Internet et multilinguisme (Dvelopper votre site web multilingue - Le codage
des critures du monde). [allemand, anglais, espagnol, franais, italien,
portugais et sudois]

= Localisation Industry Standards Association (LISA)

Le site d'une organisation qui oeuvre pour l'industrie de localisation et
d'internationalisation. Ses 130 membres comprennent des diteurs de logiciels,
des fabricants de matriel, des vendeurs de services de localisation, et un
nombre croissant de socits venant des secteurs voisins des technologies de
l'information. LISA procure un mcanisme et des services permettant aux socits
d'changer et partager l'information dans le dveloppement de processus, outils,
technologies et modles de socits. [anglais]

= W3C Internationalization / Localization

Un secteur du World Wide Web Consortium (W3C), consortium industriel
international fond en 1994 pour dvelopper les protocoles communs du World Wide
Web. Le site donne notamment une dfinition des protocoles utiliss pour
l'internationalisation et la localisation: HTML (hypertext markup language),
HTTP (hypertext transfer protocol), URL (uniform resource locator) et autres
identificateurs incluant des caractres non-ASCII (American standard code for
information interchange), etc. Donne aussi des conseils pour crer un site
multilingue. [anglais]

#Langue franaise - promotion et recherche

= Agence de la francophonie

Cre en 1970 pour regrouper 21 tats francophones, l'Agence de la
Francophonie en compte aujourd'hui 47. "Instrument de coopration multilatrale
ne d'un idal, celui de crer une communaut qui fasse entendre sa voix dans le
concert des nations, elle participe aujourd'hui  l'avnement d'un Secrtariat
gnral de la Francophonie." [franais]

= Agence universitaire de la Francophonie

Oprateur direct du Sommet des Chefs d'Etat et de gouvernement des pays ayant
le franais en partage, cet organisme a le mandat officiel de contribuer  la
construction francophone en consolidant un espace scientifique de langue
franaise anim par ses principaux acteurs, les tablissements, les enseignants,
les chercheurs et les tudiants. [franais]

##Belgique

= Maison de la Francit

Association belge  but non lucratif subventionne par la Commission
communautaire franaise, la Maison de la Francit prsente la ralit
socio-linguistique de Bruxelles, seconde capitale internationale de langue
franaise aprs Paris, et elle agit pour la dfense et la promotion de la langue
franaise  Bruxelles et au sein de la Communaut franaise Wallonie-Bruxelles.
[franais]

##France

= Dlgation gnrale  la langue franaise (DGLF)

La DGLF a pour mission de veiller  l'emploi et  la promotion du franais sur
le territoire national, favoriser son utilisation comme langue de communication
internationale et dvelopper le plurilinguisme, garant de la diversit
culturelle. [franais]

= Institut national de la langue franaise (INaLF)

L'INaLF est une branche du CNRS (Centre national de la recherche
scientifique). Ses recherches portent sur la langue franaise sous tous ses
aspects, notamment le discours littraire du 14e au 20e sicle (contenu,
smantique et thmatique), la langue courante (langue crite, langue parle et
argot), le discours scientifique et technique et ses ressources terminologiques.
[franais]

##Qubec

= Centre d'expertise et de veille inforoutes et langues (CEVEIL)

Cr en 1995, un organisme qubcois  but non lucratif dont la mission est de
mieux cerner la problmatique de l'utilisation et du traitement des langues sur
les inforoutes - dans une optique plus spcifiquement francophone - via
l'institution d'activits de veille stratgique et la cration d'un rseau
d'changes et d'expertise. [franais]

= Office de la langue franaise (OLF)

Organisme gouvernemental qubcois dont le mandat est d'une part de veiller 
l'implantation et au maintien du franais dans le monde du travail et des
affaires et dans les services administratifs, d'autre part de dfinir et
conduire la politique qubcoise en matire de linguistique et de terminologie.
[franais, anglais]

#Langues - enseignement

= CTI Centre for Modern Languages

Inclus dans l'Institut des langues de l'Universit d'Hull (Royaume-Uni), le
CTI Centre for Modern Languages (CTI: Computer in Teaching Initiative) vise 
promouvoir l'utilisation des ordinateurs dans l'apprentissage et l'enseignement
des langues. Le Centre procure des informations sur la manire dont
l'apprentissage des langues assist par ordinateur peut tre intgr  des cours
existants, et il offre un soutien aux professeurs utilisant l'informatique dans
l'enseignement qu'ils dispensent. Voir aussi la trs intressante rubrique:
Internet Resources for Language Teachers and Learners. [anglais]

= EUROCALL

EUROCALL (European Association for Computer-Assisted Language Learning =
Association europenne pour l'apprentissage des langues assist par ordinateur)
regroupe des professionnels de l'enseignement des langues exerant en Europe et
dans le monde entier. Le prochain congrs annuel, EUROCALL'99, aura lieu du 15
au 18 septembre 1999  l'Universit de Franche-Comt (Besanon, France). Comme
chaque anne, il fera le point sur les recherches et les applications
informatiques dans le domaine de l'apprentissage des langues. [anglais]

= WELL (Web Enhanced Language Learning)

Un projet anglais en cours (1997-2000), qui est en train de mettre sur pied:
a) un vaste programme de sminaires, b) une liste d' tudes de cas sur
l'apprentissage et l'enseignement des langues par le biais du Web, c) un
rpertoire complet de ressources web de qualit dans douze langues diffrentes.
[anglais]

#Langues - rpertoires

= Ethnologue: Languages of the World

Edit par Barbara F. Grimes, la version web d'un catalogue trs document
rpertoriant 6.700 langues, avec de multiples critres de recherche. Cet ouvrage
de rfrence (13e dition) est galement disponible sur papier et sur CD-ROM.
[anglais]

= European Minority Languages

Gre par Caoimhn P.  Donnale sur le site de l'Institut Sabhal Mr Ostaig
(Ile de Skye, Ecosse), une liste de langues minoritaires - ou rendues
minoritaires - disponible par ordre alphabtique et par famille linguistique. Ce
site procure aussi des liens avec d'autres rpertoires dans le monde entier
(Other Directories Worldwide). [anglais, galique]

= The Languages of the World by Computers and the Internet

Cr en dcembre 1995 par Yoshi Mikami, de Asia Info Network, ce site est
connu aussi sous le nom de Logos Home Page ou Kotoba Home Page. Il donne, pour
chaque langue, un bref historique, les caractristiques, le systme d'criture,
le jeu de caractres et la configuration du clavier pour l'utilisation de
l'ordinateur et d'Internet. [anglais, japonais]

#Langues appliques

= Language today

Un magazine passionnant pour ceux qui travaillent dans les langues appliques:
traducteurs, interprtes, terminologues, lexicographes et rdacteurs techniques.
Ce magazine est une ralisation commune de Logos, qui procure le site web, et
Praetorius, socit de traduction et service d'expertise britannique. [anglais]

#Linguistique computationnelle

= The Association for Computational Linguistics (ACL)

Un organisme international  la fois scientifique et professionnel rassemblant
ceux qui travaillent sur les problmes de la langue naturelle et de la
computation. Publie par la MIT Press, la revue trimestrielle de l'ACL,
Computational Linguistics (ISSN 0891-2017) est un forum de premier plan dans le
domaine de la linguistique computationnelle et du traitement de la langue
naturelle. La branche europenne de l'ACL est l'European Chapter of the
Association for Computational Linguistics (EACL). [anglais]

= Institut Dalle Molle pour les tudes smantiques et cognitives (ISSCO)

Rattach  l'Universit de Genve (Suisse), l'ISSCO mne des recherches
thoriques et appliques en linguistique computationnelle et en intelligence
artificielle. Il est spcialis dans le traitement de la langue naturelle et, en
particulier, dans le traitement multilingue des langues en traduction
automatique, environnement linguistique, gnration multilingue, traitement du
discours, collecte des donnes, etc. [anglais]

= International Committee on Computational Linguistics (ICCL) / COLING

Cr pour organiser des confrences internationales en linguistique
computationnelle - dnommes COLING (Computational Linguistics) - "d'une manire
originale, sans secrtariat permanent, inscriptions ou financement propre. Pour
ces raisons et d'autres, cette dmarche tait en avance sur son temps. Les
COLINGs ont toujours t des lieux de rendez-vous caractriss par une
atmosphre agrable, plutt que des rassemblements  l'efficacit clinique se
droulant dans un htel d'aroport. "Les compte-rendus de confrences sont
raliss avec l'aide de l'Association for Computational Linguistics. [allemand,
anglais, franais, italien, polonais, portugais, romanche]

= Le Laboratoire de recherche applique en linguistique informatique (RALI)

Bas  Montral (Qubec), le RALI runit des informaticiens et des linguistes
qui tudient le traitement automatique de la langue tant par des mthodes
symboliques "classiques" que par de nouvelles mthodes probabilistes. Ses
domaines de comptence sont les suivants: outils d'aide  la traduction,
appariement automatique de textes, gnration automatique de texte,
raccentuation automatique, recherche d'information aide par des outils
linguistiques, extraction d'information, identification de la langue et du
codage, transducteurs  tats finis, et corpus de texte enrichis. [franais,
anglais]

= Natural Language Group (NLG) at USC/ISI

Un dpartement de l'Information Sciences Institute (ISI) de l'University of
Southern California (USC). Traite de plusieurs aspects du traitement de la
langue naturelle: traduction automatique, rsum automatique de texte, accs
multilingue aux verbes et gestion du texte, dveloppement de taxonomies de
concepts (ontologies), discours et gnration de texte, laboration de grands
lexiques pour plusieurs langues, et communication multimdia. [anglais]

= Text Encoding Initiative (TEI)

Un projet international pour mettre au point des directives sur l'encodage des
textes lectroniques  destination de la recherche. Un consortium a t form
rcemment par les trois sponsors de ce projet (Association for Computers and the
Humanities, Association for Literary and Linguistic Computing, Association for
Computational Linguistics). [anglais]

= University of Essex - CL/MT Research Group

Le CL/MT Research Group (CL/MT: Computational Linguistics / Machine
Translation) est un groupe de recherche du Dpartement des langues et de
linguistique de l'Universit d'Essex (Royaume-Uni). [anglais]

= Xerox Palo Alto Research Center (PARC)

Le centre de recherche de la socit Xerox dans la Silicon Valley (Californie)
mne au moins deux projets relatifs aux langues: Inter-Language Unification
(ILU) et Natural Language Theory and Technology (NLTT). [anglais]

= Xerox Research Centre Europe (XRCE)

Le centre de recherche europen de la socit Xerox, bas  Cambridge
(Royaume-Uni) et Grenoble (France). Les travaux mens ont pour but d'amliorer
la productivit sur le lieu de travail, grce  la mise en oeuvre de nouvelles
technologies centres sur le document, notamment dans le programme Thories et
technologies multilingues (MLTT). [allemand, anglais, franais, italien]

[Voir aussi la section: Traduction automatique - recherche]

#Multilinguisme - chiffres

= Global Reach

Sur le site de Global Reach, qui traduit les sites web commerciaux tout en les
adaptant aux besoins de chaque pays, des statistiques dtailles sur la
rpartition des langues sur le Web. [anglais]

= Palmars des langues de la Toile

Mene par Babel, un projet conjoint d'Alis Technologies et de l'Internet
Society, la premire tude d'ensemble sur la rpartition relle des langues sur
Internet. Comme elle date de juin 1997, on attend impatiemment une nouvelle
version... [franais, anglais]

#Le multilinguisme en Europe

= Association europenne pour les ressources linguistiques (ELRA)

Etablie  Luxembourg en fvrier 1995, une association  but non lucratif qui a
pour but d'une part de fournir une organisation centralise pour la validation,
la gestion et la distribution des ressources et outils en parole, texte et
terminologie, d'autre part de promouvoir leur utilisation au sein de la section
europenne de recherche et dveloppement en tlmatique. [franais, anglais]

= European Network in Language and Speech (ELSNET)

Regroupe plus d'une centaine d'institutions universitaires et industrielles.
L'objectif technologique commun aux participants de l'ELSNET est de construire
des systmes multilingues pour la parole et le langage naturel, avec couverture
illimite de la langue parle et crite. [anglais]

= Language Futures Europe

Paul Treanor propose des rpertoires sur la politique linguistique, le
multilinguisme, les structures linguistiques globales, la domination de
l'anglais, la politique europenne, les politiques nationales, les sites de
recherche et le "mouvement monolingue" mergeant aux Etats-Unis. [anglais]

= Multilingual Information Society (MLIS)

Un programme de la Commission europenne lanc en novembre 1996  destination
des entreprises, des organismes du secteur public, des industries des langues et
des citoyens. Ses objectifs: soutenir la ralisation d'une infrastructure
favorisant des ressources linguistiques europennes, stimuler le dveloppement
des industries des langues, et favoriser l'utilisation d'outils linguistiques
dans le secteur public europen. [franais, disponible dans les onze langues de
la Communaut europenne]

#Outils linguistiques - rpertoires

= The Human-Languages Page (H-LP)

Cr par Tyler Chambers en mai 1994, un catalogue dtaill de 1.800 ressources
linguistiques dans plus de 100 langues diffrentes, rparties en diffrentes
sections: langues et littrature, coles et institutions, ressources
linguistiques, produits et services, organismes, emplois et stages,
dictionnaires et cours de langues. [anglais]

= The LINGUIST List

Propos par l'Eastern Michigan University et la Wayne State University (USA),
une srie de rpertoires sur les ressources linguistiques: profession
(confrences, associations linguistiques, programmes, etc.), recherche et
soutien  la recherche (articles, rsums de mmoires, projets, bibliographies,
dossiers, textes), publications, pdagogie, ressources linguistiques (langues,
familles linguistiques, dictionnaires, information rgionale) et soutien
informatique (polices de caractres et logiciels). Propose aussi un trs bon
centre de documentation virtuel (Virtual Library), un moteur de recherche ax
sur les langues (Search for LINGUIST Issues) et un moteur de recherche plus
gnral pour l'ensemble du site (Search the LINGUIST List web site). [anglais]

= Multilingual Tools and Services

Propos par la Commission europenne dans le cadre du programme Tlmatique
pour les bibliothques, rpertorie une srie de dictionnaires, instruments
d'aide multilingues, projets, moteurs de recherche par langue, banques de
donnes terminologiques, thsaurus et systmes de traduction. [anglais]

= Speech on the Web

Gr par l'Institut des sciences phontiques d'Amsterdam (Pays-Bas), un
rpertoire de sites organiss en diffrentes sections: congrs, runions et
ateliers, liens et listes, phontique et parole, traitement de la langue
naturelle, sciences cognitives et intelligence artificielle, linguistique
computationnelle, dictionnaires, lettres d'information lectroniques, revues et
publications. [anglais]

= Travlang

Cr par Michael C. Martin en 1994, un excellent site ddi  la fois aux
voyages et aux langues. Foreign Languages for Travelers donne la possibilit
d'apprendre 60 langues diffrentes sur le Web. Translating Dictionaries donne
accs  des dictionnaires gratuits dans diverses langues (afrikaans, allemand,
danois, espagnol, espranto, finnois, franais, frison, hollandais, hongrois,
italien, latin, norvgien, portugais et tchque). Le site offre aussi de
nombreux liens vers des services de traduction, des coles de langue, des
librairies multilingues, etc. [anglais]

#Terminologie

= Eurodicautom

Gre par le Service de traduction de la Commission europenne, une base de
donnes terminologique disponible dans les onze langues officielles de l'Union
europenne (allemand, anglais, danois, espagnol, finnois, grec, hollandais,
italien, latin, portugais et sudois). Eurodicautom tait  l'origine un outil
de travail destin aux traducteurs de la Commission. Disponible sur le Web, il
est maintenant consult par des professionnels des langues dans le monde entier.
[menu en anglais]

= ILOTERM

Gre par l'Unit de terminologie et de rfrences du Service des documents
officiels (OFFDOC) du Bureau international du Travail (BIT), un base de donnes
terminologique quadrilingue (allemand, anglais, espagnol et franais) relative
au travail et aux questions sociales. Inclut les noms de nombreux programmes et
organismes. [menu en anglais, espagnol et franais]

= ITU Telecommunication Terminology Database (TERMITE)

Gr par la Section de traduction de l'Union internationale des
tlcommunications (UIT), une base terminologique quadrilingue (environ 60.000
entres en anglais, espagnol, franais et russe) contenant tous les termes
inclus dans les glossaires de l'UIT imprims depuis 1980, ainsi que des termes
plus rcents en rapport avec les diffrentes activits de l'Union. [menu en
anglais]

= The WHO Terminology Information System (WHOTERM)

Gr par l'Organisation mondiale de la sant (OMS), un systme d'information
terminologique trilingue (anglais, espagnol et franais) constitu  partir des
expressions et concepts des documents de l'OMS et permettant aussi d'enrichir
les terminologies nouvelles, promouvoir leur normalisation et garantir leur
diffusion. [menu en anglais]

#Terminologie - informatique

= FOLDOC - Free On-Line Dictionary of Computing

Par Denis Howe, 12.574 termes lists le 3 juillet 1999, plus une srie de
liens. [anglais]

= Glossaire informatique des termes de la Commission ministrielle de
terminologie

"Ce document est le rsultat d'une compilation des divers arrts issus des
travaux de la Commission ministrielle de terminologie informatique ainsi que du
projet d'arrt qui tait en cours lorsque le dispositif terminologique a fait
l'objet d'une profonde rforme. Une compilation initiale avait t ralise par
Daniel Duthil de l'APP, la version actuelle et la prsentation ont t commises
par Philippe Deschamp de l'INRIA. Tous deux taient membres de la dite
commission." [franais]

= Le signet: la rfrence branche en technologies de l'information

6 mille fiches bilingues (franais-anglais) proposes par l'Office de la
langue franaise (Qubec). [franais]

#Terminologie - Internet

= L'ABC des rseaux

Conu et ralis par l'association Passerelles - Langue franaise et nouvelles
technologies. [franais]

= Glossaire de termes relatifs  Internet

Un glossaire officieux de Jean-Karim Benzineb, traducteur au Conseil de
l'Europe. [franais]

= Lexique des nologismes Internet

Par Guy Brand et Jean-Pierre Kuypers. Rassemble quelques quivalences du
vocabulaire technique li aux rseaux informatiques et aux services qu'ils
supportent. Ces termes sont communment utilises par des traducteurs et
adaptateurs francophones de logiciels diffuss sur Internet. [franais]

= NetGlos (The Multilingual Glossary of Internet Terminology)

Cr en 1995  l'initiative du WorldWide Language Institute, NetGlos est le
projet commun d'un certain nombre de traducteurs et autres professionnels des
langues. Ce glossaire est prpar dans les langues suivantes: allemand, anglais,
chinois, croate, espagnol, franais, grec, hbreu, hollandais/flamand, italien,
maori, norvgien et portugais. [menu en anglais]

= Inventaire des terminologies dans Internet

Propos par l'Office de la langue franaise (Qubec). [franais]

#Traduction

= Aquarius

Cr par Vorontsoff, Wesseling & Partners (Amsterdam, Pays-Bas), un rpertoire
non commercial de traducteurs et interprtes - 7.861 traducteurs et 1.164
socits de traduction au 4 juillet 1999. Permet de localiser et de contacter
les personnes et socits directement, sans intermdiaire ni agence. La
recherche est possible par lieu, combinaison de langues et spcialit. [anglais]

= Global Reach (Euro-Marketing Associates)

Fond par Bill Dunlap, Global Reach est un service commercial  destination
des socits amricaines et europennes voulant tendre leur prsence sur
Internet  l'international. Les prestations incluent la traduction et
l'adaptation du site web dans d'autres langues, la promotion de ce site et
l'utilisation de bandeaux publicitaires nationaux pour augmenter la consultation
locale. [allemand, anglais, danois, espagnol, franais, italien, nerlandais,
portugais et sudois]

#Traduction automatique - associations

= Association for Machine Translation in the Americas (AMTA)

Association  la disposition de tous ceux qui s'intressent  la traduction
automatique en Amrique latine, au Canada et aux Etats-Unis. Ses membres
comprennent des demandeurs de traductions, des dveloppeurs de systmes
commerciaux, des chercheurs, des sponsors et des personnes impliques dans la
recherche en traduction automatique. [anglais]

= European Association for Machine Translation (EAMT)

Base  Genve (Suisse), une organisation  la disposition de ceux qui
s'intressent  la traduction automatique et aux outils de traduction, y compris
les utilisateurs de ces techniques, les dveloppeurs et les chercheurs.
[anglais]

= Asia-Pacific Association for Machine Translation (AAMT)

Cre en 1991 et d'abord appele Japan Association for Machine Translation,
comprend des chercheurs, des fabricants et des utilisateurs de systmes de
traduction automatique. Participe au dveloppement des technologies de
traduction automatique, ainsi qu' leur amlioration, leur enseignement et leur
diffusion. [anglais]

#Traduction automatique - recherche

= Center for Machine Translation (CMT)

Fond en 1986, un centre de recherche inclus dans le nouvel Institut des
technologies des langues de la Carnegie Mellon University (CMU, Pittsburgh,
Pennsylvanie, USA). Il est spcialis dans les technologies de traitement de la
langue naturelle, particulirement la traduction automatique multilingue de
haute qualit. [anglais]

= Computing Research Laboratory (CRL)

Ce centre de recherche de la New Mexico State University (NMSU) se consacre 
la recherche de base et au dveloppement de logiciels dans les applications
informatiques avances du traitement de la langue naturelle, de l'intelligence
artificielle et de la conception d'interfaces graphiques pour les utilisateurs.
Les applications dveloppes  partir de cette recherche de base incluent un
ensemble de configurations de traduction automatique, extraction d'information,
acquisition du savoir, enseignement intelligent, et systmes de traduction pour
poste de travail. [anglais]

= Groupe d'tude pour la traduction automatique (GETA)

Au sein du Laboratoire CLIPS (Communication langagire et interaction
personne-systme) de la Fdration IMAG (France), une quipe pluridisciplinaire
forme d'informaticiens et de linguistes. Les thmes de recherche du GETA
concernent tous les aspects thoriques, mthodologiques et pratiques de la
traduction assiste par ordinateur (TAO du rviseur, du traducteur et du
rdacteur), et plus gnralement de l'informatique multilingue. [franais]

= Machine Translation at the Pan American Health Organization: SPANAM and
ENGSPAN

Un systme de traduction automatique dvelopp par les linguistes
computationnels, les traducteurs et le programmeur systmes de l'Organisation
panamricaine de la sant (OPS) (qui est le Bureau rgional de l'Organisation
mondiale de la sant pour les Amriques, situ  Washington, D.C., USA). Depuis
1980, le service de traduction utilise SPANAM (de l'espagnol vers l'anglais) et
ENGSPAN (de l'anglais vers l'espagnol), ce qui lui a permis de traiter plus de
25 millions de mots dans les deux langues de travail de l'OPS. [anglais]

= TTT.org -Translation, Theory and Technology

Gr par le Dpartement de linguistique du Groupe de recherche sur la
traduction de l'Universit Brigham Young (Utah, USA), TTT.org procure des
informations sur la thorie et la technologie de la langue, particulirement
dans le domaine de la traduction. La technologie de la traduction inclut les
outils de traduction pour poste de travail et la traduction automatique. TTT.org
s'intresse aussi aux normes d'changes de donnes permettant  divers outils de
fonctionner en lien les uns avec les autres, ce qui permet l'intgration
d'outils de la part de vendeurs multiples dans la chane multilingue de
production de documents. [anglais]

= Universal Networking Language (UNL)

Sous l'gide de l'Universit des Nations Unies (UNU, Tokyo), un projet de
"mtalangage numrique" pour l'encodage, le stockage, la recherche et la
communication d'information multilingue indpendamment d'une langue-source (et
donc d'un systme de pense) donne. 120 chercheurs de par le monde travaillent
sur un projet multilingue comportant 17 langues (allemand, anglais, arabe,
brsilien, chinois, espagnol, franais, hindou, indonsien, italien, japonais,
letton, mongolien, russe, swahili et tha). [site en anglais et japonais -
rsum du projet en allemand et en anglais]

#Traduction automatique - services gratuits sur le Web

= Altavista Translation / Babel Fish

Propos depuis dcembre 1997 par le moteur de recherche AltaVista, un service
de traduction automatise de l'anglais vers cinq autres langues (allemand,
espagnol, franais, italien et portugais), et vice versa. Aliment par des
dictionnaires multilingues contenant plus de 2,5 millions de termes, ce service,
gratuit, instantan et approximatif, a t mis en place par Systran, socit
pionnire dans le domaine de la traduction automatique. [anglais]

= FreeTranslation.com

Propos par Transparent Language, un service de traduction automatique rapide
et approximative d'une page web ou d'un texte personnel. Langues proposes: 1)
l'anglais vers l'allemand, l'espagnol, le franais, l'italien et le portugais,
2) l'allemand, l'espagnol et l'italien vers l'anglais. [anglais]

= Go Translator

Un logiciel de la socit Systran en accs libre sur le Web. Permet de
traduire une page web ou un texte personnel, avec les mmes combinaisons de
langues qu'Altavista Translation (anglais vers allemand, espagnol, franais,
italien et portugais, et vice versa). [anglais]

#Traduction automatique - socits

= Alis Technologies

Base  Montral (Qubec), Alis Technologies dveloppe et commercialise des
solutions et services de traitement linguistique au moyen de logiciels de
traduction qui transforment des systmes informatiques unilingues en outils
multilingues. [site en anglais et franais - pages en espagnol et japonais pour
la traduction automatique]

= Lernout & Hauspie (L&H)

Bas  Ypres (Belgique) et Burlington (Massachussets, USA), Lernout & Hauspie
(L&H) est une grosse socit de produits, technologies et services incluant la
reconnaissance automatique de la langue, la compression numrique de la parole,
le passage du texte  la parole, la compression et la traduction. [anglais]

= Logos Corporation

Avec des bureaux sur les deux ctes des Etats-Unis et en Europe, Logos
Corporation fournit des solutions de traduction et de localisation  des
socits reprsentant une large gamme d'industries, y compris les technologies
de l'information et les tlcommunications. [allemand, anglais, chinois
simplifi, chinois traditionnel, coren, espagnol, italien, japonais et
portugais]

= Softissimo

Edite et diffuse des logiciels de traduction automatique, d'apprentissage des
langues et de dictionnaires (Eurodico, Grand Collins bilingue et Collins English
Dictionary). [allemand, anglais, franais]

= SYSTRAN

SYSTRAN (acronyme de: System Translation) est une socit spcialise dans
les logiciels de traduction automatique. Son sige est situ 
Soisy-sous-Montmorency (France). C'est sa succursale, situe  La Jolla
(Californie), qui assure les ventes, le marketing et le dveloppement des
logiciels. La ralisation la plus connue de la socit est AltaVista Translation
/ Babel Fish, mis en place en dcembre 1997 sur le site du moteur de recherche
AltaVista, et qui permet de traduire les pages web de l'anglais vers les langues
suivantes: allemand, franais, espagnol, italien et portugais, et vice versa.
[anglais]


7. INDEX DES SITES ET PAGES WEB


Agence de la francophonie

Alis Technologies

AltaVista Translation

American Association for Artificial Intelligence (AAAI)

Aquarius

ARTFL Project (ARTFL: American and French Research on the Treasury of the French
Language)

Asia-Pacific Association for Machine Translation (AAMT)

Association europenne pour les ressources linguistiques (ELRA)

Association for Computational Linguistics (ACL)

Association for Machine Translation in the Americas (AMTA)

Babel / Alis Technologies & Internet Society

CAPITAL (Computer-Assisted Pronunciation Investigation Teaching and Learning)

Center for Machine Translation (CMT) / Carnegie Mellon University (CMU)

Centre d'expertise et de veille inforoutes et langues (CEVEIL)

COLING (International Conference on Computational Linguistics)

Comit europen pour le respect des cultures et des langues en Europe (CERCLE)

Computational Linguistics (CL) and Machine Translation (MT) Group (CL/MT
Research Group) / Essex University

Computing Research Laboratory (CRL) / New Mexico State University (NMSU)

CTI (Computer in Teaching Initiative) Centre for Modern Languages / University
of Hull

Dictionnaire francophone en ligne / Hachette & Agence universitaire de la
Francophonie (AUPELF-UREF)

Dictionnaires lectroniques / Administration fdrale suisse

ENGSPAN (SPANAM and ENGSPAN) / Organisation panamricaine de la sant (PAHO)

Ethnologue (The)

EUROCALL (European Association for Computer-Assisted Language Learning)

Eurodicautom / Commission europenne

European Association for Machine Translation (EAMT)

European Chapter of the Association of Computational Linguistics (EACL)

European Minority Languages / Sabhal Mr Ostaig

European Network in Language and Speech (ELSNET)

FRANCIL (Rseau francophone de l'ingnierie de la langue) / Agence universitaire
de la francophonie (AUPELF-UREF)

FRANTEXT / Institut national de la langue franaise (INaLF)

Global Reach

Globalink

Groupe d'tude pour la traduction automatique (GETA)

Human Language Technology (HLTCentral) / Commission europenne

Human-Languages Page (The)

ILOTERM / Organisation internationale du Travail (OIT)

Institut Dalle Molle pour les tudes smantiques et cognitives (ISSCO)

Institut national de la langue franaise (INaLF)

International Committee on Computational Linguistics (ICCL)

International Conference on Computational Linguistics (COLING)

Internet Dictionary Project

Internet Resources for Language Teachers and Learners

Laboratoire de recherche applique en linguistique informatique (RALI)

Language Futures Europe

Language Today

Languages of the World by Computers and the Internet (The)

Lernout & Hauspie

LINGUIST List (The)

Localisation Industry Standards Association (LISA)

Logos (Canada, USA, Europe)

Logos (Italy)

Merriam-Webster Online: the Language Center

Multilingual Application Interface for Telematic Services (MAITS)

Multilingual Glossary of Internet Terminology (The) (Netglos) / WorldWide
Language Institute (WWLI)

Multilingual Information Society (MLIS) / Commission europenne

Multilingual Tools and Services / Commission europenne

Natural Language Group (NLG) at USC/ISI / University of Southern California
(USC)

NetGlos (The Multilingual Glossary of Internet Terminology) / WorldWide Language
Institute (WWLI)

OneLook Dictionaries

Palmars des langues de la Toile / Babel

PARC (Xerox Palo Alto Research Center)

Project Gutenberg

RALI (Laboratoire de recherche applique en linguistique informatique)

Rseau francophone de l'ingnierie de la langue (FRANCIL) / Agence universitaire
de la francophonie (AUPELF-UREF)

SPANAM and ENGSPAN / Organisation panamricaine de la sant (PAHO)

Speech on the Web

SYSTRAN

TERMITE (Base de donnes terminologique des Tlcommunications de l'UIT) / Union
internationale des tlcommunications (UIT)

Thories et technologies multilingues (MLTT) / Xerox Research Centre Europe
(XRCE)

Travlang

TTT.org (Translation, Theory and Technology) / Brigham Young University (BYU)

Unit de traduction assiste par ordinateur et de terminologie (CTT) /
Organisation mondiale de la sant (OMS)

Universal Networking Language (UNL) / Universit des Nations Unies (UNU)

W3C Internationalization/Localization / World Wide Web Consortium (W3C)

Web of Online Dictionaries (A)

WELL (Web Enhanced Language Learning)

WHOTERM (WHO Terminology Information System) / Organisation mondiale de la sant
(OMS)

Xerox Palo Alto Research Center (PARC)

Xerox Research Centre Europe (XRCE)

Yamada WWW Language Guides


8. INDEX DES PERSONNES CITEES


L'astrisque (*) signale les personnes qui ont particulirement contribu 
cette tude en participant  l'enqute mene par courrier lectronique en
juillet et dcembre 1998.

Patrick Andries (Laboratoire de recherche applique en linguistique informatique
- RALI)

Arlette Attali* (Institut national de la langue franaise - INaLF)

Robert Beard* (A Web of Online Dictionaries)

Louise Beaudoin (Ministre de la culture et des communications du Qubec)

Guy Bertrand* (Centre d'expertise et de veille inforoutes et langues - CEVEIL)

Christian Boitet* (Groupe d'tude pour la traduction automatique - GETA)

Tyler Chambers* (Human-Language Pages)

Jean-Pierre Cloutier (Chroniques de Cybrie)

Cynthia Delisle* (Centre d'expertise et de veille inforoutes et langues -
CEVEIL)

Helen Dry* (LINGUIST List)

Bill Dunlap* (2) (Euro-Marketing Associates, Global Reach)

Marcel Grangier* (Section franaise des Services linguistiques centraux de la
Chancellerie fdrale suisse)

Barbara F. Grimes* (The Ethnologue)

Michael S. Hart* (Project Gutenberg)

Randy Hobler* (Globalink)

Eduard Hovy* (Natural Language Group at USC/ISI)

Pierre Isabelle (Laboratoire de recherche applique en linguistique informatique
- RALI)

Christiane Jadelot* (Institut national de la langue franaise - INaLF)

Annie Kahn (Le Monde)

Brian King* (NetGlos)

Geoffrey Kingscott* (Praetorius)

Steven Krauwer* (European Network in Language and Speech - ELSNET)

Michael C. Martin* (Travlang)

Yoshi Mikami* (The Languages of the World by Computer and the Internet)

Caoimhn P.  Donnale* (European Minority Languages)

Henri Slettenhaar* (Webster University)

Martha L. Stone* (2) (ZDNN)

June Thompson* (CTI (Computer in Teaching Initiative) Centre for Modern
Languages)

Paul Treanor* (Language Futures Europe)

Rodrigo Vergara (Logos, Italie)

Robert Ware* (2) (OneLook Dictionaries)

Copyright  1999 Marie Lebert








End of Project Gutenberg's Le multilinguisme sur le Web, by Marie Lebert

*** END OF THIS PROJECT GUTENBERG EBOOK LE MULTILINGUISME SUR LE WEB ***

***** This file should be named 27029-8.txt or 27029-8.zip *****
This and all associated files of various formats will be found in:
        http://www.gutenberg.org/2/7/0/2/27029/

Produced by Al Haines

Updated editions will replace the previous one--the old editions will be
renamed.

Creating the works from public domain print editions means that no one
owns a United States copyright in these works, so the Foundation (and
you!) can copy and distribute it in the United States without permission
and without paying copyright royalties. Special rules, set forth in the
General Terms of Use part of this license, apply to copying and
distributing Project Gutenberg-tm electronic works to protect the
PROJECT GUTENBERG-tm concept and trademark. Project Gutenberg is a
registered trademark, and may not be used if you charge for the eBooks,
unless you receive specific permission. If you do not charge anything
for copies of this eBook, complying with the rules is very easy. You may
use this eBook for nearly any purpose such as creation of derivative
works, reports, performances and research. They may be modified and
printed and given away--you may do practically ANYTHING with public
domain eBooks. Redistribution is subject to the trademark license,
especially commercial redistribution.



*** START: FULL LICENSE ***

THE FULL PROJECT GUTENBERG LICENSE
PLEASE READ THIS BEFORE YOU DISTRIBUTE OR USE THIS WORK

To protect the Project Gutenberg-tm mission of promoting the free
distribution of electronic works, by using or distributing this work
(or any other work associated in any way with the phrase "Project
Gutenberg"), you agree to comply with all the terms of the Full Project
Gutenberg-tm License (available with this file or online at
http://www.gutenberg.org/license).


Section 1.  General Terms of Use and Redistributing Project Gutenberg-tm
electronic works

1.A.  By reading or using any part of this Project Gutenberg-tm
electronic work, you indicate that you have read, understand, agree to
and accept all the terms of this license and intellectual property
(trademark/copyright) agreement.  If you do not agree to abide by all
the terms of this agreement, you must cease using and return or destroy
all copies of Project Gutenberg-tm electronic works in your possession.
If you paid a fee for obtaining a copy of or access to a Project
Gutenberg-tm electronic work and you do not agree to be bound by the
terms of this agreement, you may obtain a refund from the person or
entity to whom you paid the fee as set forth in paragraph 1.E.8.

1.B.  "Project Gutenberg" is a registered trademark.  It may only be
used on or associated in any way with an electronic work by people who
agree to be bound by the terms of this agreement.  There are a few
things that you can do with most Project Gutenberg-tm electronic works
even without complying with the full terms of this agreement.  See
paragraph 1.C below.  There are a lot of things you can do with Project
Gutenberg-tm electronic works if you follow the terms of this agreement
and help preserve free future access to Project Gutenberg-tm electronic
works.  See paragraph 1.E below.

1.C.  The Project Gutenberg Literary Archive Foundation ("the Foundation"
or PGLAF), owns a compilation copyright in the collection of Project
Gutenberg-tm electronic works.  Nearly all the individual works in the
collection are in the public domain in the United States.  If an
individual work is in the public domain in the United States and you are
located in the United States, we do not claim a right to prevent you from
copying, distributing, performing, displaying or creating derivative
works based on the work as long as all references to Project Gutenberg
are removed.  Of course, we hope that you will support the Project
Gutenberg-tm mission of promoting free access to electronic works by
freely sharing Project Gutenberg-tm works in compliance with the terms of
this agreement for keeping the Project Gutenberg-tm name associated with
the work.  You can easily comply with the terms of this agreement by
keeping this work in the same format with its attached full Project
Gutenberg-tm License when you share it without charge with others.
This particular work is one of the few copyrighted individual works
included with the permission of the copyright holder.  Information on
the copyright owner for this particular work and the terms of use
imposed by the copyright holder on this work are set forth at the
beginning of this work.

1.D.  The copyright laws of the place where you are located also govern
what you can do with this work.  Copyright laws in most countries are in
a constant state of change.  If you are outside the United States, check
the laws of your country in addition to the terms of this agreement
before downloading, copying, displaying, performing, distributing or
creating derivative works based on this work or any other Project
Gutenberg-tm work.  The Foundation makes no representations concerning
the copyright status of any work in any country outside the United
States.

1.E.  Unless you have removed all references to Project Gutenberg:

1.E.1.  The following sentence, with active links to, or other immediate
access to, the full Project Gutenberg-tm License must appear prominently
whenever any copy of a Project Gutenberg-tm work (any work on which the
phrase "Project Gutenberg" appears, or with which the phrase "Project
Gutenberg" is associated) is accessed, displayed, performed, viewed,
copied or distributed:

This eBook is for the use of anyone anywhere at no cost and with
almost no restrictions whatsoever.  You may copy it, give it away or
re-use it under the terms of the Project Gutenberg License included
with this eBook or online at www.gutenberg.org

1.E.2.  If an individual Project Gutenberg-tm electronic work is derived
from the public domain (does not contain a notice indicating that it is
posted with permission of the copyright holder), the work can be copied
and distributed to anyone in the United States without paying any fees
or charges.  If you are redistributing or providing access to a work
with the phrase "Project Gutenberg" associated with or appearing on the
work, you must comply either with the requirements of paragraphs 1.E.1
through 1.E.7 or obtain permission for the use of the work and the
Project Gutenberg-tm trademark as set forth in paragraphs 1.E.8 or
1.E.9.

1.E.3.  If an individual Project Gutenberg-tm electronic work is posted
with the permission of the copyright holder, your use and distribution
must comply with both paragraphs 1.E.1 through 1.E.7 and any additional
terms imposed by the copyright holder.  Additional terms will be linked
to the Project Gutenberg-tm License for all works posted with the
permission of the copyright holder found at the beginning of this work.

1.E.4.  Do not unlink or detach or remove the full Project Gutenberg-tm
License terms from this work, or any files containing a part of this
work or any other work associated with Project Gutenberg-tm.

1.E.5.  Do not copy, display, perform, distribute or redistribute this
electronic work, or any part of this electronic work, without
prominently displaying the sentence set forth in paragraph 1.E.1 with
active links or immediate access to the full terms of the Project
Gutenberg-tm License.

1.E.6.  You may convert to and distribute this work in any binary,
compressed, marked up, nonproprietary or proprietary form, including any
word processing or hypertext form.  However, if you provide access to or
distribute copies of a Project Gutenberg-tm work in a format other than
"Plain Vanilla ASCII" or other format used in the official version
posted on the official Project Gutenberg-tm web site (www.gutenberg.org),
you must, at no additional cost, fee or expense to the user, provide a
copy, a means of exporting a copy, or a means of obtaining a copy upon
request, of the work in its original "Plain Vanilla ASCII" or other
form.  Any alternate format must include the full Project Gutenberg-tm
License as specified in paragraph 1.E.1.

1.E.7.  Do not charge a fee for access to, viewing, displaying,
performing, copying or distributing any Project Gutenberg-tm works
unless you comply with paragraph 1.E.8 or 1.E.9.

1.E.8.  You may charge a reasonable fee for copies of or providing
access to or distributing Project Gutenberg-tm electronic works provided
that

- You pay a royalty fee of 20% of the gross profits you derive from
     the use of Project Gutenberg-tm works calculated using the method
     you already use to calculate your applicable taxes.  The fee is
     owed to the owner of the Project Gutenberg-tm trademark, but he
     has agreed to donate royalties under this paragraph to the
     Project Gutenberg Literary Archive Foundation.  Royalty payments
     must be paid within 60 days following each date on which you
     prepare (or are legally required to prepare) your periodic tax
     returns.  Royalty payments should be clearly marked as such and
     sent to the Project Gutenberg Literary Archive Foundation at the
     address specified in Section 4, "Information about donations to
     the Project Gutenberg Literary Archive Foundation."

- You provide a full refund of any money paid by a user who notifies
     you in writing (or by e-mail) within 30 days of receipt that s/he
     does not agree to the terms of the full Project Gutenberg-tm
     License.  You must require such a user to return or
     destroy all copies of the works possessed in a physical medium
     and discontinue all use of and all access to other copies of
     Project Gutenberg-tm works.

- You provide, in accordance with paragraph 1.F.3, a full refund of any
     money paid for a work or a replacement copy, if a defect in the
     electronic work is discovered and reported to you within 90 days
     of receipt of the work.

- You comply with all other terms of this agreement for free
     distribution of Project Gutenberg-tm works.

1.E.9.  If you wish to charge a fee or distribute a Project Gutenberg-tm
electronic work or group of works on different terms than are set
forth in this agreement, you must obtain permission in writing from
both the Project Gutenberg Literary Archive Foundation and Michael
Hart, the owner of the Project Gutenberg-tm trademark.  Contact the
Foundation as set forth in Section 3 below.

1.F.

1.F.1.  Project Gutenberg volunteers and employees expend considerable
effort to identify, do copyright research on, transcribe and proofread
public domain works in creating the Project Gutenberg-tm
collection.  Despite these efforts, Project Gutenberg-tm electronic
works, and the medium on which they may be stored, may contain
"Defects," such as, but not limited to, incomplete, inaccurate or
corrupt data, transcription errors, a copyright or other intellectual
property infringement, a defective or damaged disk or other medium, a
computer virus, or computer codes that damage or cannot be read by
your equipment.

1.F.2.  LIMITED WARRANTY, DISCLAIMER OF DAMAGES - Except for the "Right
of Replacement or Refund" described in paragraph 1.F.3, the Project
Gutenberg Literary Archive Foundation, the owner of the Project
Gutenberg-tm trademark, and any other party distributing a Project
Gutenberg-tm electronic work under this agreement, disclaim all
liability to you for damages, costs and expenses, including legal
fees.  YOU AGREE THAT YOU HAVE NO REMEDIES FOR NEGLIGENCE, STRICT
LIABILITY, BREACH OF WARRANTY OR BREACH OF CONTRACT EXCEPT THOSE
PROVIDED IN PARAGRAPH F3.  YOU AGREE THAT THE FOUNDATION, THE
TRADEMARK OWNER, AND ANY DISTRIBUTOR UNDER THIS AGREEMENT WILL NOT BE
LIABLE TO YOU FOR ACTUAL, DIRECT, INDIRECT, CONSEQUENTIAL, PUNITIVE OR
INCIDENTAL DAMAGES EVEN IF YOU GIVE NOTICE OF THE POSSIBILITY OF SUCH
DAMAGE.

1.F.3.  LIMITED RIGHT OF REPLACEMENT OR REFUND - If you discover a
defect in this electronic work within 90 days of receiving it, you can
receive a refund of the money (if any) you paid for it by sending a
written explanation to the person you received the work from.  If you
received the work on a physical medium, you must return the medium with
your written explanation.  The person or entity that provided you with
the defective work may elect to provide a replacement copy in lieu of a
refund.  If you received the work electronically, the person or entity
providing it to you may choose to give you a second opportunity to
receive the work electronically in lieu of a refund.  If the second copy
is also defective, you may demand a refund in writing without further
opportunities to fix the problem.

1.F.4.  Except for the limited right of replacement or refund set forth
in paragraph 1.F.3, this work is provided to you 'AS-IS,' WITH NO OTHER
WARRANTIES OF ANY KIND, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO
WARRANTIES OF MERCHANTIBILITY OR FITNESS FOR ANY PURPOSE.

1.F.5.  Some states do not allow disclaimers of certain implied
warranties or the exclusion or limitation of certain types of damages.
If any disclaimer or limitation set forth in this agreement violates the
law of the state applicable to this agreement, the agreement shall be
interpreted to make the maximum disclaimer or limitation permitted by
the applicable state law.  The invalidity or unenforceability of any
provision of this agreement shall not void the remaining provisions.

1.F.6.  INDEMNITY - You agree to indemnify and hold the Foundation, the
trademark owner, any agent or employee of the Foundation, anyone
providing copies of Project Gutenberg-tm electronic works in accordance
with this agreement, and any volunteers associated with the production,
promotion and distribution of Project Gutenberg-tm electronic works,
harmless from all liability, costs and expenses, including legal fees,
that arise directly or indirectly from any of the following which you do
or cause to occur: (a) distribution of this or any Project Gutenberg-tm
work, (b) alteration, modification, or additions or deletions to any
Project Gutenberg-tm work, and (c) any Defect you cause.


Section  2.  Information about the Mission of Project Gutenberg-tm

Project Gutenberg-tm is synonymous with the free distribution of
electronic works in formats readable by the widest variety of computers
including obsolete, old, middle-aged and new computers.  It exists
because of the efforts of hundreds of volunteers and donations from
people in all walks of life.

Volunteers and financial support to provide volunteers with the
assistance they need, is critical to reaching Project Gutenberg-tm's
goals and ensuring that the Project Gutenberg-tm collection will
remain freely available for generations to come.  In 2001, the Project
Gutenberg Literary Archive Foundation was created to provide a secure
and permanent future for Project Gutenberg-tm and future generations.
To learn more about the Project Gutenberg Literary Archive Foundation
and how your efforts and donations can help, see Sections 3 and 4
and the Foundation web page at http://www.pglaf.org.


Section 3.  Information about the Project Gutenberg Literary Archive
Foundation

The Project Gutenberg Literary Archive Foundation is a non profit
501(c)(3) educational corporation organized under the laws of the
state of Mississippi and granted tax exempt status by the Internal
Revenue Service.  The Foundation's EIN or federal tax identification
number is 64-6221541.  Its 501(c)(3) letter is posted at
http://pglaf.org/fundraising.  Contributions to the Project Gutenberg
Literary Archive Foundation are tax deductible to the full extent
permitted by U.S. federal laws and your state's laws.

The Foundation's principal office is located at 4557 Melan Dr. S.
Fairbanks, AK, 99712., but its volunteers and employees are scattered
throughout numerous locations.  Its business office is located at
809 North 1500 West, Salt Lake City, UT 84116, (801) 596-1887, email
business@pglaf.org.  Email contact links and up to date contact
information can be found at the Foundation's web site and official
page at http://pglaf.org

For additional contact information:
     Dr. Gregory B. Newby
     Chief Executive and Director
     gbnewby@pglaf.org

Section 4.  Information about Donations to the Project Gutenberg
Literary Archive Foundation

Project Gutenberg-tm depends upon and cannot survive without wide
spread public support and donations to carry out its mission of
increasing the number of public domain and licensed works that can be
freely distributed in machine readable form accessible by the widest
array of equipment including outdated equipment.  Many small donations
($1 to $5,000) are particularly important to maintaining tax exempt
status with the IRS.

The Foundation is committed to complying with the laws regulating
charities and charitable donations in all 50 states of the United
States.  Compliance requirements are not uniform and it takes a
considerable effort, much paperwork and many fees to meet and keep up
with these requirements.  We do not solicit donations in locations
where we have not received written confirmation of compliance.  To
SEND DONATIONS or determine the status of compliance for any
particular state visit http://pglaf.org

While we cannot and do not solicit contributions from states where we
have not met the solicitation requirements, we know of no prohibition
against accepting unsolicited donations from donors in such states who
approach us with offers to donate.

International donations are gratefully accepted, but we cannot make
any statements concerning tax treatment of donations received from
outside the United States.  U.S. laws alone swamp our small staff.

Please check the Project Gutenberg Web pages for current donation
methods and addresses.  Donations are accepted in a number of other
ways including checks, online payments and credit card donations.
To donate, please visit: http://pglaf.org/donate


Section 5.  General Information About Project Gutenberg-tm electronic
works.

Professor Michael S. Hart is the originator of the Project Gutenberg-tm
concept of a library of electronic works that could be freely shared
with anyone.  For thirty years, he produced and distributed Project
Gutenberg-tm eBooks with only a loose network of volunteer support.

Project Gutenberg-tm eBooks are often created from several printed
editions, all of which are confirmed as Public Domain in the U.S.
unless a copyright notice is included.  Thus, we do not necessarily
keep eBooks in compliance with any particular paper edition.

Each eBook is in a subdirectory of the same number as the eBook's
eBook number, often in several formats including plain vanilla ASCII,
compressed (zipped), HTML and others.

Corrected EDITIONS of our eBooks replace the old file and take over
the old filename and etext number.  The replaced older file is renamed.
VERSIONS based on separate sources are treated as new eBooks receiving
new filenames and etext numbers.

Most people start at our Web site which has the main PG search facility:

http://www.gutenberg.org

This Web site includes information about Project Gutenberg-tm,
including how to make donations to the Project Gutenberg Literary
Archive Foundation, how to help produce our new eBooks, and how to
subscribe to our email newsletter to hear about new eBooks.

EBooks posted prior to November 2003, with eBook numbers BELOW #10000,
are filed in directories based on their release date.  If you want to
download any of these eBooks directly, rather than using the regular
search system you may utilize the following addresses and just
download by the etext year.

http://www.ibiblio.org/gutenberg/etext06

    (Or /etext 05, 04, 03, 02, 01, 00, 99,
     98, 97, 96, 95, 94, 93, 92, 92, 91 or 90)

EBooks posted since November 2003, with etext numbers OVER #10000, are
filed in a different way.  The year of a release date is no longer part
of the directory path.  The path is based on the etext number (which is
identical to the filename).  The path to the file is made up of single
digits corresponding to all but the last digit in the filename.  For
example an eBook of filename 10234 would be found at:

http://www.gutenberg.org/1/0/2/3/10234

or filename 24689 would be found at:
http://www.gutenberg.org/2/4/6/8/24689

An alternative method of locating eBooks:
http://www.gutenberg.org/GUTINDEX.ALL

*** END: FULL LICENSE ***
