Quelle est l’origine des langues indo-européennes ?

Par bien des aspects, les langues sont comme les espèces animales : certaines se ressemblent, d’autres pas, et ces similarités permettent de les grouper en familles. Parmi celles-ci, il en existe une particulièrement intéressante : la famille des langues dites indo-européennes.

La question de l’origine de ces langues indo-européennes agite depuis longtemps la communauté des linguistes. Elle a même été qualifiée de « problème le plus récalcitrant et pourtant le plus étudié de la linguistique historique » [1].

Un récent article de Science apporte des éléments nouveaux à cette question, mais fait également gonfler la polémique !

Les langues indo-européennes

Comme son nom l’indique, la famille des langues indo-européennes regroupe la plupart des langues parlées aujourd’hui en Europe, mais aussi l’hindi, le persan et le sanskrit, ou encore des langues mortes comme le latin ou le hittite.

Pour classer ces langues dans un même groupe, on se base sur leurs similarités concernant des mots du langage courant. Par exemple « mère » se dit « mother » en anglais, « mutter » en allemand, « mater » en latin, mais également « madar » en persan et « matr » en sanskrit.

Comme pour les espèces animales, si des langues se ressemblent et appartiennent à une même famille, c’est qu’elles ont une origine commune : bien avant l’invention de l’écriture, il aurait donc existé une langue primitive, l’indo-européen, dont il ne reste aujourd’hui aucune trace, mais dont descendraient toutes les langues indo-européennes actuelles. On ne sait évidemment presque rien de cette langue primitive, mais on imagine volontiers qu’en indo-européen, « mère » se disait avec un mot du genre « meter ».

D’où vient l’indo-européen ?

Si toutes les langues indo-européennes descendent d’une langue primitive commune, quel était donc le peuple qui parlait cette langue, où se situait-il et à quelle époque ? Pour essayer de répondre à cette question, on se base généralement sur des éléments de linguistique et d’archéologie. Il existe de nombreuses hypothèses quant à l’origine des langues indo-européennes, mais deux semblent les plus vraisemblables : l’hypothèse kourgane, et l’hypothèse anatolienne.

Selon l’hypothèse kourgane, l’indo-européen viendrait d’un peuple semi-nomade ayant vécu il y a environ 6000 à 7000 ans dans la steppe située au nord de la Mer Noire, aux environs de l’actuelle frontière entre la Russie et l’Ukraine. Dans ce scénario, ce peuple de guerriers et de cavaliers conquérants aurait entrepris de nombreuses migrations, permettant ainsi la diffusion de leur langue en Europe et en Asie.

Selon l’hypothèse anatolienne, l’indo-européen trouverait son origine en Anatolie (l’actuelle Turquie) il y a environ 8 à 10 000 ans, à l’époque de l’apparition de l’agriculture dans cette région. La langue se serait alors répandue dans toute l’Eurasie en même temps que la diffusion de l’agriculture.

Comme vous pouvez le constater, les deux hypothèses diffèrent radicalement quant à l’origine géographique, l’époque et le mode de diffusion de la langue indo-européenne primitive ! C’est actuellement l’hypothèse Kourgane qui est considérée comme la plus vraisemblable par les spécialistes, mais voyons comment ces dernières années, Quentin Aktinson et ses collaborateurs ont jeté le trouble avec des méthodes nouvelles inspirées de la biologie de l’évolution.

L’arbre des langues

Pour essayer d’en savoir plus sur l’origine commune des langues, on peut essayer de les regrouper sur un arbre, de la même manière qu’on le fait avec les espèces animales. C’est la méthode de la phylogénie.

Pour cela, on se base sur les similarités entre des mots des différentes langues, ce qu’on appelle des cognats. Comme nous l’avons vu, le mot « mère » est un cognat pour la plupart des langues indo-européennes. En recensant l’ensemble des cognats dans un groupe de langues, on peut alors placer les langues les unes par rapport aux autres, et identifier les cognats qui se sont différenciés d’une langue à l’autre; l’équivalent linguistique des mutations en génétique.

Faire un arbre des langues permet d’y voir un peu plus clair, mais ne nous dit pas grand chose sur l’origine commune de ces langues. Pour aller plus loin, il faut essayer d’ajouter la dimension temporelle, et essayer de comprendre à quel moment les différentes langues se sont séparées. Pour cela, on utilise le principe de la glottochronologie, inspiré de celui de l’horloge moléculaire en biologie de l’évolution.

L’horloge moléculaire, c’est ce qui permet à partir de l’analyse des mutations de l’ADN de dater approximativement la séparation de deux espèces animales (comme l’homme et le chimpanzé, voir mon billet sur Toumaï)

En linguistique, la glottochronologie permet de faire la même chose : pour cela on se base sur un taux moyen de mutation constaté sur les langues : on sait en gros que si deux langues se séparent à un moment donné, elles vont perdre 20% de leurs mots communs tous les 1000 ans. En comparant la quantité de similarité entre deux langues, on peut donc dater leur séparation.

En utilisant ce genre de méthode, Atkinson et Gray ont publié en 2003 une première bombe linguistique [2] : leur reconstitution de l’arbre des langues dans le temps montre que les langues indo-européennes auraient environ 9000 ans, favorisant ainsi l’hypothèse anatolienne sur l’hypothèse kourgane. Le résultat tiré de leur papier est représenté ci-dessus, avec une datation des principales séparations entre les groupes de langues.

L’origine géographique de l’indo-européen

Lors de la parution de ce papier, il semble que la communauté ait accueillit avec beaucoup de scepticisme ce nouveau résultat, obtenu avec des méthodes de la biologie de l’évolution, et donc peu familières des linguistes. Mais il y a un mois, les mêmes auteurs ont récidivé [3] en ajoutant cette fois un nouvel ingrédient : la modélisation géographique de l’évolution des langues.

Pour cela, ils ont utilisé une technique encore plus raffinée, inspirée de celles qu’on utilise pour suivre les épidémies. Ce genre de méthode, qui modélise à la fois les mutations des virus et leur propagation géographique, permet de remonter à l’origine d’une épidémie et à la souche initiale du virus, et de reconstituer l’histoire de ses mutations et de sa diffusion spatiale.

Atkinson et sa bande ont vu une analogie entre la diffusion et mutation d’un virus, et l’expansion géographique et la différenciation des langues indo-européennes. Avec un modèle de ce type et des données sur les cognates, l’histoire et la géographie des langues indo-européennes actuelles et disparues, ils ont ainsi pu estimer une probabilité de l’origine de l’indo-européen dans telle ou telle partie du monde. Le résultat est représenté ci-contre : plus il y a de rouge, plus il s’agit d’une origine probable.

Sur cette carte, la frontière jaune marque le territoire d’origine de l’indo-européen selon l’hypothèse anatolienne, et les frontières bleues selon deux variantes de l’hypothèse kourgane. Comme vous le voyez, cette technique pointe directement sur l’actuelle Turquie, c’est à dire l’hypothèse anatolienne d’une diffusion de l’indo-européen en même temps que l’expansion de l’agriculture. Il est vraisemblable que ce résultat obtenu avec une technique sophistiquée et non-conventionnelle, et allant à l’encontre de l’hypothèse dominante, va susciter de nombreux débats dans la communauté des linguistes !

Pour aller plus loin…

Bien qu’étant totalement ignorant en linguistique, je voudrais vous donner quelques éléments qui permettent d’éclairer le débat concernant les travaux d’Atkinson et ses collaborateurs. Pour commencer, il faut avoir en tête que la question de l’origine de la langue indo-européenne va au delà d’une simple question scientifique, pour prendre une dimension plus politique. La notion de peuple indo-européen est bien sûr à rapprocher du concept d’aryens. Par ailleurs, on ne s’étonnera pas d’apprendre que beaucoup de pays se verraient bien comme le berceau du peuple indo-européen, poussant parfois les nationalistes de tous poils à défendre des hypothèses n’ayant que peu ou pas de base scientifique.

Revenons au travail d’Atkinson et sa bande. Tout d’abord il faut comprendre les raisons pour lesquelles l’hypothèse Kourgane est actuellement celle qui a la faveur des spécialistes. Elle se base en effet sur des preuves linguistiques mais aussi archélogiques, montrant qu’il existait bien dans la steppe pontine un peuple de cavaliers semi-nomades ayant conquis de nombreux territoires. D’autre part la datation de l’hypothèse kourgane repose sur un argument a priori imbattable : à partir des similarités du mot "roue" dans les différentes langues indo-européennes, on a reconstitué une forme approchée de ce mot en indo-européen primitif : "kwe-kwlo", dont dériveraient notamment les mots "wheel" et "cyclos". Mais si il existait un mot pour dire "roue" en indo-européen primitif, c’est que cette langue date forcément d’après l’invention de la roue ! Ce qui rend l’hypothèse anatolienne peu probable.

Une critique que l’on peut forcément faire au travail que j’ai présenté dans ce billet : alors que l’hypothèse kourgane repose sur des arguments compréhensibles par n’importe qui (archéologie, mots en commun), le travail d’Atkinson repose sur des modèles sophistiqués "Markov Chain Monte Carlo", dont très peu de gens comprennent les principes, sans parler des détails. D’ailleurs j’avoue être un peu surpris de voir que dans son arbre des langues, le français serait plus proche de l’hindi que du grec. Mais après tout, pourquoi pas ? Il faut dire que Quentin Atkinson ne manque pas de réponse aux critiques qui lui sont adressées, il a même monté un site internet dédié à ce récent papier et à la controverse qui l’entoure.

Pour ma part, je ne peux pas m’empêcher d’éprouver de la sympathie pour ce brillant jeune chercheur (il doit avoir mon âge, et déjà 3 "Science" et 2 "Nature" au compteur), qui ose s’attaquer à une question prestigieuse avec des outils nouveaux. J’avais d’ailleurs bien aimé un autre de ses papiers dont j’avais tiré un billet sur l’origine africaine du langage. Mais quand je regarde la page correspondante à ce papier dans Science, je vois qu’il s’est pris une tétrachiée de "Comments".

Références et billets connexes :

[1] Jared Diamond and Peter Bellwood, Farmers and Their Languages: The First Expansions, Science 300 5619 (2003)

[2] Russell D. Gray & Quentin D. Atkinson, Language-tree divergence times support the Anatolian theory of Indo-European origin, Nature 426, 435-439 (2003)

[3] R. Bouckaert et al., Mapping the origins and expansion of the Indo-European language family. Science, 337:957-960 (2012)

De Lucy à Toumaï qui aborde notamment la question de l’horloge moléculaire et de la datation de la séparation homme-chimpanzé.

Out of Africa, pour le langage aussi, au sujet d’un autre papier d’Atkinson sur l’origine africaine du langage.

Une bonne revue du papier d’Atkinson & co dans le New York Times

Chez M.Colin, une explication des méthodes de la phylogénie

Le billet de Taupo sur SSAFT qui m’a fait comprendre ce qu’est l’horloge moléculaire

About these ads

22 réponses à Quelle est l’origine des langues indo-européennes ?

  1. Ashokan dit :

    La plupart des langues du monde ont une origine commune très récente car elles partagent le mot "computer"… (sauf le village gaulois évidemment)
    Je veux dire par là que le partage du mot "roue" est peut-être lié à la diffusion de l’invention pas à la diffusion des peuples.

    • Oui c’est exactement la réponse que fait Atkinson. Lors de la diffusion d’une technologie nouvelle (comme la roue), il est vraisemblable que le mot servant à la designer diffuse également. Mais notons quand même que ça n’est pas si trivial que ça, surtout il y a 6000 ans !

  2. Nans dit :

    Cavalli-Sforza hésitait entre les 2 origines, et justement il préconisait la modelisation et la diffusion des épidémies…Atkinson l’a fait, donc.

  3. Garp dit :

    Très intéressant. J’apporterais une nuance sur la référence aux aryens. Il y a de tout derrière cette référence, et notamment des idées de pureté raciale, alors que justement l’histoire des langues montre que la notion de pureté n’est qu’un fantasme.

  4. Flavien dit :

    Pour aller dans le sens d’Ashokan, je trouve l’argument de la roue un peu douteux… En effet, la langue (meme ancienne) absorbe les nouvelles inventions dans son vocabulaire donc ca me semble pas dingo comme argument.
    A la lecture de ton papier, je me suis fait une autre refelxion. La ou la these anatolienne me semble plus a meme de se propager, c’est surtout par l’hypothese de l’agriculture. J’imagine qu’a cette epoque un peuple qui arrive avec tout un univers de techniques, d’outils, d’instructions me parait legitimement favori dans la compet’ pour "imposer" sa langue et son vocabulaire… Enfin c’est juste une reflexion.
    Pour la forme, j’aime bien son approche du probleme et clairement dans sa communaute, ca a du faire bizarre.

  5. [...] Par bien des aspects, les langues sont comme les espèces animales : certaines se ressemblent, d’autres pas, et ces similarités permettent de les grouper en familles.  [...]

  6. [...] Par bien des aspects, les langues sont comme les espèces animales : certaines se ressemblent, d’autres pas, et ces similarités permettent de les grouper en familles. Parmi celles-ci, il en ex…  [...]

  7. le bLoug dit :

    Bonjour,
    pour apporter un éclairage complémentaire: pour les auteurs, les steppes et l’Anatolie peuvent se combiner historiquement ; mais le modèle global reste à écrire, avec notamment une question-clé: comment se fait la diffusion (on voit des diffusions linguistiques dans des civilisations centralisées et dirigistes, ce n’est pas le cas des sociétés agricoles naissantes) ; les linguistes campent de toute façon sur leurs hypothèses purement linguistiques ; il y a aussi les tenants du modèle en réseau VS les modèles arborescents, très réducteurs, et derrière tout ça la question du peuple originel qui reste hypothétique…

  8. Dubitatif dit :

    Bonjour,

    J’apprécie et lis depuis longtemps votre blog, et je me permets d’intervenir puisque le sujet me touche de près (je n’avais malheureusement pas eu le temps de le faire la dernière fois). Je suis Docteur en Sciences du langage, aujourd’hui Maître de conférences ; je suis spécialiste de la discipline au sens large, mais pas du tout – je le précise – de linguistique historique, le sujet qui vous occupe. Je ne m’étendrai en conséquence pas sur le fond (voir les liens ci-dessous, écrit par une chercheure nettement plus compétente que moi sur ce point), mais m’autoriserai à donner mon sentiment sur cette histoire.

    [mode 'vexé' on] Je tenais avant tout à dire que, contrairement à ce que vous semblez indiquer, la plupart de mes collègues n’ont aucune opposition de principe à l’introduction (i) de nouvelles technologies, (ii) d’emprunts à d’autres sciences, (iii) et/ou de regards neufs sur les travaux que nous menons – beaucoup les recherchent même avidement.
    Nous n’avons par ailleurs pas tous peur des techniques "sophistiquées", je vous rassure (et je vous trouve un peu audacieux de supposer que les linguistes ne "comprennent rien" aux méthodes utilisées par nos amis). Notre discipline comporte certes, comme les autres, son lot de vieux ronchons réacs allergiques à la nouveauté, mais la majorité d’entre nous souhaite juste comprendre ce qui se passe, ou en l’occurrence, ce qui s’est passé. [mode 'vexé' off - je ne boude plus, ça y est :o) ]

    Globalement, de ce que j’entends autour de moi, les spécialistes de linguistique historique ne reprochent pas à Atkinson la méthode utilisée, mais le fait qu’il l’applique sur des prémisses qui sont fausses combinée au fait qu’il fait table rase des travaux menés par les linguistes ces dernières décennies (ce n’est pas qu’une question d’ego ; beaucoup de travail a été fait, et tout ne peut être jeté à la poubelle). La glottochronologie est utilisée par les linguistes depuis un moment déjà (Swadesh, qui en fût un pionnier, est mort en 67), et l’on sait depuis quelques décennies qu’elle ne suffit pas. Les emprunts, la dimension culturelle des langues et nombre d’autres choses font que l’on doit étudier beaucoup d’autres points que la seule similarité lexicale – propriétés phonologiques, morphologiques, morphophonologiques, syntaxiques, etc. – si l’on souhaite aboutir à un résultat cohérent. C’est assez bien et simplement expliqué dans la réponse suivante à l’article dont nous parlons :

    http://geocurrents.info/cultural-geography/linguistic-geography/the-malformed-language-tree-of-bouckaert-and-his-colleagues

    (je conseille d’ailleurs aux personnes intéressées de lire les autres ‘réponses’ de A. Pereltsvaig sur le même site : http://geocurrents.info/cultural-geography/linguistic-geography/wheel-vocabulary-puts-a-spoke-in-bouckaert-et-al-s-wheel ; http://geocurrents.info/cultural-geography/linguistic-geography/absolute-dating-and-the-romance-problems-on-the-bouckaertatkinson-model)

    Le bon côté des papiers d’Atkinson, à mon sens, est qu’ils permettent de rappeler aux spécialistes de la linguistique historique qu’ils se trompent de lunette(s) depuis quelque temps. La linguistique historique est aujourd’hui victime d’une sur-spécialisation (méthodes particulières, langues particulières, époques particulières) qui fait que l’on a perdu de vue l’image globale que nous cherchons aussi. Ses membres ne se parlent pas assez, et ne prennent pas assez le temps de parler aux autres (linguistes / chercheurs non-spécialistes). Un coup de pied dans la fourmilière peut, sur ce point, faire du bien.
    Je suis plus réservé que vous sur le chercheur, ceci dit. J’apprécie son enthousiasme et son ambition, mais désapprouve ses méthodes… brutales, et le fait qu’il ne prenne manifestement pas le temps de connaître les sujets sur lesquels il travaille. Je sais que je suis loin d’être objectif, mais j’ai toujours le sentiment en le lisant qu’il jette le bébé avec l’eau du bain. Son article sur l’origine africaine du langage, plus proche de mes préoccupations, m’a hérissé le poil.
    Mais j’en veux surtout aux revues dans lesquelles il publie. Il n’y a pas de véritable linguiste dans les comités éditoriaux de Science et Nature, et je crains qu’ils ne sachent pas à qui s’adresser pour l’évaluation de ce type de travaux. Je n’irais pas jusqu’à dire qu’il y a une forme de mépris pour la science dite "molle" que je pratique (mépris que je retrouve dans beaucoup de commentaires ici ou là sur le net), mais une méconnaissance, certainement. Nous avons notre part de responsabilité sur ce point (nous n’avons pas lancé assez de collaborations avec les autres disciplines, et celui qui parle le plus souvent en notre nom – Claude Hagège – ne reflète en rien les opinions et méthodes de la majorité d’entre nous), mais je reste persuadé qu’elle est partagée.

    • Merci pour ce long commentaire éclairé de l’intérieur !

      [vexé "on" aussi :-) ]
      Je suis désolé si mon texte a laissé sous-entendre que "les linguistes ne comprennent rien aux méthodes" ! Je viens de me relire attentivement, et je ne crois pas avoir écrit une telle chose. J’ai en revanche écrit que *peu de gens* comprennent les détails des modèles "MCMC"; et dans ma phrase je ne vise pas les linguistes en particulier :-)
      [vexe "off"]

      Ce que je voulais faire ressortir, c’est cet argument (que j’ai trouvé dans le papier du New York Times) que la méthode d’Atkinson n’est pas très "transparente". Si on veut se convaincre que c’est correct, il faut vraiment se mettre les mains dedans (en gros : reconstruire le modèle et le refaire tourner sur les mêmes données). Le problème me semble-t-il n’est donc pas tant la sophistication de la méthode, mais l’opacité qui en découle.

      Au sujet du conservatisme, je vous fais confiance si vous me dites qu’en sciences du langage, la grande majorité des chercheurs sont ouverts à la nouveauté dans les méthodes !

      PS : Pour ma part, j’adore les sciences "molles" et vous pouvez constater qu’elles tiennent une bonne place dans ce blog, si vous avez des idées de sujets à traiter dans le domaine des sciences du langage, je suis preneur !

  9. Thierry Luton dit :

    Cette étude est passionnante, et en tant que biologiste je trouve les méthodes utilisées pertinentes.
    J’aurais deux remarques à faire.
    - La localisation possible de l’origine des langues indo-européennes en Anatolie me rappelle que c’est dans cette zone que la bible situe le nouveau départ de l’Humanité après le déluge (Mont Ararat). Amusante coïncidence, non ?
    - Il reste le problème toujours insoluble de la langue basque.

  10. Merci pour ce papier très intéressant!

    En le lisant, je me suis demandé si certains linguistes avaient poussé l’importation de concepts évolutionnistes jusqu’à supposer un mécanisme sélectionniste propre aux langues. Est-ce que certains mots « survivent » en fonction de leur adaptation au milieu culturel dans lequel ils sont utilisés ? Les langues ont-elles leur évolution propre, ou est-ce qu’on considère, à la façon de Marvin Harris que la superstructure (culture) évolue sur la base de l’infrastructure (moyens de production et de reproduction) ? Est-ce qu’on invoque en linguistique une sélection multi-niveaux, ou est-ce qu’on considère une sélection de base qui entraîne tout le reste avec elle ? L’histoire de la roue plaiderait en faveur de cette seconde hypothèse…

  11. KRAJEWSKA ALEKSANDRA dit :

    L’argument du mot "roue" ne tient pas la route car, dans beaucoup de langues, le mot qui désigne cet objet objet désigne aussi sa forme géométrique. En polonais, par exemple, le mot "kolo" (lire l barré comme W anglais) décrit aussi bien l’objet "roue" et que la forme circulaire en général. Donc, la similitude vient de la forme (très ancienne) et non de la fonction de l’objet.

  12. [...] Quelle est l’origine des langues indo-européennes ? | Science étonnante [...]

  13. [...] Quelle est l’origine des langues indo-européennes ? [...]

  14. […] Quelle est l’origine des langues indo-européennes ? […]

  15. fdelaunay dit :

    Évidemment, la question des soi-disant Aryens reste sous-jacente à tous ces travaux. Le poison a été inoculé à la fin du XIXe et début du XXème par l’archéologue allemand Kossina, créateur de "l’archéologie de peuplement", en reprenant la découverte de Franz Bopp, près d’un siècle plus tôt (la "parenté" de toutes ces langues), à travers le filtre des théories raciales de Gobineau, notamment. Les idéologues nazis, Rosenberg et Himmler, se sont précipités sur cette fausse science et ont soutenu le développement incroyable de l’archéologie allemande pendant la guerre. Est apparue une figure curieuse de "soldat-chercheur".
    Sur ce point, et pour lever ce souci pesant de la référence au nazisme dès qu’on parle d’indo-européens, je conseille fortement le livre de Laurent Olivier, Nos ancêtres les Germains, éd. Tallandier, qui fait un tour définitif de la question du point de vue de l’archéologie. Il a le mérite, en particulier, de montrer qu’un secteur scientifique très en avance dans les techniques utilisées (c’était le cas de l’archéologie allemande dans les années 30) peut, dans le même temps, se dévoyer dans les aberrations interprétatives les plus tragiques. Ce n’est pas inutile, épistémologiquement parlant.

  16. […] Quelle est l’origine des langues indo-européennes : un autre billet sur une pratique culturelle dont l’évolution nous renseigne sur notre histoire récente […]

  17. […] Par bien des aspects, les langues sont comme les espèces animales : certaines se ressemblent, d'autres pas, et ces similarités permettent de les grouper en familles. Parmi celles-ci, il en existe u…  […]

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

Suivre

Recevez les nouvelles publications par mail.

Joignez-vous à 3  910 followers

%d bloggers like this: