CORRESPONDANCE INTERNET AVEC GUILLAUME CHAPRON

Guillaume Chapron est chercheur au laboratoire d’écologie du CNRS à Ecole Normale Supérieure d’ULM. (Laboratoire d’écologie, CNRS UMR 7625, Ecole Normale Supérieure, 46 rue d’Ulm, 75230 Paris cedex 05, France). C’est lui qui a modélisé l’évolution de la population de l’ours brun des Pyrénées pour sa thèse et nous avons pris contact pour discuter avec lui de cette modélisation. Cependant, il n’était plus en France donc la rencontre avec lui était impossible bien que son laboratoire soit à ULM. Il est actuellement en Suède mais a accepté de nous répondre par e-mail à toutes les questions que nous nous posions. (Guillaume Chapron, PhD Assistant Professor Grimsö Wildlife Research Station Swedish University of Agricultural Sciences SE - 73091 Riddarhyttan, Sweden). Voici son mail: gchapron@carnivoreconservation.org

LOGICIEL

1) Comment transcrivez-vous les différentes hypothèses de votre simulation, notamment celles concernant la biologie de l'ours (âge, période de reproduction...) ? Le logiciel ULM permet-il une saisie automatique ou doit-on entièrement programmer de nouveaux algorithmes pour simuler l'ours ?

ULM ressemble un peu à Matlab ou Maple pour des modèles démographiques. Vous pouvez le télécharger ici et regarder quelques exemples http://www.biologie.ens.fr/~legendre/ulm/ulm.html.

Donc, si vous êtes familier avec Matlab, il n'y a pas de saisie automatique: vous devez écrire votre code vous même. Par contre, les fonctions de base sont déjà définies, comme les lois binomiales, de Poisson et le générateur de nombre aléatoire. Donc il ne faut pas tout programmer comme en C, mais il faut quand mémé programmer quelque chose... Pour transcrire les hypothèses de simulations, je vais prendre un exemple simple: une espèce qui se reproduit a l'âge de 3 ans. Il y a différentes étapes.

On définit d'abord les classes présentes dans la population. Qui sont les individus présents? Dans notre cas, on peut définir 3 classes: n1, n2, n3. n3 sont les reproducteurs, âge >= 3 ans. n1 les petits, et n2 les "jeunes adultes" non reproducteurs.
On établit les transitions possibles entre ces classes au cours d'un pas de temps. Est-ce qu'un jeune adulte peut devenir petit? Non. Donc pas de transition. Est-ce qu'un jeune adulte peut devenir adulte? Oui.
On écrit ensuite les taux de réalisation de ces transitions. Exemple pour jeune adulte -> adulte. La probabilité de cette transition est la survie des jeunes adultes. Ces taux de transition ne sont pas toujours des probabilités, cas de la reproduction, ou un individu crée plusieurs petits (donc valeur > 1).La mère survit, donne naissance a des petits qui doivent aussi survivre.

On peut maintenant écrire le modèle en pseudo-code:

n3(t+1) = s3*n3(t) + s2*n2(t)

n2(t+1) = s1*n1(t)

n1(t+1) = n3(t)*s3*f*s0

ou s_ sont les survies et f est la fécondité.

Le modèle est ici déterministe. On peut l'écrire stochastiquement

n3(t+1) = Binom(s3,n3(t)) + Binom(s2,n2(t))

n2(t+1) = Binom(s1,n1(t))

n1(t+1) = Binom(s0,Poisson(f*Binom(s3,n3(t)))

Ensuite on simule plusieurs trajectoires, chacune est différente car la graine du générateur de nombre aléatoire change. Disons qu'on simule 1000 trajectoires qui durent 30 ans chacune. Parmi ces 1000 trajectoires, on compte celles qui sont éteintes au bout de 30 ans. S'il y en a N, alors la probabilité d'extinction est N/1000. Et on peut faire cela en simulant la réintroduction d'ours (c’est-à-dire en rajoutant des individus n3 par exemple) et on regarde l'effet sur la probabilité d'extinction.

2) J'ai téléchargé le logiciel et essayé quelques des modélisations proposées et notamment celles sur le Grizzli. Je suis très impressionné par sa rapidité et la diversité des modélisations. Pensez-vous que vous pourriez m'envoyer votre fichier sur l'ours des Pyrénées pour que je puisse à mon tour changer des paramètres pour voir ?

ULM est un logiciel très optimise pour ce genre de calculs, et donc les simulations sont très rapides. On m'a déjà demande plusieurs fois le code, mais j'ai écrit ce modèle en 2001, et ayant change plusieurs de machines (et d'emploi), je ne retrouve pas ce modèle...

SIMULATION

3) Est-ce une simulation à temps discret pour pouvoir prendre en compte les différentes périodes (accouplement, gestation, "hibernation"...) ou les probabilités de survie changent-elles en fonction de la saison (une analyse de Markov avec Matrice de Leslie comme j'ai cru le comprendre avec les schémas de votre article mais avec des probabilités variant au cours du temps) ?

C'est un temps discret. Le pas de temps est un an, donc je ne fais pas la différence entre les différentes périodes. On peut, mais cela demande de connaitre les valeurs de survies mensuelles, et comme c'est déjà difficile pour la survie annuelle, on évite...

Le diagramme dans mon article n'est pas une chaine de Markov, parce que la transition de fécondité n'est pas une probabilité. C'est plutôt un processus de branchement, même si le modèle démographique que j'ai construit est Markovien.

4) Quels sont les différents critères qui permettent de conclure sur le facteur qui influence le plus le taux de croissance ? Se base-t-on seulement sur l'élasticité calculée ? et dans ce cas, à partir de quel seuil peut-on dire qu'il y a une forte influence ? Ou est-ce simplement une question de relativité par rapport aux autres facteurs étudiés et l'on conclut que celui qui est le plus élevé a le plus d'influence ?

En fait on essaye de répondre a la question: comment être le plus efficace sur la démographie de l'ours. C'est-à-dire, quel paramètre faut-il modifier pour que lambda (taux de croissance) change le plus fortement? C'est exactement ce que nous donne l'élasticité, on cherche donc le paramètre avec la plus forte élasticité.

5) Je croyais que les simulations demandaient beaucoup plus de temps. Les fichiers que j'utilise ne semblent pas du tout refléter cette réalité. Est-ce un a priori totalement erroné ? Dans le livre de P. Coquillard et D. Hill, ils insistent aussi sur le fait que le programme ne doit pas être trop compliqué sous peine de perdre en temps de calcul.

Tout dépend du type de simulations et du langage. Le programme ULM est écrit en Pascal, un langage compilé donc rapide. Le compilateur est Delphi, et il produit des exécutables rapides. Par ailleurs ULM permet de simuler des modèles structurés en classe. C'est important de comprendre que dans ces modèles, tous les individus au sein d'une même classe ne peuvent pas être différencies. Donc en fait, l'état d'une classe est juste un nombre, et dans la mémoire de l'ordinateur, c'est vite manipule. Les modèles que je construits actuellement sont différents, car ils sont "individual-based". Cela veut dire que dans ces modèles, je peux suivre chaque individus, et ses attributs (âge, statut social, etc.). Ces simulations sont bien plus longues. En plus, j'utilise Objective C qui n'est pas le plus rapide des langages, mais c'est un bon compromis entre rapidité de calcul et facilite de développement. Dans ces modèles, je dois programmer tout a partir de zéro, à la différence de ULM.

6) J'avoue que je ne me rends pas compte du temps nécessaire à l'élaboration d'une telle simulation.

Cela dépend de votre expérience. Au début il me fallait du temps, maintenant je peux faire tout cela assez vite, car je réutilise des bouts de code. Le plus grand temps est en fait sur la question écologique elle même que sur la programmation (être sûr de programmer le modèle qui répond a la question posée, et aussi avoir une question intéressante).

7) Je me suis renseigné sur ce que sont des distributions binomiale et de Poisson. Dans votre modélisation, le taux de survie est traité comme une loi binomiale et la fécondité suit une loi de Poisson. Pourriez-vous m'expliquer ces choix ? C'est sûrement une hypothèse commune à de nombreuses simulations...tout comme les lois de distributions gaussiennes en physique...mais j'aimerais comprendre comment les biologistes ont choisi celle-ci plutôt qu'une autre.

Loi binomiale (ou de Bernoulli): On tire un nombre entre 0 et 1, si ce nombre est plus grand que la survie s, alors l'animal survit, autrement il meurt.

Loi de Poisson: donne un entier positif de moyenne m, cela correspond donc bien a ce qu'on attend d'une taille de portée.

8) Je commence à comprendre comment on s'y prend techniquement, j'aimerais avoir des détails plus pratiques sur ce qu'est la confection d'un modèle. Quels obstacles ? Quel environnement de travail ? C'est important pour moi de comprendre comment tout cela fonctionne. On a du mal à imaginer cela de l'extérieur.

L'obstacle principal est selon moi de bien connaitre le système à modéliser (et cela doit être vrai pour tout modèle, même en dehors de la biologie). Un modèle est une simplification de la réalité. Donc, quand on modélise, on essaye de garder d'un système que ce qui est le plus important dans la dynamique du système. Dans le cas de l'ours, je n'ai pas considère divers aspects, tels que la fluctuation de nourriture. J'ai considéré que ce n'était pas important POUR MA QUESTION. Si la question avait été la dynamique de la masse corporelle, alors j'aurais du considère ces fluctuations. Ensuite, une fois que le modèle est conceptuellement décrit, on le programme. Il faut bien connaitre le langage de programmation pour éviter des erreurs (exemple: division par 0), et des bugs plus difficiles a cerner dans le cas de modèles plus complexes. Actuellement, je travaille sur Mac, et j'utilise Xcode pour programmer (c'est le même logiciel pour faire des applications pour un iPhone). Si vous voulez apprendre un langage pour faire des simulations, des statistiques, etc., je vous conseille R (ou scilab) qui sont open-source et très bien. Pas le plus rapide, ni le plus flexible, mais pour débuter c'est vraiment très bien.

DONNEES

9) Avez-vous utilisé uniquement les données de l'ONCFS sur l'ours des Pyrénées ou synthétisé différents paquets de données notamment issues du programme de recherche sur l'ours brun en Scandinavie voire le grizzli car il appartient à la même lignée?

J'avais fait une synthèse des données sur l'ours bruns, parce qu'il n'y a pas de données solides sur la démographie des ours en France.

10) Est-ce que vous pourriez être plus précis quant à l'origine des données utilisées ? notamment celles dont vous avez utilisé une synthèse pour faire la biologie de l'ours. Me dire si ce sont des données issues de programmes internationaux ou seulement européen me suffira. Cela me permet de mieux délimiter la sphère des acteurs impliqués.

11) Données publiées à partir de différentes études sur l'ours, européennes si possibles, autrement US. Il y a une base de données sur http://www.carnivoreconservation.org que vous pouvez explorer.

12) Est-ce que les informations que vous avez tiré de cette simulation étaient accessibles à tous ou privées dans un premier temps ?

Tout était disponible dans la littérature publiée.

13) A-t-on accès aux données rapidement (j'ai lu que la NASA essayait de rassembler toutes les données internationales mais il doit bien exister un équivalent européen ?) ou doit-on contacter les chercheurs dans les différents laboratoires pour avoir leurs relevés ?

Je ne suis pas sur de bien comprendre la question. J'ai utilise des données publiées et eu quelques discussions avec mes co-auteurs spécialistes des ours.

14) J'ai bien lu vos transparents sur comment on modélise mais qu'en est-il techniquement. Est-ce que vous pourriez me raconter un peu comment tout cela s'est fait ?

Pour ULM, il faut juste créer un fichier texte, écrire le code, et ensuite faire tourner les simulations. Ensuite on analyse les résultats et on trace les graphes. C'est un papier assez "basique"... Celui sur les tigres m'a demande plus d'efforts.

INTERPRETATION DES RESULTATS

15) Vous avez choisi de faire différents scénarii qui correspondent à différentes probabilités de survie. Est-ce que ce choix vous a été imposé ou est-ce une convention commune à toutes les modélisations pour donner une fourchette de résultats et ainsi prévenir diverses remarques ?

Ce n'est pas un choix imposé, disons que c'était plutôt la façon la moins "dangereuse". L'idée était: comme on sait peu de chose sur les paramètres démographiques des ours (en France), nous allons traiter plusieurs cas. J'ai fait cette étude au début de ma thèse, aujourd'hui je ne ferais pas la même chose, mais j'essayerai de prendre des approches de simulations bayesiennes, pour "fitter" le modèle a une série temporelle et obtenir en retour des densités de probabilités.

VERIFICATION ET LA VALIDATION DE LA MODELISATION

16) Dans l'ouvrage de P. Coquillard et Dhillon un chapitre entier est consacré à la vérification et la validation du modèle. Ils proposent plusieurs façons de vérifier un programme : par confrontation (vérification par des experts indépendants), par répétitivité (comparaison avec d'autres modèles), statistiques (comparaison avec les mesures)... Comment cette étape-là a telle été traitée ? Le logiciel ULM a été validé pour d'autres espèces. Ceci le dispense t-il de ces vérifications ?

ULM a été valide, comme Malabo l'a été. Mais cela ne veut pas dire que mon modèle est correct. On peut écrire des programmes faux avec Matlab. Pour le valider, on fait des simulations types et on compare avec ce qui est connu des ours. Si par exemple, une simulation me donne un taux de croissance de 200%, alors je sais qu'il y a un problème. Si l'ensemble des variables ressemblent a ce qu'on attend d'une population d'ours, le modèle n'est pas complètement faux. Notez, qu'il n'y a pas de modèle correct, tous sont faux car étant des simplifications de systèmes tres complexes. J'ai un papier dans les Cr Biol sur le loup avec une figure qui illustre la validation du modèle (comparaison avec des populations existantes)

COMMANDE DE LA MODELISATION

17) Est-ce que l'on a "commandé" cette simulation ou avez-vous choisi entièrement ce sujet ?

Non, j'ai choisi ce sujet moi même.

18) A qui la simulation était-elle adressée et comment ces personnes-là utilisent-elles ces résultats ? Existe t-il une procédure à suivre dans ce type de cas ?

La simulation n'était pas adressée a des personnes en particulier. J'ai juste publie cet article, et ensuite je pense qu'il a servi d'arguments pour relâcher des ours, mais je n'ai pas été consulte sur la réintroduction et je n'ai pas pris part aux décisions.

19) Pourriez-vous m'indiquer ce qui vous a poussé à choisir ce sujet de thèse ? Il me semble qu'il s'inscrivait dans un programme de recherche européen european research training network modlife.

En fait, j'ai toujours été intéresse par la conservation des prédateurs, et (même si je suis vétérinaire de formation), j'aime aussi les maths. Donc c'était un peu naturel de faire une thèse sur la modélisation des populations de prédateurs. Le modlife était bien plus général et je n'étais pas (beaucoup) implique dedans.

REACTION DE LA COMMUNAUTE SCIENTIFIQUE

20) Lorsque vous publiez une étude suite à une modélisation, quel retour obtenez-vous ? La communauté scientifique vous contacte-t-elle pour vous donner son avis et quels choix elle aurait fait ou le travail effectué est publié et chacun l'utilise sans commenter ?

Je n'ai eu aucun retour a la fois de la part des décideurs politiques et des scientifiques. Je crois que c'est assez fréquent. Le papier est publie, et puis c'est tout, et je ne suis pas sur qu'il soit très utilise.

En particulier sur la modélisation de l'ours des Pyrénées, vous avez dit que maintenant vous ne programmeriez plus de la même façon. Vous a-t-on fait des remarques là dessus ou est-ce une simple autocritique après coup ?

Non, c'est en progressant dans mes travaux de recherche que j'ai vu différentes façons d'aborder le problème.

Haut de Page