Comprendre les concepts fondamentaux de la modélisation, les différents modèles qui en découlent ainsi que les théories de vérification et de validation

Cet article a été réalisé suite à la lecture d’ouvrages sur la modélisation et ne constitue pas la recopie d’un cours existant.

P. Coquillard et D. Hill, Modélisation et simulation d’écosystèmes
G. Chapron, Démographie des populations (document PDF)
C. Bertelle, Maîtrise de biologie université du havre, La modélisation en biologie des populations (document PDF)
David Laessen, MC ENS, équipe Eco-évolution Mathématique et Régis Ferrière, PR ENS, Dynamique des systèmes et écologie évolutive, Densité dépendance

Introduction

Un système ouvert interagit avec son environnement. Il permet des transferts énergie/matière et la formation d’organisations émergentes structurantes.

Un système fermé, à la différence est coupé du monde extérieur, sans émergence dynamique.

Un système naturel est par nature ouvert. Définir des limites à un système constitue une approximation. On est contraint de modéliser un système fermé.

Un premier dilemme se pose pour le scientifique :

Comment choisir les limites d’un système de telle manière que celui-ci puisse être considéré comme fermé ? (au moins sur un certain intervalle de temps)

Comment choisir un niveau d’abstraction tel que le comportement collectif rende compte des activités industrielles ?

Definitions

Système

Etat d’un système

C’est la description de l’ensemble des entités, attributs et acteurs à l’instant t.

Il existe deux types d’acteurs :

Les acteurs exogènes : ils agissent de l’extérieur.
Les acteurs endogènes : ce sont des interactions internes liées au feed-back (le système réagit à l’action des acteurs et cela détermine à son tour le comportement des acteurs endogènes).

Modèle

Un modèle est une abstraction qui simplifie le système réel étudié.

L’observateur est satisfait dès que le modèle colle à la réalité mais que nous apprend t-il ? (problème de limites d’interprétation du modèle)

Popper (1973) donnait les caractéristiques suivantes au modèle :

Caractère de ressemblance au réel
Une simplification du réel
Une idéalisation du réel

Ainsi, un modèle doit reproduire le mieux possible en fonction des objectifs. Il faut donc avoir conscience qu’un modèle n’est construit que pour répondre à un nombre limité de questions. Les extensions de certains modèles sont donc très hasardeuses et ne peuvent alors pas prétendre à une prédiction de la réalité.

Simulation

Choix méthodologiques

Biocénose : Assemblage de communautés d’espèces

Biotope : Aire géographique de dimension variable en fonction des positions constantes ou cycliques des espèces constituant la biocénose

Le pas de temps est celui des évènements pris en compte dans la modélisation et intervenant le plus fréquemment dans le système réel.

Concepts fondamentaux

Différents types de modélisation

Il existe 3 types de modélisation :

Les modèles analytiques
Les modèles purement stochastiques
La modélisation par simulation

Les modèles analytiques sont déterministes et continus. L’avenir est donc prévu de manière exacte par des équations analytiques. Ils ne prennent pas en compte la répartition spatiale ni les interactions à distance. Les modèles purement stochastiques font appel aux probabilités. Le modèle crée est indépendant du temps et de l’espace. Il fait appel à l’analyse de Markov et aux matrices de Leslie dans la plupart des cas. La modélisation par simulation est celle qui permet de prendre en compte le plus de paramètres et est donc la plus aboutie. Elle fait appel à la fois à des modèles déterministes et stochastiques.

Ajustement des données

On a une idée préconçue de la manière dont cela fonctionne : modèle théorique connu
Pas de modèle théorique : établir le modèle avec des équations différentielles
Données : équation descriptive (régression polynomiale)

On peut par exemple ajuster les données à une loi de distribution gaussienne:

Avec µ : moyenne, s : écart type et y : densité de probabilité.

L’approche objet

Les modèles biologiques empruntent au langage informatique toutes les notions de classe, de sous-classe, d’héritage, de méthodes, d’attributs et de polymorphisme.

Des conventions d’écriture ont été établies pour permettre aux informaticiens et aux biologistes de communiquer plus facilement. Le formalisme utilisé est le H2PO.

L’animal est une classe dont un des attributs est la tête.

Le corps est une sous-classe dont les attributs sont pattes, abdomen et thorax, queue.

Les méthodes sont des fonctions qui permettent d’interagir avec les différentes classes et les attributs de celles-ci : la fonction « manger », « boire », « naître », « mourir »…

« Animal » peut être une classe qui hérite de la classe « être vivant » et obtient donc les attributs de « être vivant » comme ses méthodes « manger » et « boire ».

2,4 signifie que l’animal peut posséder 2 à 4 pattes. 0,1 signifie que l’animal peut avoir une queue ou non.

Conception de plans d’expérience (protocoles expérimentaux)

Variation des facteurs

Il existe trois approches pour faire varier les facteurs :

Variation d’un seul facteur à la fois
Variation de tous les facteurs dans le temps
Variation concomitantes de certains facteurs : c’est la façon la plus efficace pour déterminer les interactions inter-factorielles (Kleijiden, 1987)

Le problème du warm-up

C’est le problème de montée en charge : phase transitoire initiale.

Avant de procéder à l’expérience et l’analyse des résultats, il faut considérer qu’il y a une nécessité d’indépendance des réponses.

Il existe trois approches :

Initialiser le modèle avec des conditions représentant un état actif et stable (à l’équilibre)
Eliminer les n premiers pas dans la collecte des statistiques
Réduire les effets transitoires en effectuant la simulation sur des temps suffisamment longs

Modèles déterministes

Les modèles déterministes s’appuient sur un formalisme mathématique pur. Les équations permettent une description précise de la trajectoire. Il n’y a pas d’aléatoire.

Les modèles analytiques sont purement continus (dans le temps et l’espace) et déterministes. Ils s’appuient sur la résolution d’équations différentielles.

modèle simple : modèle logistique

Le modèle présenté est issu des travaux du mathématicien belge Verhust (1838).

Soit r le taux de croissance d’une population. Alors:

D’où : Xn+1= Xn (1+r) et Xn=X0(1+r)n

Cependant, la population ne se stabilise pas. On pose donc r’=r-CXn. Ainsi quand la population augmente de trop alors on a un effet stabilisateur qui fait que la fécondité diminue.

Si la population se stabilise à K alors Xn+1=Xn=K.

Suivant les valeurs de r (et le pas choisi pour n), il peut y avoir stabilisation ou non voire comportement chaotique (mais déterministe).

Les principaux défauts de ce modèle sont les suivants :

Tous les individus sont reproducteurs
Paramètre limite K constant alors qu’il dépend d’un processus de compétition entre espèces
Le fait que n’est vrai qu’au sein d’une population de croissance exponentielle.

Modèle simple : modèle proie-prédateur

Le modèle décrit est le cas d’école du modèle de Lofka (1925)-Volterra (1926).

C’est un modèle régit par le système de deux équations suivantes :

r : taux de croissance de la population des proies
g : taux d’efficacité de la prédation des individus Y sur X
e : coefficient de conversion : nombre de jeunes prédateurs générés par proie capturée
m : taux de mortalité des prédateurs

Attention :

s’il n’y a plus de prédateurs, le modèle prévoie une croissance exponentielle des proies alors qu’elle est aussi régulée par les ressources.
g dépend du nombre de proies : g(X)

On a ainsi un nouveau système d’équations :

On peut déterminer g(X) en divisant la journée en différentes phases :

s/X correspond au temps de recherche des proies
h est le temps moyen nécessaire pour attraper une proie
u correspond aux autres occupations

En posant :

On a :

D’où :

Le degré de mimétisme des proies est non constant dans le temps : selon la saison, les proies sont plus ou moins faciles à rechercher. Donc s varie avec une période de l’année.

On peut donc réaliser le modèle avec r, k, a, e, m constants et

Pour e=0, on a déjà un comportement complexe du système :

bifurcation supercritique de Hopf pour la valeur : c’est une évolution critique cyclique de période
Bifurcation transcritique pour . Si b0 est strictement supérieur à ce rapport, alors on a extinction des prédateurs quelles que soient X0 et Y0
Entre ces 2 valeurs, on a une évolution vers un état stationnaire

Mettre le programme java à cet endroit

Modèles à compartiments

Ils ne s’intéressent pas aux individus mais aux flux, aux transferts.

Le concept de compartiments intervient dès que l’on cherche à effectuer des bilans nets à propos des échanges d’une catégorie d’individus.

Exemple d’une chaîne trophique

Simulation discrète : aspects techniques

Le temps de calcul est très grand devant le temps de résolution mathématique des équations. Si les équations sont très compliquées alors la modélisation discrète permet une description pas à pas avec le temps du fonctionnement du système sous forme d’un algorithme exécutable sur un ordinateur.

Simulation de Monte-Carlo (Morgenhaler 1961, Hammersley, 1964)

La méthode de Monte-Carlo utilise un générateur de nombre aléatoires.

Prenons un exemple :

Pour estimer une surface on peut tirer un nombre aléatoire de points et on compte le nombre de points dessus et dessous la courbe. On peut alors estimer la surface par :

gestion du temps

Le temps est géré soit par une horloge (mais il faut faire attention au pas de temps employé) soit par des évènements (chaque évènement est stocké dans l échéancier avec sa date d’occurrence, le type d’évènement et l’activité de simulation associée).

Noyaux de synchronisation

Physiquement, il est impossible dans une machine séquentielle d’effectuer deux évènements à la fois.

Il existe quatre approches :

L’approche évènement : on ordonne les évènements dans un échéancier suivant leurs dates absolues d’arrivée dans le temps virtuel.
L’approche processus : sélection d’objets dynamiques qui agissent et interagissent au sein et avec les entités ou objets statiques où seront décrits les processus du système.
Le processus du modèle est rarement représenté par des sous programmes car ils ont des traitements associés qui doivent être effectués en parallèle dans le temps virtuel.

Il faut donc disposer de coroutines :
- processeur en temps limité pour chaque programme
- plusieurs processeurs qui gèrent chacun un programme
- plusieurs ordinateurs en parallèle
Approche activité :
- Gestion du temps
- Scrutation des activités : condition pour déclencher une activité et opération liée à l’activité
- L’approche 3 phases :

Sommaire

Comprendre les concepts fondamentaux de la modélisation, les différents modèles qui en découlent ainsi que les théories de vérification et de validation

Introduction

Definitions

Système

Etat d’un système

Modèle

Simulation

Choix méthodologiques

Concepts fondamentaux

Différents types de modélisation

Ajustement des données

L’approche objet

Conception de plans d’expérience (protocoles expérimentaux)

Variation des facteurs

Le problème du warm-up

Modèles déterministes

modèle simple : modèle logistique

Modèle simple : modèle proie-prédateur

Modèles à compartiments

Exemple d’une chaîne trophique

Simulation discrète : aspects techniques

Simulation de Monte-Carlo (Morgenhaler 1961, Hammersley, 1964)

gestion du temps

Noyaux de synchronisation

Vérification et validation des modèles

Introduction

Cadres expérimentaux

Vérification des programmes de simulation

Validation des modèles et des résultats