Sommaire

  1. Introduction
    1. Définitions
    2. Choix méthodologiques
  2. Concepts fondamentaux
    1. Différents types de modélisation
    2. L’ajustement des données
    3. L’approche objet
    4. Conception de plans d’expérience
  3. Modèles déterministes
    1. Modèle simple : modèle logistique
    2. Modèle simple : modèle proie-prédateur
    3. Modèle à compartiments
  4. Simulation discrète : aspects techniques
    1. Simulation de Monte Carlo
    2. Gestion du temps
    3. Noyaux de synchronisation
  5. Vérification et validation des modèles de simulation

Comprendre les concepts fondamentaux de la modélisation, les différents modèles qui en découlent ainsi que les théories de vérification et de validation

Cet article a été réalisé suite à la lecture d’ouvrages sur la modélisation et ne constitue pas la recopie d’un cours existant.

Introduction

Un système ouvert interagit avec son environnement. Il permet des transferts énergie/matière et la formation d’organisations émergentes structurantes.

Un système fermé, à la différence est coupé du monde extérieur, sans émergence dynamique.

Un système naturel est par nature ouvert. Définir des limites à un système constitue une approximation. On est contraint de modéliser un système fermé.

Un premier dilemme se pose pour le scientifique :

Comment choisir les limites d’un système de telle manière que celui-ci puisse être considéré comme fermé ? (au moins sur un certain intervalle de temps)

Comment choisir un niveau d’abstraction tel que le comportement collectif rende compte des activités industrielles ?

Definitions

Système

Etat d’un système

C’est la description de l’ensemble des entités, attributs et acteurs à l’instant t.

Il existe deux types d’acteurs :

Modèle

Un modèle est une abstraction qui simplifie le système réel étudié.

L’observateur est satisfait dès que le modèle colle à la réalité mais que nous apprend t-il ? (problème de limites d’interprétation du modèle)

Popper (1973) donnait les caractéristiques suivantes au modèle :

Ainsi, un modèle doit reproduire le mieux possible en fonction des objectifs. Il faut donc avoir conscience qu’un modèle n’est construit que pour répondre à un nombre limité de questions. Les extensions de certains modèles sont donc très hasardeuses et ne peuvent alors pas prétendre à une prédiction de la réalité.

Simulation

Choix méthodologiques

Biocénose : Assemblage de communautés d’espèces

Biotope : Aire géographique de dimension variable en fonction des positions constantes ou cycliques des espèces constituant la biocénose

Le pas de temps est celui des évènements pris en compte dans la modélisation et intervenant le plus fréquemment dans le système réel.

Concepts fondamentaux

Différents types de modélisation

Il existe 3 types de modélisation :

Les modèles analytiques sont déterministes et continus. L’avenir est donc prévu de manière exacte par des équations analytiques. Ils ne prennent pas en compte la répartition spatiale ni les interactions à distance. Les modèles purement stochastiques font appel aux probabilités. Le modèle crée est indépendant du temps et de l’espace. Il fait appel à l’analyse de Markov et aux matrices de Leslie dans la plupart des cas. La modélisation par simulation est celle qui permet de prendre en compte le plus de paramètres et est donc la plus aboutie. Elle fait appel à la fois à des modèles déterministes et stochastiques.

Ajustement des données

*
  1. On a une idée préconçue de la manière dont cela fonctionne : modèle théorique connu
  2. Pas de modèle théorique : établir le modèle avec des équations différentielles
  3. Données : équation descriptive (régression polynomiale)

On peut par exemple ajuster les données à une loi de distribution gaussienne:

Avec µ : moyenne, s : écart type et y : densité de probabilité.

L’approche objet

Les modèles biologiques empruntent au langage informatique toutes les notions de classe, de sous-classe, d’héritage, de méthodes, d’attributs et de polymorphisme.

Des conventions d’écriture ont été établies pour permettre aux informaticiens et aux biologistes de communiquer plus facilement. Le formalisme utilisé est le H2PO.

L’animal est une classe dont un des attributs est la tête.

Le corps est une sous-classe dont les attributs sont pattes, abdomen et thorax, queue.

Les méthodes sont des fonctions qui permettent d’interagir avec les différentes classes et les attributs de celles-ci : la fonction « manger », « boire », « naître », « mourir »…

« Animal » peut être une classe qui hérite de la classe « être vivant » et obtient donc les attributs de « être vivant » comme ses méthodes « manger » et « boire ».

2,4 signifie que l’animal peut posséder 2 à 4 pattes. 0,1 signifie que l’animal peut avoir une queue ou non.

Conception de plans d’expérience (protocoles expérimentaux)

Variation des facteurs

Il existe trois approches pour faire varier les facteurs :

  1. Variation d’un seul facteur à la fois
  2. Variation de tous les facteurs dans le temps
  3. Variation concomitantes de certains facteurs : c’est la façon la plus efficace pour déterminer les interactions inter-factorielles (Kleijiden, 1987)

Le problème du warm-up

C’est le problème de montée en charge : phase transitoire initiale.

Avant de procéder à l’expérience et l’analyse des résultats, il faut considérer qu’il y a une nécessité d’indépendance des réponses.

Il existe trois approches :

  1. Initialiser le modèle avec des conditions représentant un état actif et stable (à l’équilibre)
  2. Eliminer les n premiers pas dans la collecte des statistiques

  3. Réduire les effets transitoires en effectuant la simulation sur des temps suffisamment longs

Modèles déterministes

Les modèles déterministes s’appuient sur un formalisme mathématique pur. Les équations permettent une description précise de la trajectoire. Il n’y a pas d’aléatoire.

Les modèles analytiques sont purement continus (dans le temps et l’espace) et déterministes. Ils s’appuient sur la résolution d’équations différentielles.

modèle simple : modèle logistique

Le modèle présenté est issu des travaux du mathématicien belge Verhust (1838).

Soit r le taux de croissance d’une population. Alors:

D’où : Xn+1= Xn (1+r) et Xn=X0(1+r)n

Cependant, la population ne se stabilise pas. On pose donc r’=r-CXn. Ainsi quand la population augmente de trop alors on a un effet stabilisateur qui fait que la fécondité diminue.

Si la population se stabilise à K alors Xn+1=Xn=K.

Suivant les valeurs de r (et le pas choisi pour n), il peut y avoir stabilisation ou non voire comportement chaotique (mais déterministe).

Les principaux défauts de ce modèle sont les suivants :

  1. Tous les individus sont reproducteurs
  2. Paramètre limite K constant alors qu’il dépend d’un processus de compétition entre espèces
  3. Le fait que n’est vrai qu’au sein d’une population de croissance exponentielle.

Modèle simple : modèle proie-prédateur

Le modèle décrit est le cas d’école du modèle de Lofka (1925)-Volterra (1926).

C’est un modèle régit par le système de deux équations suivantes :

Attention :

  1. s’il n’y a plus de prédateurs, le modèle prévoie une croissance exponentielle des proies alors qu’elle est aussi régulée par les ressources.
  2. g dépend du nombre de proies : g(X)

On a ainsi un nouveau système d’équations :

On peut déterminer g(X) en divisant la journée en différentes phases :

En posant :

On a :

D’où :

Le degré de mimétisme des proies est non constant dans le temps : selon la saison, les proies sont plus ou moins faciles à rechercher. Donc s varie avec une période de l’année.

On peut donc réaliser le modèle avec r, k, a, e, m constants et

Pour e=0, on a déjà un comportement complexe du système :

Mettre le programme java à cet endroit

Modèles à compartiments

Ils ne s’intéressent pas aux individus mais aux flux, aux transferts.

Le concept de compartiments intervient dès que l’on cherche à effectuer des bilans nets à propos des échanges d’une catégorie d’individus.

Exemple d’une chaîne trophique

Simulation discrète : aspects techniques

Le temps de calcul est très grand devant le temps de résolution mathématique des équations. Si les équations sont très compliquées alors la modélisation discrète permet une description pas à pas avec le temps du fonctionnement du système sous forme d’un algorithme exécutable sur un ordinateur.

Simulation de Monte-Carlo (Morgenhaler 1961, Hammersley, 1964)

La méthode de Monte-Carlo utilise un générateur de nombre aléatoires.

Prenons un exemple :

Pour estimer une surface on peut tirer un nombre aléatoire de points et on compte le nombre de points dessus et dessous la courbe. On peut alors estimer la surface par :

gestion du temps

Le temps est géré soit par une horloge (mais il faut faire attention au pas de temps employé) soit par des évènements (chaque évènement est stocké dans l échéancier avec sa date d’occurrence, le type d’évènement et l’activité de simulation associée).

Noyaux de synchronisation

Physiquement, il est impossible dans une machine séquentielle d’effectuer deux évènements à la fois.

Il existe quatre approches :