Cet article a été réalisé suite à la lecture d’ouvrages sur la modélisation et ne constitue pas la recopie d’un cours existant.
Un système ouvert interagit avec son environnement. Il permet des transferts énergie/matière et la formation d’organisations émergentes structurantes.
Un système fermé, à la différence est coupé du monde extérieur, sans émergence dynamique.
Un système naturel est par nature ouvert. Définir des limites à un système constitue une approximation. On est contraint de modéliser un système fermé.
Un premier dilemme se pose pour le scientifique :
Comment choisir les limites d’un système de telle manière que celui-ci puisse être considéré comme fermé ? (au moins sur un certain intervalle de temps)
Comment choisir un niveau d’abstraction tel que le comportement collectif rende compte des activités industrielles ?
C’est la description de l’ensemble des entités, attributs et acteurs à l’instant t.
Il existe deux types d’acteurs :
Un modèle est une abstraction qui simplifie le système réel étudié.
L’observateur est satisfait dès que le modèle colle à la réalité mais que nous apprend t-il ? (problème de limites d’interprétation du modèle)
Popper (1973) donnait les caractéristiques suivantes au modèle :
Ainsi, un modèle doit reproduire le mieux possible en fonction des objectifs. Il faut donc avoir conscience qu’un modèle n’est construit que pour répondre à un nombre limité de questions. Les extensions de certains modèles sont donc très hasardeuses et ne peuvent alors pas prétendre à une prédiction de la réalité.
Biocénose : Assemblage de communautés d’espèces
Biotope : Aire géographique de dimension variable en fonction des positions constantes ou cycliques des espèces constituant la biocénose
Le pas de temps est celui des évènements pris en compte dans la modélisation et intervenant le plus fréquemment dans le système réel.
Il existe 3 types de modélisation :
Les modèles analytiques sont déterministes et continus. L’avenir est donc prévu de manière exacte par des équations analytiques. Ils ne prennent pas en compte la répartition spatiale ni les interactions à distance. Les modèles purement stochastiques font appel aux probabilités. Le modèle crée est indépendant du temps et de l’espace. Il fait appel à l’analyse de Markov et aux matrices de Leslie dans la plupart des cas. La modélisation par simulation est celle qui permet de prendre en compte le plus de paramètres et est donc la plus aboutie. Elle fait appel à la fois à des modèles déterministes et stochastiques.
On peut par exemple ajuster les données à une loi de distribution gaussienne:
Avec µ : moyenne, s : écart type et y : densité de probabilité.
Les modèles biologiques empruntent au langage informatique toutes les notions de classe, de sous-classe, d’héritage, de méthodes, d’attributs et de polymorphisme.
Des conventions d’écriture ont été établies pour permettre aux informaticiens et aux biologistes de communiquer plus facilement. Le formalisme utilisé est le H2PO.
L’animal est une classe dont un des attributs est la tête.
Le corps est une sous-classe dont les attributs sont pattes, abdomen et thorax, queue.
Les méthodes sont des fonctions qui permettent d’interagir avec les différentes classes et les attributs de celles-ci : la fonction « manger », « boire », « naître », « mourir »…
« Animal » peut être une classe qui hérite de la classe « être vivant » et obtient donc les attributs de « être vivant » comme ses méthodes « manger » et « boire ».
2,4 signifie que l’animal peut posséder 2 à 4 pattes. 0,1 signifie que l’animal peut avoir une queue ou non.
Il existe trois approches pour faire varier les facteurs :
C’est le problème de montée en charge : phase transitoire initiale.
Avant de procéder à l’expérience et l’analyse des résultats, il faut considérer qu’il y a une nécessité d’indépendance des réponses.
Il existe trois approches :
Les modèles déterministes s’appuient sur un formalisme mathématique pur. Les équations permettent une description précise de la trajectoire. Il n’y a pas d’aléatoire.
Les modèles analytiques sont purement continus (dans le temps et l’espace) et déterministes. Ils s’appuient sur la résolution d’équations différentielles.
Le modèle présenté est issu des travaux du mathématicien belge Verhust (1838).
Soit r le taux de croissance d’une population. Alors:
D’où : Xn+1= Xn (1+r) et Xn=X0(1+r)n
Cependant, la population ne se stabilise pas. On pose donc r’=r-CXn. Ainsi quand la population augmente de trop alors on a un effet stabilisateur qui fait que la fécondité diminue.
Si la population se stabilise à K alors Xn+1=Xn=K.
Suivant les valeurs de r (et le pas choisi pour n), il peut y avoir stabilisation ou non voire comportement chaotique (mais déterministe).
Les principaux défauts de ce modèle sont les suivants :
Le modèle décrit est le cas d’école du modèle de Lofka (1925)-Volterra (1926).
C’est un modèle régit par le système de deux équations suivantes :
Attention :
On a ainsi un nouveau système d’équations :
On peut déterminer g(X) en divisant la journée en différentes phases :
En posant :
On a :
D’où :
Le degré de mimétisme des proies est non constant dans le temps : selon la saison, les proies sont plus ou moins faciles à rechercher. Donc s varie avec une période de l’année.
On peut donc réaliser le modèle avec r, k, a, e, m constants et
Pour e=0, on a déjà un comportement complexe du système :
Ils ne s’intéressent pas aux individus mais aux flux, aux transferts.
Le concept de compartiments intervient dès que l’on cherche à effectuer des bilans nets à propos des échanges d’une catégorie d’individus.
Le temps de calcul est très grand devant le temps de résolution mathématique des équations. Si les équations sont très compliquées alors la modélisation discrète permet une description pas à pas avec le temps du fonctionnement du système sous forme d’un algorithme exécutable sur un ordinateur.
La méthode de Monte-Carlo utilise un générateur de nombre aléatoires.
Prenons un exemple :
Pour estimer une surface on peut tirer un nombre aléatoire de points et on compte le nombre de points dessus et dessous la courbe. On peut alors estimer la surface par :
Le temps est géré soit par une horloge (mais il faut faire attention au pas de temps employé) soit par des évènements (chaque évènement est stocké dans l échéancier avec sa date d’occurrence, le type d’évènement et l’activité de simulation associée).
Physiquement, il est impossible dans une machine séquentielle d’effectuer deux évènements à la fois.
Il existe quatre approches :
Le processus du modèle est rarement représenté par des sous programmes car ils ont des traitements associés qui doivent être effectués en parallèle dans le temps virtuel.
Il faut donc disposer de coroutines :
La modélisation repose sur deux motivations:
Il existe donc deux risques associés :
Le cadre expérimental contient au minimum les éléments suivants :
Il existe six catégories de vérification (Balci et Whitner) :
Voici un modèle des tests effectués :
Il existe plusieurs types de validation :
La validation du modèle conceptuel (théories, hypothèses, algorithmes….) consiste à vérifier que le modèle fournit une représentation raisonnable du système en fonction des objectifs. L’approche orientée objet favorise une structure du modèle proche de la réalité.
La validation évènementielle s’intéresse à la cohérence des évènements.
Voici un schéma empirique pour la validation :