Le cancer : hasard, environnement, génétique?

Matériel et méthodes

Comment l’étude de deux corpus d’articles (issus d’Europresse et de Web of science) nous a-t-elle permis d’analyser cette controverse sur les risques liés au développement du cancer ?
Afin d’étudier ce sujet, nous avons constitué plusieurs corpus d’articles issus de la presse généraliste, de la presse scientifique, et également de recherches annexes liées aux résultats précédents : analyses d’interview, blogs de spécialistes sur les questions de santé, etc. Les principaux corpus ont été réalisés à l’aide de la base de données Europresse, pour la presse généraliste, et de la plateforme Web Of Science, pour la presse scientifique. Les articles d’Europresse ont ensuite été traités dans leur majorité grâce à l’outil Gargantext, et nous avons utilisé les outils proposés par Web Of Science pour analyser les articles scientifiques.


Corpus Europresse

  • Méthodologie, constitution et analyse du corpus

Notre corpus « Europresse » regroupe 40 articles de presse en anglais et 71 articles en français. Il s’agit d’articles issus de la presse générale, et non pas scientifique, elle touche et concerne donc le grand public et traite plus des problèmes sociétaux causés par la controverse.  

Nous avons donc utilisé différentes équations de recherches afin de constituer ces deux corpus. Les mots clés utilisés ont été choisi en fonction de leur occurrence dans les textes sources, à commencer par celui qui a « donné naissance » à la controverse. Nous avons repéré des expressions types qui nous ont permis de retrouver les articles qui citaient celui de Tomasetti et Vogelstein. Par ailleurs, nous avons effectué nos recherches principalement dans les articles publiés en 2015 et début 2016 pour bien cerner ceux qui traitent des résultats des deux américains.

Nous avons également fait une autre recherche qui excluait l’année 2015 pour vérifier si d’autres théories sur la prépondérance du hasard dans le développement de certains cancers avaient été faites, ou non dans les années antérieures.

Nous avons ensuite effectué plusieurs recherches afin de discerner les sources anglaises des sources francophones. Nous aurions pu étudier les répercussions de l’article de C. Tomasetti et B. Vogelstein dans d’autres langages, mais nous avons délibérément limité les recherches à l’anglais et le français.

Dans un premier temps nous nous sommes uniquement intéressés aux « échos » lancés par rapport à la publication de l’article source de la controverse, et passé le mois de décembre, nous avons alors trouvé l’article de Yusuf Hannun qui contredit complètement les assertions des deux américains dans la revue Nature. A partir de ce moment là, nous avons pu croiser nos recherches, et chercher les articles qui répondaient à celui de Y. Hannun.

cancer stem cell Tomasetti depuis 1 an Sources anglaises 61 résultats
cancer causes pollution environment health risk depuis 1 an Sources anglaises 804 résultats
Stony Brook cancer environment* depuis 1 an Sources anglaises 45 résultats
cancer « bad luck » Tomasetti** depuis 1 an Sources anglaises 17 résultats
cancer Yusuf Hannun depuis 1 an Sources anglaises 26 résultats
cancer « environmental causes » Tomasetti depuis 1 an Sources anglaises 2 résultats
TEXT= cancer& LEAD= hasard& LEAD= Tomasetti 4 résultats depuis 2 ans Sources françaises
TEXT= cancer& TEXT= pas de chance& LEAD= Tomasetti 14 résultats depuis 2 ans Sources françaises
TEXT= cancer& TEXT= Hannun& TEXT= Tomasetti& TEXT= hasard& TEXT= risques 3 résultats depuis 3 mois Sources françaises
TEXT= cancer& TEXT= Hannun 6 résultats depuis 1 an Sources françaises

*Stony Brook est l’université dans laquelle le docteur Hannun exerce en tant que chercheur. Il est le directeur du centre de cancérologie.

** L’expression « Bad Luck » est probablement la plus emblématique de l’article de C. Tomasetti et B. Vogelstein, elle a été reprise par de nombreux articles. En effet cette formule un peu « choc » transmet toute la stupeur des résultats controversés des deux américains.


Corpus Web Of Science

  • Méthodologie, composition et analyses du corpus

Web Of Science, ou WOS est une plateforme qui permet l’accès à une très grande source de revues purement scientifiques. Il s’agit dans ce cas d’une presse très spécifique et assez complexe qui traite de domaines bien précis. Cette fois ci, le corpus étudié confirmera bien la théorie avancée par celui d’Europresse et s’intéressera plus, non pas aux problèmes sociétaux causés par la publication de l’article de C. Tomasetti et B. Vogelstein, mais plutôt à la démarche scientifique et aux conséquences de l’étude en question pour le monde scientifique. Ce corpus nous a également permis d’étudier les différentes « arènes de débats », c’est à dire les différents domaines scientifiques qui prennent part à la discussion. Les outils d’analyse de WOS nous ont permis de trier notre corpus en fonction des spécialités de chacune des revues afin de cerner quels ont été les champs de recherches le plus ciblés, et concernés par la publication de C. Tomasetti et B. Vogelstein.

Le corpus issu de Web of Science a été construit en recherchant les articles qui citent et font référence à celui publié par Tomasetti. La réponse scientifique est assez forte (123 articles), et en les triant, c’est à dire que nous avons retiré les articles techniques qui ne traitent pas du problème majeur de la controverse – à ce titre nous avons exclu tous les articles qui ne traitait que d’un cancer en particulier et qui ne citait C. Tomasetti que pour une remarque de son article qui ne concerne pas le sujet du débat – nous avons pu analyser ce corpus ce qui nous a permis dans un premier temps de cerner les différents domaines concernés par la discussion.

ANALYSES DES DOMAINES SCIENTIFIQUES CONCERNES :

Research Areas                                                 records                                            % of 123

ONCOLOGY 43 34.959
CELL BIOLOGY 24 19.512
SCIENCE TECHNOLOGY OTHER TOPICS 13 10.569
PUBLIC ENVIRONMENTAL OCCUPATIONAL HEALTH 10 8.130
BIOCHEMISTRY MOLECULAR BIOLOGY 10 8.130
LIFE SCIENCES BIOMEDICINE OTHER TOPICS 7 5.691
RESEARCH EXPERIMENTAL MEDICINE 5 4.065
GENERAL INTERNAL MEDICINE 5 4.065
GENETICS HEREDITY 4 3.252
BIOTECHNOLOGY APPLIED MICROBIOLOGY 4 3.252
TOXICOLOGY 3 2.439
PHARMACOLOGY PHARMACY 3 2.439
HEMATOLOGY 3 2.439
DEVELOPMENTAL BIOLOGY 3 2.439
BIOPHYSICS 3 2.439
VIROLOGY 2 1.626
SURGERY 2 1.626
PATHOLOGY 2 1.626
NUTRITION DIETETICS 2 1.626
MATHEMATICAL COMPUTATIONAL BIOLOGY 2 1.626
GERIATRICS GERONTOLOGY 2 1.626
EVOLUTIONARY BIOLOGY 2 1.626
ENDOCRINOLOGY METABOLISM 2 1.626
CHEMISTRY 2 1.626

En tête apparaît sans grande surprise l’oncologie qui est le domaine central du débat (le cancer), et puis en deuxième celui de la biologie cellulaire, car rappelons que la théorie de C. Tomasetti et B. Vogelstein s’appuie en prenant en considération la multiplication des cellules souches, il apparaît donc logique que ce domaine soit principalement concerné par ce débat. Toutes les données à l’origines des résultats scientifiques publiés dans Science (et puis quelques mois plus tard dans Nature) tiennent de la biologie cellulaire. Un résultat intéressant est la place obtenue par le domaine « ENVIRONNEMENT SANTÉ PUBLIQUE » par rapport à d’autres domaines médicaux, ce qui traduit de l’importance des répercussions de l’étude sur la population. De plus, ce domaine est fortement lié à toutes sortes de considérations épidémiologiques, c’est à dire à l’étude d’échantillons de population, et c’est un facteurs à ne pas négliger lorsque le débat principal tient sur la proportion du facteur de hasard par rapport à d’autres facteurs environnementaux sur le risque de développer un cancer.