Professeur des universités à l'Université de Technologie de Troyes(anciennement maître de conférences à l'Université de Strasbourg) | |
Habilité à diriger des recherches de l'Université de StrasbourgDocteur de l'Université Louis PasteurAncien élève de l'École normale Supérieure de LyonAgrégé de mathématiquesMembre du Laboratoire LIST3N, Computer Laboratory and Digital Society(anciennement Membre de l'équipe Modélisation et Contrôle)(Institut de Recherche Mathématique Avancée (IRMA, UMR CNRS 7501, LabEx IRMIA)Curriculum Vitae court en, court fr.Liste de publications personnelles.
CVHalResearchGate Kudos Academia.edu Mendeley Google Scholar Coordonnées pour me joindre :Université de Technologie de TroyesBureau : H-013 12 rue Marie Curie CS 42060 10004 Troyes Cedex Téléphone : 03-25-71-76-86 Courriel : frederic.bertrand@utt.fr frederic.bertrand@ens-lyon.org frederic.bertrand@alumni.ens-lyon.fr |
The goal of bootPLS is to provide bootstrap techniques for hyperparameters' selection for regular and sparse PLS models and their extensions to generalized linear regession models. The bootPLS package implements boot (Y,X) and (Y,T) bootstrap techniques as decribed in Magnanensi J, Maumy-Bertrand M, Meyer N and Bertrand F, (2021), New Developments in Sparse PLS Regression, Frontiers in Applied Mathematics and Statistics, 7:693126, doi:10.3389/fams.2021.693126. The bootpls package was presented at the UseR!2022 conference in June 2022. Frédéric Bertrand and Myriam Bertrand (2022). “bootPLS: Bootstrap Hyperparameter Selection for PLS Models and Extensions”, User2022!. |
The package code was written by M. J. Kane, Br. Lewis, J. W. Emerson. I have been the maintainer of the package since early 2021 as the package was archived on the CRAN in 2019.
|
|
The package code was written by Ch. Porzelius, H. Binder. I have been the maintainer of the package since it was about to be archived on the CRAN (in early 2021).
|
|
The package code was written by M. Sill, Th. Hielscher, M. Zucknick, N. Becker. I have been the maintainer of the package since it was orphaned on the CRAN (in early 2021).
|
|
Ce package contient les jeux de données, exemples et fonctions accompagnant le livre Modélisation Statistique par la Pratique avec R : Cours, exemples, exercices et problèmes corrigés, Frédéric Bertrand, Emmanuelle Claeys et Myriam Maumy-Bertrand, 2019 Dunod. La page github consacrée au package détaille comment installer le package, permet de consulter facilement l'aide des fonctions qui sont présentent dans le package et contient, au format html, le code source R des exemples du livre, complétés par d'autres encore, ainsi que les résultats obtenus lors de leur exécution avec R. |
The goal of Patterns is to provide a modeling tool in order to Decipher Biological Networks with Patterned Heterogeneous Measurements. It allows for single or joint modeling of, for instance, genes and proteins.
Example of use with microarray or RNA-Seq data are provided in two vignettes. The Patterns package is more than (at least) a threeway major extension of the Cascade package :
Hence the Patterns package should be viewed more as a completely new modelling tools than as an extension of the Cascade package. |
The goal of SelectBoost is to provide a A General Algorithm to Enhance the Performance of Variable Selection Methods in Correlated Datasets. With the growth of big data, variable selection has become one of the major challenges in statistics. Although many methods have been proposed in the literature their performance in terms of recall and precision are limited in a context where the number of variables by far exceeds the number of observations or in a high correlated setting. The “selectboost” algorithm (Bertrand et al. 2020, doi:10.1093/bioinformatics/btaa855) is a general algorithm which improves the precision of any existing variable selection method. This algorithm is based on highly intensive simulations and takes into account the correlation structure of the data. It can either produce a confidence index for variable selection or it can be used in an experimental design planning perspective. In this package, we propose a general algorithm which improves the precision of any existing variable selection method. This algorithm is based on highly intensive simulations and takes into account the correlation structure of the data. Our algorithm can either produce a confidence index for variable selection or it can be used in an experimental design planning perspective. We demonstrate the performance of our algorithm on both simulated and real data. The SelectBoost package was presented at the UseR!2022 conference in June 2022. Myriam Bertrand and Frédéric Bertrand (2022). “SelectBoost: A General Algorithm to Enhance the Performance of Variable Selection Methods in Correlated Datasets”, User2022!. |
The goal of networkABC is to provide an inference tool based on approximate Bayesian computation to decipher network data and assess the strength of their inferred links. It is based on dedicated C code and a specific way to perform ABC computations for scale-free networks. The package was presented at the 22nd International Conference on COMPUTATIONAL STATISTICS (COMPSTAT 2016). Jung, N., Bertrand, F., Maumy-Bertrand, M. and Musayevaa Kh. (2016). “New insights in Approximate Bayesian Computation algorithms for network reverse-engineering”, Programme, Compstat 2016, Oviedo. The package was presented at the User2021! conference. Frédéric Bertrand and Myriam Bertrand (2021). “Network Reverse Engineering with Approximate Bayesian Computation”, User2021!, Zurich, proceedings. |
The goal of Cascade is to provide a modeling tool allowing gene selection, reverse engineering, and prediction in cascade networks and was published as an application note, Jung, N., Bertrand, F., Bahram, S., Vallat, L., and Maumy-Bertrand, M. (2014), Bioinformatics, doi:10.1093/bioinformatics/btt705. The package was presented at the User2014! conference. Jung, N., Bertrand, F., Bahram, S., Vallat, L., and Maumy-Bertrand, M. (2014). “Cascade: a R-package to study, predict and simulate the diffusion of a signal through a temporal genenetwork”, book of abstracts, User2014!, Los Angeles, page 153, abstract. The Cascade package allows to create animation of the propagation of the inferred signal in the reverse-engineered biological network. |
The goal of CascadeData is to provide a subset of the experimental data GSE39411 in a ready to use format. Vallat L., Kemper C.A., Jung N., Maumy-Bertrand M., Bertrand F., ..., Bahram S., (2013), “Reverse-engineering the genetic circuitry of a cancer cell with predicted intervention in chronic lymphocytic leukemia”. Proc Natl Acad Sci USA, 110(2):459-64, doi:10.1073/pnas.1211130110. These are experimental response cascade data following a biological stimulation that consist of two data frames with 54613 probesets with repeated measurements on 6 independent subjects at 4 time points that were, for instance, used as examples in the article Jung, N., Bertrand, F., Bahram, S., Vallat, L., and Maumy-Bertrand, M. (2014), doi:10.1093/bioinformatics/btt705 and are used in several R packages (Cascade, CRAN and documentation, Selectboost and Patterns). |
The package code was written by Nicole Kraemer and Mikio L. Braun. I have been the maintainer of the package since it was orphaned on the CRAN (in mid 2018). |
The goal of plsRcox is to provide Cox models in a high dimensional setting in R. plsRcox implements partial least squares Regression and various regular, sparse or kernel, techniques for fitting Cox models in high dimensional settings, Bastien, P., Bertrand, F., Meyer N., Maumy-Bertrand, M. (2015), “Deviance residuals-based sparse PLS and sparse kernel PLS regression for censored data”, Bioinformatics, 31(3):397-404, doi:10.1093/bioinformatics/btu660. Cross validation criteria were studied in arXiv:1810.02962, Bertrand, F., Bastien, Ph. and Maumy-Bertrand, M. (2018), “Cross validating extensions of kernel, sparse or regular partial least squares regression models to censored data. It supports formula and was tested on real-life datasets”. The package was presented at the User2014! conference. Frédéric Bertrand, Philippe Bastien, Nicolas Meyer and Myriam Bertrand (2014). “plsRcox, Cox-Models in a high dimensional setting in R”, book of abstracts, User2014!, Los Angeles, page 177, abstract. The plsRcox package contains an original allelotyping dataset from “Allelotyping identification of genomic alterations in rectal chromosomally unstable tumors without preoperative treatment”, Benoît Romain, Agnès Neuville, Nicolas Meyer, Cécile Brigand, Serge Rohr, Anne Schneider, Marie-Pierre Gaub and Dominique Guenot (2010), BMC Cancer, 10:561, doi:10.1186/1471-2407-10-561. |
PLS regression for beta regression models, Bertrand, F., Meyer, N. Beau-Faller, M., El Bayed, K., Namer, I.-J., Maumy-Bertrand, M. (2013). “Régression Bêta PLS”. Journal de la Société Française de Statistique, 154(3):143-159, http://journal-sfds.fr/article/view/215). Cross-validation, bootstrap for complete or incomplete datasets. Supports formulas and allows to define custom link functions. Examples of use on real datasets are provided in the article. The package was presented at the User2021! conference. Frédéric Bertrand and Myriam Bertrand (2021). “Partial Least Squares Regression for Beta Regression Models”, User2021!, Zurich, proceedings. |
The goal of plsRglm (arXiv:1810.0100) is to provide (weighted) Partial least squares Regression for generalized linear models and repeated k-fold cross-validation of such models using various criteria. It allows for missing data in the explanatory variables. Bootstrap confidence intervals constructions are also available. Partial least squares Regression for generalized linear models were introduced in Bastien, P., Vinzi, V. E. et Tenenhaus, M. (2005). “PLS generalised linear regression”. Computational Statistics and Data Analysis, 48(1), 17–46, article. The package was presented at the User2014! conference. Frédéric Bertrand, Jérémy Magnanensi, Nicolas Meyer and Myriam Bertrand (2014). “plsRglm, PLS generalized linear models for R”, book of abstracts, User2014!, Los Angeles, page 150, 172_Bertrand.pdf. For more involved number of component selection techniques, see “A new universal resample-stable bootstrap-based stopping criterion for PLS component construction”, Jérémy Magnanensi, Frédéric Bertrand, Myriam Maumy-Bertrand and Nicolas Meyer, Statistics and Computing (2017) 27:757–774, doi:10.1007/s11222-016-9651-4. The new methods presented in that article were packaged in our bootPLS package. |
Ce package contient les jeux de données, exemples et fonctions accompagnant le livre Initiation à la statistique avec R : Cours, exemples, exercices et problèmes corrigés, Frédéric Bertrand et Myriam Maumy-Bertrand, 3ème édition, 2018 Dunod. La page github consacrée au package détaille comment installer le package, permet de consulter facilement l'aide des fonctions qui sont présentent dans le package et contient, au format html, le code source R des exemples du livre, complétés par d'autres encore, ainsi que les résultats obtenus lors de leur exécution avec R. Pour les fichiers d'exemple mentionnés dans le livre, voir la page https://fbertran.github.io/homepage/BioStatR/. |
Cet ouvrage résulte de la collaboration de quatre mathématiciens (Aurélie, Frédéric, Myriam et Sandie) et d’un physicien (Didier). Il est organisé en quatre parties : algèbre, analyse, probabilités et statistique. Il s’adresse aux étudiants des deux premières années post-bac : licences, prépas intégrées, INSA ou IUT. Ce livre peut également aider à la préparation au CAPES de mathématiques. |
«Toute l’UE en fiches» est une nouvelle série de la collection 100% 1ère année Santé. Elle apporte une aide pour les révisions à l’approche des concours. Cet ouvrage est déstiné aux étudiants de 1re année Santé (PASS), qui préparent les concours Médecine-Phamarcie-Dentaire-Sage-femme. L’ouvrage, structuré par thème, propose une synthèse du cours en fiches de l’Unité d’enseignement UE4 «Évaluation des méthodes d'analyse appliquées aux sciences de la vie et de la santé» qui couvre les disciplines suivantes : Mathématiques, Biostatistiques. |
À l’exception notable des essais contrôlés et randomisés, la statistique a longtemps évacué le problème de la causalité considérant qu’il relevait du domaine d’application et des théories afférentes. Bien souvent les cours et les manuels de statistique se contentent de rappeler que corrélation n’est pas causalité et passent rapidement à d’autres sujets. Or, que ce soit en économie, épidémiologie, génétique, médecine, marketing, pour ne citer que quelques domaines, la recherche de modèles causaux et de variables actionnables est incontournable. Aujourd’hui la mise à disposition de données massives ou de grande dimension repose la question de la causalité de manière aigüe. Dans le prolongement des travaux pionniers de Granger (prix Nobel d’économie en 2003), Pearl (prix Turing en 2011), Rosenbaum et Rubin, pour ne nommer qu'eux, une très large palette de modèles et méthodes pour l'analyse causale, éventuellement hors d'une expérience contrôlée, s'est peu à peu constituée depuis le début des années 1980. Citons entre autres les thèmes suivants : issues potentielles, données contrefactuelles, scores de propension, double-robustesse, diagramme de causalité, réseaux bayésiens, systèmes d'équations structurelles. Cet ouvrage est le fruit de la collaboration entre spécialistes réputés : Léon Bottou (Facebook AI Research), Antoine Chambaz (université de Paris), Daniel Commenges (Institut national de la santé et de la recherche médicale), Isabelle Drouet (université Paris-Sorbonne), Ron Kenett (KPA Group), Vivian Viallon (International Agency for Research on Cancer) réunis à l’occasion des 18e Journées d’étude en statistique organisées par la SFdS. Le lecteur y trouvera une synthèse des fondements et des travaux les plus récents dans le domaine de la causalité statistique, avec des applications dans des domaines variés. |
Statistiques pour l'économie et la gestion offre une présentation synthétique et rigoureuse de l’ensemble des connaissances en statistiques ! Ce livre offre aux étudiants de 1er cycle une introduction aux concepts indispensables en statistiques et à leurs applications. Il comporte douze chapitres traitant de façon simple et claire les sujets majeurs en statistiques : L’objectif est de montrer aux étudiants comment les statistiques participent à la prise de décision des autorités publiques et des chefs d’entreprises et l’accent est mis sur l’utilisation pratique des différents outils statistiques grâce à la présentation des techniques de programmation et des exemples sous R. Un package, sageR, contenant les codes R des exemples du livre ainsi que les jeux de données est disponible en ligne. Pour les étudiants, les corrigés des exercices, ainsi que des approfondissements et exercices complémentaires sur certaines parties de l’ouvrage sont disponibles en ligne. Les enseignants ont à leur disposition le PowerPoint des figures du livre. |
Le logiciel R est maintenant un standard dans le domaine de la statistique. Libre et gratuit, son enseignement s'est généralisé dans toutes les filières où les statistiques sont utilisées : sciences de la vie et de la Terre, études de santé, sciences économiques, géographie, sciences physiques... Cet ouvrage accompagne l'étudiant en Licence 3, en Master ou écoles d'ingénieurs dans son apprentissage de la modélisation statistique avec R. De nombreux exemples et des rubriques méthodologiques ponctuent le cours. Des exercices et problèmes permettent la mise en application directe et la généralisation des concepts. |
Cet ouvrage résulte de la collaboration de quatre mathématiciens (Aurélie, Frédéric, Myriam et Sandie) et d’un physicien (Didier). Il est organisé en quatre parties : algèbre, analyse, probabilités et statistique. Il s’adresse aux étudiants des deux premières années post-bac : licences, prépas intégrées, INSA ou IUT. Ce livre peut également aider à la préparation au CAPES de mathématiques. |
Le logiciel R est devenu un standard dans le domaine de la statistique. Libre et gratuit, son enseignement s’est généralisé dans toutes les filières où les statistiques sont utilisées : sciences de la vie et de la Terre, études de santé, sciences économiques, finance, économétrie, géographie, sciences physiques... Cet ouvrage, issu d'une longue expérience de formation auprès de publics très variés, propose d'accompagner l'étudiant en Licence, en Master ou en école d'ingénieur dans son apprentissage de la statistique avec R. Dans chaque chapitre, le lecteur trouvera : |
«Toute l’UE en fiches» est une nouvelle série de la collection 100% 1ère année Santé. Elle apporte une aide pour les révisions à l’approche des concours. Cet ouvrage est déstiné aux étudiants de 1re année Santé (PAES), qui préparent les concours Médecine-Phamarcie-Dentaire-Sage-femme. L’ouvrage, structuré par thème, propose une synthèse du cours en fiches de l’Unité d’enseignement UE4 «Évaluation des méthodes d'analyse appliquées aux sciences de la vie et de la santé» qui couvre les disciplines suivantes : Mathématiques, Biostatistiques. |
Cet ouvrage propose aux étudiants en Licence 2 de Mathématiques ou de Physique une méthode efficace et progressive pour apprendre, comprendre et appliquer les concepts fondamentaux de mathématiques. Associés à des rappels de cours clairs et concis, sous forme de fiches, 200 QCM et 200 exercices de difficulté croissante permettent de s’évaluer et de s’entraîner aux examens et concours. Les corrigés détaillés mettent l'accent sur la méthode de résolution. Les corrigés détaillés mettent l'accent sur la méthode de résolution. |
For over fourty years, choosing a statistical model thanks to data consisted in optimizing a criterion based on penalized likelihood (H. Akaike, 1973) or penalized least squares (C. Mallows, 1973). These methods are valid for predictive model choice (regression, classification) and for descriptive models (clustering, mixtures). Most of their properties are asymptotic, but a non asymptotic theory has emerged at the end of the last century (Birgé-Massart, 1997). Instead of choosing the best model among several candidates, model aggregation combines different models, often linearly, allowing better predictions. Bayesian statistics provide a useful framework for model choice and model aggregation with Bayesian Model Averaging. In a purely predictive context and with very few assumptions, ensemble methods or meta-algorithms, such as boosting and random forests, have proven their efficiency. This volume originates from the collaboration of high-level specialists: Christophe Biernacki (Université de Lille I), Jean-Michel Marin (Université de Montpellier), Pascal Massart (Université de Paris-Sud), Cathy Maugis-Rabusseau (INSA de Toulouse), Mathilde Mougeot (Université Paris Diderot), and Nicolas Vayatis (École Normale Supérieure de Cachan) who were all speakers at the 16th biennal workshop on advanced statistics organized by the French Statistical Society. In this book, the reader will find a synthesis of the methodologies’ foundations and of recent work and applications in various fields. |
Cet ouvrage propose aux étudiants de la première année d'études supérieures une méthode progressive et efficace pour apprendre, comprendre et appliquer les concepts fondamentaux des mathématiques. Associés à des rappels de cours clairs et concis, sous forme de fiches, 200 QCM et 230 exercices de difficulté croissante permettent de s’évaluer et de s’entraîner aux examens et concours. Les corrigés détaillés mettent l'accent sur la méthode de résolution. |
«Toute l’UE en fiches» est une nouvelle série de la collection 100% 1ère année Santé. Elle apporte une aide pour les révisions à l’approche des concours. Cet ouvrage est déstiné aux étudiants de 1re année Santé (PAES), qui préparent les concours Médecine-Phamarcie-Dentaire-Sage-femme. L’ouvrage, structuré par thème, propose une synthèse du cours en fiches de l’Unité d’enseignement UE4 «Évaluation des méthodes d'analyse appliquées aux sciences de la vie et de la santé» qui couvre les disciplines suivantes : Mathématiques, Biostatistiques. |
Le logiciel R est devenu un standard dans le domaine de la statistique. Libre et gratuit, son enseignement s’est généralisé dans toutes les filières où les statistiques sont utilisées : sciences de la vie et de la Terre, études de santé, sciences économiques, finance, économétrie, géographie, sciences physiques Cet ouvrage, issu d’une longue expérience de formation auprès de publics très variés, propose d’accompagner l’étudiant en Licence, en Master ou en école d’ingénieur dans son apprentissage de la statistique avec R. Dans chaque chapitre, le lecteur trouvera : |
Cet ouvrage résulte de la collaboration de quatre mathématiciens (Aurélie, Frédéric, Myriam et Sandie) et d’un physicien (Didier). Il est organisé en quatre parties : algèbre, analyse, probabilités et statistique. Il s’adresse aux étudiants des deux premières années post-bac : licences, prépas intégrées, INSA ou IUT. Ce livre peut également aider à la préparation au CAPES de mathématiques. |
Cet ouvrage s’adresse aux candidats aux concours de la Fonction publique catégorie A et B devant passer des épreuves d'admissibilité de mathématiques. Véritable tout-en-un pour se préparer efficacement à ces épreuves, il propose : une présentation des épreuves et des concours concernés ; des fiches de cours synthétiques pour rappeler les connaissances théoriques indispensables ; des exercices d'entraînement avec corrigés détaillés pour valider ses connaissances ; des annales de concours corrigées. |
Cet ouvrage s’adresse aux candidats aux concours de la Fonction publique catégorie A et B devant passer des épreuves d'admissibilité de probabilités, statistiques-économétrie. Véritable tout-en-un pour se préparer efficacement à ces épreuves, il propose : une présentation des épreuves et des concours concernés ; des fiches de cours synthétiques pour rappeler les connaissances théoriques indispensables ; des exercices d'entraînement avec corrigés détaillés pour valider ses connaissances ; des annales de concours corrigées. |
«Toute l'UE en fiches» est une nouvelle série de la collection 100% 1ère année Santé. Elle apporte une aide pour les révisions à l'approche des concours. Cet ouvrage est déstiné aux étudiants de 1re année Santé (PAES), qui préparent les concours Médecine-Phamarcie-Dentaire-Sage-femme. L’ouvrage, structuré par thème, propose une synthèse du cours en fiches de l'Unité d'enseignement UE4 «Évaluation des méthodes d'analyse appliquées aux sciences de la vie et de la santé&Raquo; qui couvre les disciplines suivantes : Mathématiques, Biostatistiques. |
Les ouvrages de la collection «Maxi-Fiches» s’adressent aux étudiants désireux de maîtriser les fondamentaux d'une discipline. En 80 fiches synthétiques de 2 à 6 pages sont présentées les principales notions de statistique. Chaque fiche est accompagnée d'une mise en pratique pour aider l'étudiant à assimiler rapidement les notions indispensables à connaître. |
Le logiciel R est devenu un standard dans le domaine de la statistique. Libre et gratuit, son enseignement s’est généralisé dans toutes les filières où les statistiques sont utilisées : sciences de la vie et de la Terre, études de santé, sciences économiques, finance, économétrie, géographie, sciences physiques... Cet ouvrage, issu d'une longue expérience de formation auprès de publics très variés, propose d'accompagner l'étudiant en Licence, en Master ou en école d'ingénieur dans son apprentissage de la statistique avec R. Dans chaque chapitre, le lecteur trouvera : |