ETUDES DE CAS

Pharma Onco

ENTREPRISE & SUJET

Laboratoire Pharmaceutique : identifier des biomarqueurs nucléiques oncologiques (ADN et ARN) dans des biopsies liquides (plasma) dans le but de développer un diagnostic non invasif et une thérapie personnalisée.

BESOIN

Mise en place d’un protocole de séquençage et d’identification de biomarqueurs tumoraux

PRESTATIONS RÉALISÉES

Rédaction du protocole : préparation des échantillons, choix des technologies NGS (haut débit) adaptées (Illumina, Roche 454, Ion torrent: Proton / PGM, SOLiD)
Contrôle qualité / Nettoyage de données
Analyse in silico des données de RNASeq et DNASeq :
– Calcul d’expression
– Comparaison d’expression entre échantillons
– Analyse exploratoire des données (analyses en composantes principales, analyses des correspondances multiples)

Identification de signatures de gènes différentiellement exprimés en fonction du fold change, p-value ajustée et AUC (Area Under ROC Curve ) (Volcano Plot, listes de gènes différentiellement exprimés et venn diagram entre les signatures).
Visualisation des gènes (Heatmap, scater plot).Tri statistiques des données multi-critères
Analyse fonctionnelle des gènes
– Intégration de données de bases publiques et propriétaires
– Exploration de données de métabolisme

Tri statistique des données multi-critères (RNA, mutations, CNV…) (Elastic Net, Random Forest)
Rédaction d’un rapport, aide à la publication et présentation des résultats

LIVRABLES & BÉNÉFICES

Documentations de l’étude (bibliographie)
Base de données génomique & transcriptomique (banques ADN, ADNc)
Rapports d’analyse fonctionnelle

Agronomie - Semences

ENTREPRISE & SUJET

Entreprise agroalimentaire : Analyse de données génomiques de semences pour identifier des gènes impliqués dans le processus de germination face au stress hydrique dans le cadre d’un projet de sélection végétale

BESOIN

Procéder aux étapes d’analyse bioinformatique et biostatistique d’un projet de génotypage (identification de signatures génétiques & moléculaires) de semences.

PRESTATIONS RÉALISÉES

Choix de la stratégie de séquençage (illumina)
Analyse des données NGS à puce à ADN (recherche de microsatellites SSR, SNP, insertion/ délétion)
Analyse des données NGS
– Mapping de données
– Identification de microsatellites SSR, SNP, insertion/ délétion

Contrôle qualité/ Nettoyage des données :
– Analyse exploratoire des données (ACP) permettant d’identifier visuellement une structure dans la population (à prendre ensuite en compte dans les modèles de GWAS)
– Ajustement des données grâce à modèle mixte (avec effets de l’environnement en fixe et effet génotype en aléatoire)

Analyse fonctionnelle des évènements chromosomiques
Identification de signatures de gènes différentiellement exprimés en fonction du fold change, p-value ajustée.
Etude d’association pangénomique (GWAS) permettant l’analyse des variations génétiques chez de nombreux individus, afin d’étudier la corrélation entre génotype et processus de germination
Analyse du déséquilibre de liaison entre marqueurs (LD: linkage disequilibrium)
Visualisation des p-values des régions génomiques impliquées dans la variation du caractère avec Manhattan plot
Rédaction d’un rapport, aide à la publication et présentation des résultats

LIVRABLES & BÉNÉFICES

Documentation de l’étude
Base de données génomique
Rapports présentant les régions génétiques et/ou gènes candidats impliqués dans le processus de stress hydrique des semences concernées

Cosmétique

ENTREPRISE & SUJET

Entreprise cosmétique : développement de produits cosmétiques innovants

BESOIN

Analyser l’impact d’un produit cosmétique sur la peau au travers des données de microbiote cutané

PRESTATIONS RÉALISÉES

Choix de la technologie de séquençage et de la stratégie d’analyse : séquençage ciblé 16S V3-V4, Illumina
Mise en place du workflow d’analyse
Data management : croisement des informations métagénomiques aux informations phénotypiques et environnementales
Identification des profils taxonomiques et abondances microbiennes des échantillons
– Alpha diversité (indices de diversité, richesse, variabilité)
– Beta diversité (calculs de distance, PCoA)

Analyse à différents niveaux de la taxonomie : phylum, class, order, family, genus, (species)
Interfaces de visualisation (DataViz) et exploration des résultats

LIVRABLES & BÉNÉFICES

Documentation de l’étude
Description du workflow d’analyse
Visualisations graphiques interactives
Rapport présentant les impacts du produit sur la flore cutanée

Agroalimentaire

ENTREPRISE & SUJET

Entreprise agroalimentaire : sélection de souches bactériennes

BESOIN

Annotation de souchier et identification de souches d’intérêt

PRESTATIONS RÉALISÉES

Assemblage hybride de données NGS
Annotation structurale et fonctionnelle des souches bactériennes
Contrôle qualité
Génomique comparative
Caractérisation d’opérons d’intérêt
Recherche de résistance et virulence
Identification de voies métaboliques et prédiction d’enzymes d’intérêt
Mise en place d’interfaces d’exploration

LIVRABLES & BÉNÉFICES

Documentation de l’étude
Pipeline d’analyse
Visualisations graphiques interactives
Base de données génomiques du souchier
Rapport

Epidémiologie

ENTREPRISE & SUJET

Laboratoire pharmaceutique : Lutte contre les maladies infectieuses

BESOIN

Caractérisation de souche et reconstruction de l’histoire épidémiologique

PRESTATIONS RÉALISÉES

Séquençages complets de souches bactériennes

Mapping de données sur le génome de référence épidémiologique

Identification de SNPs et événements chromosomiques

Caractérisation des variants (gènes, fonctions)

Intégration de bases de données spécialisées

Prédiction de résistance, virulence

Classification phylogénétique

LIVRABLES & BÉNÉFICES

Documentation de l’étude
Visualisations graphiques interactives
Classifications

Vétérinaire

ENTREPRISE & SUJET

Laboratoire vétérinaire : analyse conjointe de données multi-sources en lien avec des élevages d’animaux de rente

BESOIN

Création d’algorithmes de marchine learning pour déceler des variations génétiques en lien avec des données phénotypiques

PRESTATIONS RÉALISÉES

Gestion d’infrastructure de bases de données et infrastructure de base de calcul
Construction d’un algorithme / machine learning / deep learning
Construction d’un algorithme d’imputation de données manquantes par différentes méthodes (machine learning,…) ;
Mise en place d’une fonctionnalité « benchmark » pour les équipes terrain avec des comparaisons entre individus, produits, …
Construction d’une application basée sur les algorithmes développés et formation des utilisateurs ;

LIVRABLES & BÉNÉFICES

Documentations de l’étude
Rapports d’analyse fonctionnelle

soladis-logo-2017_omics-c-350-50

Soladis
6-8 rue Bellecombe
69006 LYON - FRANCE

Tél: +33(0)4.72.83.86.70
Fax: +33(0)4.72.83.86.71


Mentions Légales

NOUS CONTACTER

Inscrivez-vous à notre newsletter