You are here : Home > Research Centers and Units > Genoscope > Scientific Information Technol ... > Bioinformatics R&D and sequencing team

Bioinformatics R&D and sequencing team

Join us


​  

Published on 25 June 2018

L'équipe R&D Bioseq propose 5 stages de niveau bac+5 (université ou école d'ingénieurs) d'une durée de 6 mois à partir de début 2018.



SUJET A

Annotation fonctionnelle de protéomes Eucaryotes.

Dominante : Annotation, Génomique, Développement.

Descriptif : Une fois reconstituée la séquence génomique d'un organisme d'intérêt, l'équipe annote les régions codantes de cette dernière. L'annotation structurale repose sur des données biologiques et sur des prédicteurs ab-initio. A la suite de la prédiction des gènes, une étape clé consiste à assigner une fonction à chacun d'eux. En général, les méthodes existantes sont basées sur la recherche d'homologies dans les banques de données publiques. La mission du stagiaire consistera à développer une méthode d'annotation fonctionnelle en accord avec l'état de l'art et à l'intégrer dans le workflow d'analyse qualité.

Languages de scripts (Perl, Bash ...), Gestionnaire de workflows.




SUJET B

Logiciel de génomique comparative.

Dominante : Développement, Génomique comparative.

Descriptif : Lorsque l'on a séquencé et annoté un génome, on peut par la suite comparer ce dernier avec d'autres génomes disponibles dans les banques de données. Une des analyses consiste à regarder la conservation de l'ordre des gènes entre deux espèces. Il existe pour cela un logiciel développé en interne mais avec des fonctionnalités limitées (http://www.genoscope.cns.fr/orthodotter). Le stagiaire aura pour objectif d'enrichir les fonctionnalités de l'outil existant et de le valoriser (site web et/ou publication).

Techniques à mettre en œuvre: Perl, image vectorielle, github.




SUJET C

Développement d'outils autour de la technologie de séquençage par nanopores.

Dominante : Analyse Génomique, Séquençage

Descriptif : La plateforme de séquençage du Genoscope génère une grande quantité de données de séquençage à partir de la technologie commercialisée par Illumina. Ces données sont traitées par un workflow automatique de contrôle qualité permettant de valider les échantillons séquencés. L'arrivée du séquençage «longue lecture» par nanopore (Oxford Nanopore Technologies) nécessite le développement de nouveaux outils de contrôle qualité, ainsi que l'adaptation de traitements déjà existants pour la technologie Illumina, dans le but de les rendre compatibles avec les spécificités des données nanopore (taux d'erreur, longueur, débit ...). La mission du stagiaire consistera à mettre en oeuvre et intégrer dans le workflow d'analyse qualité, une méthode pour évaluer la qualité et nettoyer les données nanopore.

Techniques à mettre en œuvre: Perl, Gestionnaire de workflows.




SUJET D

Amélioration du catalogue de gènes issu des données Tara Océans.

Dominante : Analyse Génomique, Séquençage.

Descriptif : L'ensemble des données du projet Tara Océans sont générées à partir de la technologie commercialisée par Illumina. Cette technologie produit des fragments de petites tailles, il faut donc passer par une étape d'assemblage pour reconstituer les gènes présents dans un échantillon. L'arrivée du séquençage «longue lecture» par nanopore (Oxford Nanopore Technologies) permet de s'affranchir de cette étape d'assemblage et donc, permettra en théorie de reconstituer des gènes plus complets. La mission du stagiaire consistera à développer une méthode pour tirer partie de ces nouvelles données afin d'améliorer le catalogue de gènes existant.

Techniques à mettre en œuvre: Perl, Bash, Analyse génomique.




SUJET E

Mise en oeuvre d'une éthode de décontamination des assemblages.

Dominante : Analyse Génomique, Assemblage, Développement.

Descriptif : Pour séquencer le génome d'un organisme d'intérêt, il faut en premier lieu extraire l'ADN des cellules de celui-ci. Durant cette étape, il n'est pas rare d'extraire l'ADN d'autres organismes vivant en symbiose avec l'organisme étudié. Suite à l'assemblage, il faut donc être capable d'isoler les séquences génomiques d'intêrets, en général sur la base d'une assignation taxonomique. La mission du stagiaire consistera à tester et automatiser une méthode existante pour réaliser cette étape de décontamination.

Techniques à mettre en œuvre: Perl/Python, Bash, Gestionnaire de workflows.





INFORMATIONS COMPLÉMENTAIRES SUR LES STAGES


Durée : 6 mois
Date de validité : 01/01/2018
Rémunération : À partir de 700e brut (selon type d'étude) + tickets restaurant et éventuellement une aide au logement ou transport.


Merci de nous envoyer vos CV et lettre de motivation par mail.

Email: stage_rdbioseqgenoscope.cns.fr


Adresse:

Institut de biologie François Jacob
Genoscope
2 rue Gaston Crémieux
91000 Evry 
France