Initiation à UNIX et à la gestion des big data

Initiation à UNIX et à la gestion des big data

MOTS-CLEFS : NGS, informatique, UNIX, big data, données ‘omiques.


PRÉREQUIS : Aucun.


OBJECTIFS :

Le module Initiation à UNIX et à la gestion des big data vise à vous initier aux commandes de base qui sont indispensables pour la manipulation des gros fichiers générés par les nouvelles technologies de séquençage à haut débit. Seront également introduites les commandes permettant d’accéder à un serveur distant où se trouvent généralement vos données d’intérêt.


PUBLIC CIBLÉ :

Toute personne souhaitant faire ses premiers pas dans le domaine ici abordé.


DATE ET LIEU :

21 et 22 janvier 2020 ; 9h00-17h30 ; pause déjeuner 13h00-14h00.

Agrocampus Ouest, 65 rue de saint Brieuc, Rennes.


PÉDAGOGIE :

La formation est essentiellement basée sur des travaux dirigés sur ordinateur.


FORMATEUR : Frédéric Lecerf.


TARIF ET INSCRIPTION :

Cliquez ici pour connaître les tarifs et vous inscrire.

Tarifs préférentiels par rapport aux tarifs affichés selon convention (certaines Ecoles doctorales et centres INRA).


PROGRAMME :

1. Initiation au système UNIX et aux principales commandes :

  • Le choix d’UNIX et ses particularités,
  • Principe de gestion de données,
  • Commandes essentielles à UNIX,
  • Traitements de fichiers :
    • Savoir extraire ou supprimer des lignes ou des colonnes,
    • Changer le format d’un fichier,
    • Fusionner des données,
    • Chercher des données dans un fichier,
    • Rapide introduction à AWK.


2. Analyse sur un cluster de calcul :

  • Topologie d’un cluster,
  • Commandes essentielles,
  • Modes direct ou batch ?


3. Notions avancées d’UNIX :

  • Qu’est-ce qu’un SHELL ?
  • Notion de variables d’environnement,
  • Gestion des processus.


4. Automatisation :

  • Introduction aux scripts UNIX,
  • Les boucles de traitements,
  • Analyse massive sur un cluster.

Related

Previous