SlideShare a Scribd company logo
1 of 6
Download to read offline
Compte rendue TP1 de Génie de connaissance Dép. de Maths
Sahar Ben Mabrouk MP MATIS 2 FSS 05/11/2020
But du TP :
• savoir charger et manipuler une base de données à partir du bibliothèque Scikits-learn et
pandas
• Créer une base de données et la manipuler
Introduction :
Ce TP nous allons avoir une idée générale sur les bibliothèques Pandas et Scikits-learn et leurs utilités dans la
machine Learning et les différents algorithmes d’apprentissage que ces deux librairies couvrent. On va
essayer d’exécuter le code pour charger et créer (load) une base de données , connaitre ces classes et ses
attributs et la manipuler
Manipulation du TP :
Des installations préalables : on doit installer les bibliothèques pandas et scikits-learn
I -Base de Données du cancer du sein
Maintenant on va charger la base de données du cancer du sein dans la variable ‘breast’ en
exécutant le code déjà existé dans la fiche de TP1 :
Visualiser son type avec commande ‘type()’
Visualiser les attributs de cette classe avec la commande ‘dir()’
La variable breast est de type class
On obtient une liste d’attributs (sous classes de
la classe) où chaque attribut est de type
spécifique
La liste des caractéristiques
On visualise Les informations
les noms des deux buts d’apprentissage ce sont deux classes ( deux types du cancer du sein)
On obtient Une liste de sous listes des
valeurs numériques
La description de la base de données
II- Lecture et manipulation base de données de type csv
on va crées un fichier csv et le remplir ,ligne par ligne, les notes et puis l’enregistrer dans un dossier
peut être traiter par anaconda
Le nombre d’échantillons malignes (classe 0) et bénigne (classe1)
Dans la description on trouve une liste des caractéristiques , de statistiques ,
nombres d’échantillons , l’auteur et d’autre informations
On exécute le code suivant qui sert à lire le contenu du fichier et d’afficher les données :
Maintenant on va reconstruire ce tableau dans le fichier csv vide ‘liste2.csv’
En python3, on peut effectuer la boucle for dans un tableau ,ou chaine de caractères ou une
liste c’est pour ça on a chargé les données du ‘liste1.csv’ dans la variable lecture (de type
csv.reader) et on a effectué un boucle for : en itérant ligne par ligne on va afficher sa
contenue et remplir la lise T par concaténation à la fin en utilisant ’ append()’
Chaque ligne de lecture est une liste, T est une liste
des listes
Et si on affiche le contenue du liste2.csv on trouve le même tableau
On peut ajouter une ligne au fichier liste1.csv
Maintenant on va calculer la moyenne, pour cela on construit la fonction moyenne qui prend en
variable d’entrée une liste et retourne un réel
Dans la variable moy de type liste on
va mettre juste les moyennes après
avoir les calculé par la fonction
moyenne dont la variable d’entrée est
‘l’ la liste des notes en chaque ligne
de T
On remarque que la ligne s’ajoute au
tableau Excel dans le fichier liste1.csv
dans ce code on affiche la colonne des moyennes et la liste T
après avoir crée un fichier csv vide nommé ‘liste3’ et le fermé on exécute ce code
La colonne des moyennes s’y ajoute

More Related Content

Similar to TP1 Data science: manipulation d'une base de donnée

FormationPython2019.pptx
FormationPython2019.pptxFormationPython2019.pptx
FormationPython2019.pptxLamissGhoul1
 
Chapitre 3 elements de base de java
Chapitre 3  elements de base de javaChapitre 3  elements de base de java
Chapitre 3 elements de base de javaAmir Souissi
 
Comment alimenter une liste déroulante dans Word avec une liste Excel ?
Comment alimenter une liste déroulante dans Word avec une liste Excel ?Comment alimenter une liste déroulante dans Word avec une liste Excel ?
Comment alimenter une liste déroulante dans Word avec une liste Excel ?Votre Assistante
 
5- understandinggJava_Collections_v4.pdf
5- understandinggJava_Collections_v4.pdf5- understandinggJava_Collections_v4.pdf
5- understandinggJava_Collections_v4.pdfAliouDiallo24
 
Analyse de données JSON dans Openrefine
Analyse de données JSON dans OpenrefineAnalyse de données JSON dans Openrefine
Analyse de données JSON dans OpenrefineMathieu Saby
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian Lilia Sfaxi
 
Rapport-du-projet CNN.docx
Rapport-du-projet CNN.docxRapport-du-projet CNN.docx
Rapport-du-projet CNN.docxkhalil Ismail
 
Cours java smi 2007 2008
Cours java smi 2007 2008Cours java smi 2007 2008
Cours java smi 2007 2008Khalil Lechheb
 
Cours java smi 2007 2008
Cours java smi 2007 2008Cours java smi 2007 2008
Cours java smi 2007 2008Khalil Lechheb
 
Base NoSql et Python
Base NoSql et PythonBase NoSql et Python
Base NoSql et Pythonyboussard
 
Créer des flux RSS avec Yahoo! Pipes et son module xPath
Créer des flux RSS avec Yahoo! Pipes et son module xPathCréer des flux RSS avec Yahoo! Pipes et son module xPath
Créer des flux RSS avec Yahoo! Pipes et son module xPathErwan Tanguy
 
PROGRAMMATION 2e GENIE PARTIE THEORIE.ppt
PROGRAMMATION 2e GENIE PARTIE THEORIE.pptPROGRAMMATION 2e GENIE PARTIE THEORIE.ppt
PROGRAMMATION 2e GENIE PARTIE THEORIE.pptEddySHANGA
 
SIBD101-Introduction aux bases de données.pdf
SIBD101-Introduction aux bases de données.pdfSIBD101-Introduction aux bases de données.pdf
SIBD101-Introduction aux bases de données.pdfNadim ELSAKAAN
 
Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partieRéalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partieGautier Poupeau
 

Similar to TP1 Data science: manipulation d'une base de donnée (20)

FormationPython2019.pptx
FormationPython2019.pptxFormationPython2019.pptx
FormationPython2019.pptx
 
Chapitre 3 elements de base de java
Chapitre 3  elements de base de javaChapitre 3  elements de base de java
Chapitre 3 elements de base de java
 
Comment alimenter une liste déroulante dans Word avec une liste Excel ?
Comment alimenter une liste déroulante dans Word avec une liste Excel ?Comment alimenter une liste déroulante dans Word avec une liste Excel ?
Comment alimenter une liste déroulante dans Word avec une liste Excel ?
 
Analyzing a churn data set
Analyzing a churn data set Analyzing a churn data set
Analyzing a churn data set
 
5- understandinggJava_Collections_v4.pdf
5- understandinggJava_Collections_v4.pdf5- understandinggJava_Collections_v4.pdf
5- understandinggJava_Collections_v4.pdf
 
Analyse de données JSON dans Openrefine
Analyse de données JSON dans OpenrefineAnalyse de données JSON dans Openrefine
Analyse de données JSON dans Openrefine
 
Les listes en Python
Les listes en PythonLes listes en Python
Les listes en Python
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian
 
Rapport-du-projet CNN.docx
Rapport-du-projet CNN.docxRapport-du-projet CNN.docx
Rapport-du-projet CNN.docx
 
Python.pptx
Python.pptxPython.pptx
Python.pptx
 
Cours java smi 2007 2008
Cours java smi 2007 2008Cours java smi 2007 2008
Cours java smi 2007 2008
 
Cours java smi 2007 2008
Cours java smi 2007 2008Cours java smi 2007 2008
Cours java smi 2007 2008
 
Base NoSql et Python
Base NoSql et PythonBase NoSql et Python
Base NoSql et Python
 
Créer des flux RSS avec Yahoo! Pipes et son module xPath
Créer des flux RSS avec Yahoo! Pipes et son module xPathCréer des flux RSS avec Yahoo! Pipes et son module xPath
Créer des flux RSS avec Yahoo! Pipes et son module xPath
 
PROGRAMMATION 2e GENIE PARTIE THEORIE.ppt
PROGRAMMATION 2e GENIE PARTIE THEORIE.pptPROGRAMMATION 2e GENIE PARTIE THEORIE.ppt
PROGRAMMATION 2e GENIE PARTIE THEORIE.ppt
 
Rapport Projet Module Complexité
Rapport Projet Module ComplexitéRapport Projet Module Complexité
Rapport Projet Module Complexité
 
SIBD101-Introduction aux bases de données.pdf
SIBD101-Introduction aux bases de données.pdfSIBD101-Introduction aux bases de données.pdf
SIBD101-Introduction aux bases de données.pdf
 
Introduction à Python
Introduction à PythonIntroduction à Python
Introduction à Python
 
Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partieRéalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
 
Cours1 2 gdmm
Cours1 2 gdmmCours1 2 gdmm
Cours1 2 gdmm
 

More from SaharBenMabrouk

S2 TP1 partie 2: traitement de signal numérique
S2 TP1 partie 2: traitement de signal numériqueS2 TP1 partie 2: traitement de signal numérique
S2 TP1 partie 2: traitement de signal numériqueSaharBenMabrouk
 
S2 TP5: traitement d'image: seuillage en basant sur l'histogramme
S2 TP5: traitement d'image: seuillage en basant sur l'histogrammeS2 TP5: traitement d'image: seuillage en basant sur l'histogramme
S2 TP5: traitement d'image: seuillage en basant sur l'histogrammeSaharBenMabrouk
 
S2 TP4: traitement d'image: transformer de Fourier d'une image et filtre usuels
S2 TP4: traitement d'image: transformer de Fourier d'une image et filtre usuelsS2 TP4: traitement d'image: transformer de Fourier d'une image et filtre usuels
S2 TP4: traitement d'image: transformer de Fourier d'une image et filtre usuelsSaharBenMabrouk
 
S2 TP3: traitement d'image: filtrage rehaussement de contour
S2 TP3: traitement d'image: filtrage rehaussement de contourS2 TP3: traitement d'image: filtrage rehaussement de contour
S2 TP3: traitement d'image: filtrage rehaussement de contourSaharBenMabrouk
 
S2TP4 : traitement d'image : les images couleurs
S2TP4 : traitement d'image : les images couleursS2TP4 : traitement d'image : les images couleurs
S2TP4 : traitement d'image : les images couleursSaharBenMabrouk
 
S1TP3.1: traitement d'image : histogramme
S1TP3.1: traitement d'image : histogramme S1TP3.1: traitement d'image : histogramme
S1TP3.1: traitement d'image : histogramme SaharBenMabrouk
 
Tp3 traitement image: morphologie: propriétés des opérateurs morphologiques
Tp3 traitement image: morphologie: propriétés des opérateurs morphologiquesTp3 traitement image: morphologie: propriétés des opérateurs morphologiques
Tp3 traitement image: morphologie: propriétés des opérateurs morphologiquesSaharBenMabrouk
 
TP2 traitement d'image: gradients morphologiques ouverture fermeture
TP2 traitement d'image: gradients morphologiques ouverture fermetureTP2 traitement d'image: gradients morphologiques ouverture fermeture
TP2 traitement d'image: gradients morphologiques ouverture fermetureSaharBenMabrouk
 

More from SaharBenMabrouk (8)

S2 TP1 partie 2: traitement de signal numérique
S2 TP1 partie 2: traitement de signal numériqueS2 TP1 partie 2: traitement de signal numérique
S2 TP1 partie 2: traitement de signal numérique
 
S2 TP5: traitement d'image: seuillage en basant sur l'histogramme
S2 TP5: traitement d'image: seuillage en basant sur l'histogrammeS2 TP5: traitement d'image: seuillage en basant sur l'histogramme
S2 TP5: traitement d'image: seuillage en basant sur l'histogramme
 
S2 TP4: traitement d'image: transformer de Fourier d'une image et filtre usuels
S2 TP4: traitement d'image: transformer de Fourier d'une image et filtre usuelsS2 TP4: traitement d'image: transformer de Fourier d'une image et filtre usuels
S2 TP4: traitement d'image: transformer de Fourier d'une image et filtre usuels
 
S2 TP3: traitement d'image: filtrage rehaussement de contour
S2 TP3: traitement d'image: filtrage rehaussement de contourS2 TP3: traitement d'image: filtrage rehaussement de contour
S2 TP3: traitement d'image: filtrage rehaussement de contour
 
S2TP4 : traitement d'image : les images couleurs
S2TP4 : traitement d'image : les images couleursS2TP4 : traitement d'image : les images couleurs
S2TP4 : traitement d'image : les images couleurs
 
S1TP3.1: traitement d'image : histogramme
S1TP3.1: traitement d'image : histogramme S1TP3.1: traitement d'image : histogramme
S1TP3.1: traitement d'image : histogramme
 
Tp3 traitement image: morphologie: propriétés des opérateurs morphologiques
Tp3 traitement image: morphologie: propriétés des opérateurs morphologiquesTp3 traitement image: morphologie: propriétés des opérateurs morphologiques
Tp3 traitement image: morphologie: propriétés des opérateurs morphologiques
 
TP2 traitement d'image: gradients morphologiques ouverture fermeture
TP2 traitement d'image: gradients morphologiques ouverture fermetureTP2 traitement d'image: gradients morphologiques ouverture fermeture
TP2 traitement d'image: gradients morphologiques ouverture fermeture
 

Recently uploaded

SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdfSKennel
 
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...maach1
 
Câblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfCâblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfmia884611
 
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdf
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdfActions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdf
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdfalainfahed961
 
CHAPITRE 2 VARIABLE ALEATOIRE probabilité.ppt
CHAPITRE 2 VARIABLE ALEATOIRE probabilité.pptCHAPITRE 2 VARIABLE ALEATOIRE probabilité.ppt
CHAPITRE 2 VARIABLE ALEATOIRE probabilité.pptbentaha1011
 
présentation sur la logistique (4).
présentation     sur la  logistique (4).présentation     sur la  logistique (4).
présentation sur la logistique (4).FatimaEzzahra753100
 

Recently uploaded (8)

Note agro-climatique n°2 - 17 Avril 2024
Note agro-climatique n°2 - 17 Avril 2024Note agro-climatique n°2 - 17 Avril 2024
Note agro-climatique n°2 - 17 Avril 2024
 
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
 
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...
Cours-de-Ponts Cours de Ponts Principes généraux - Conception Méthodes de con...
 
Câblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdfCâblage, installation et paramétrage d’un réseau informatique.pdf
Câblage, installation et paramétrage d’un réseau informatique.pdf
 
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdf
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdfActions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdf
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdf
 
CHAPITRE 2 VARIABLE ALEATOIRE probabilité.ppt
CHAPITRE 2 VARIABLE ALEATOIRE probabilité.pptCHAPITRE 2 VARIABLE ALEATOIRE probabilité.ppt
CHAPITRE 2 VARIABLE ALEATOIRE probabilité.ppt
 
CAP2ER_GC_Presentation_Outil_20240422.pptx
CAP2ER_GC_Presentation_Outil_20240422.pptxCAP2ER_GC_Presentation_Outil_20240422.pptx
CAP2ER_GC_Presentation_Outil_20240422.pptx
 
présentation sur la logistique (4).
présentation     sur la  logistique (4).présentation     sur la  logistique (4).
présentation sur la logistique (4).
 

TP1 Data science: manipulation d'une base de donnée

  • 1. Compte rendue TP1 de Génie de connaissance Dép. de Maths Sahar Ben Mabrouk MP MATIS 2 FSS 05/11/2020 But du TP : • savoir charger et manipuler une base de données à partir du bibliothèque Scikits-learn et pandas • Créer une base de données et la manipuler Introduction : Ce TP nous allons avoir une idée générale sur les bibliothèques Pandas et Scikits-learn et leurs utilités dans la machine Learning et les différents algorithmes d’apprentissage que ces deux librairies couvrent. On va essayer d’exécuter le code pour charger et créer (load) une base de données , connaitre ces classes et ses attributs et la manipuler Manipulation du TP : Des installations préalables : on doit installer les bibliothèques pandas et scikits-learn I -Base de Données du cancer du sein Maintenant on va charger la base de données du cancer du sein dans la variable ‘breast’ en exécutant le code déjà existé dans la fiche de TP1 : Visualiser son type avec commande ‘type()’ Visualiser les attributs de cette classe avec la commande ‘dir()’ La variable breast est de type class On obtient une liste d’attributs (sous classes de la classe) où chaque attribut est de type spécifique
  • 2. La liste des caractéristiques On visualise Les informations les noms des deux buts d’apprentissage ce sont deux classes ( deux types du cancer du sein) On obtient Une liste de sous listes des valeurs numériques
  • 3. La description de la base de données II- Lecture et manipulation base de données de type csv on va crées un fichier csv et le remplir ,ligne par ligne, les notes et puis l’enregistrer dans un dossier peut être traiter par anaconda Le nombre d’échantillons malignes (classe 0) et bénigne (classe1) Dans la description on trouve une liste des caractéristiques , de statistiques , nombres d’échantillons , l’auteur et d’autre informations
  • 4. On exécute le code suivant qui sert à lire le contenu du fichier et d’afficher les données : Maintenant on va reconstruire ce tableau dans le fichier csv vide ‘liste2.csv’ En python3, on peut effectuer la boucle for dans un tableau ,ou chaine de caractères ou une liste c’est pour ça on a chargé les données du ‘liste1.csv’ dans la variable lecture (de type csv.reader) et on a effectué un boucle for : en itérant ligne par ligne on va afficher sa contenue et remplir la lise T par concaténation à la fin en utilisant ’ append()’ Chaque ligne de lecture est une liste, T est une liste des listes
  • 5. Et si on affiche le contenue du liste2.csv on trouve le même tableau On peut ajouter une ligne au fichier liste1.csv Maintenant on va calculer la moyenne, pour cela on construit la fonction moyenne qui prend en variable d’entrée une liste et retourne un réel Dans la variable moy de type liste on va mettre juste les moyennes après avoir les calculé par la fonction moyenne dont la variable d’entrée est ‘l’ la liste des notes en chaque ligne de T On remarque que la ligne s’ajoute au tableau Excel dans le fichier liste1.csv
  • 6. dans ce code on affiche la colonne des moyennes et la liste T après avoir crée un fichier csv vide nommé ‘liste3’ et le fermé on exécute ce code La colonne des moyennes s’y ajoute