Livres

Alphorm – Data Science avec Python -Types de variables et operations (2019)-PART 1

By 19/06/2019 No Comments

Python est un langage à caractère général, versatile et riche en fonctionnalités. Et de ce fait, on peut y trouver pour son compte selon le domaine que l’on envisage de poursuivre et en l’occurrence,
nous pour ce second module de notre parcours Data Science, nous nous sommes concentrés sur les structures de données de base natives Python et l’étude du package Numpy
Il faut entendre par les structures de données les objets itérables qui sont le fondement même de la programmation Python. Il s’agit des listes, des tuples, … des chaînes de caractères et des dictionnaires
Dans ce module chaque type d’objet est abordé individuellement pour en connaître les méthodes et propriétés de manière pratiques
En parallèle, des objets particuliers tels que les dates et temps du module datetime, time …etc. sont aussi étudiés enfin d’avoir une vision globale de l’univers des types de données que peut manipuler Python et auxquels un data scientiste recourt inéluctablement
Dans cette même veine et pour donner une teinture scientifique à ce module (après tout nous n’apprenons pas que Python mais nous apprenons Python et son application au domaine de la science des données) nous avons étudié les types de nombres à travers
des modules de la librairie standard Python math, cmath, … et surtout le package Numpy notamment à travers la manipulation de son objet central l’objet ndarray qui permet de travailler avec les tableaux numériques multidimensionnels
Dans ce détour, très important en Data Science, nous avons abordé les concepts essentiels de l’algèbre linéaire étudiés certainement en cours : inversion, transposée, décompositions (valeurs et vecteurs propres, LU, SVD, …), etc.
De matrices et tout ceci à travers des exercices pratiques. Nous y voyons aussi les méthodes de statistiques de bases et des méthodes avancées de manipulations de données numériques
Nous abordons aussi le cas particulier des matrices creuses ou sparses matrix et du module random. Ce dernier permet la manipulation des nombres aléatoires qui est un prémisse aux méthodes d’échantillonnage
On a abordé également des applications diverses sur le produit de convolution et la transformée de Fourier discrète, etc.
Pour finir, ce module n’est pas des moindres dans le parcours que nous sommes entrain de dérouler au fur et à mesure, car les différents objets et opérations vus ici permettront plus tard de construire des structures et algorithmes plus ou moins complexes

OBJECTIFS

Découvrir les types de variables et objets majeurs (outres data frame car chapitre exclusif), leurs manipulations les plus courantes, les opérations de transformations
et mathématiques s’appliquant sur ces derniers qui sont importants dans le cadre de la Data Science (particulièrement dans le Scripting d’algorithmes)

PRÉREQUIS

Bonnes connaissances de l’environnement Microsoft Windows (gestion des fichiers) et maîtrise du clavier et de la souris, avoir suivi la formation précédente Prise en main des IDE est plus que fortement recommandé !

PUBLIC CONCERNÉ

Ce module vise essentiellement les débutants en Python et les expérimentés qui voudraient se remémorer des concepts bases importants. Toutefois, les métiers auxquels, il peut servir sont
Chargé des analyses statistiques numériques ou visuelles dans tous les domaines possibles et imaginables (biostatistique, pharmaceutique, banque, assurance, data science, data mining,
machine learning, industrie, ingénierie, chimie, text mining, image mining, science de l’information géographique, etc.)

CONTENU

1. Présentation de la formation
2. Les variables et instructions Python
3. Les nombres
4. Les booléens
5. Les listes
6. Les tuples
7. Les chaînes de caractères ou Strings
8. Les dictionnaires
9. Les ensembles ou Sets
10. Les dates et temps
11. Matrices – Introduction à Numpy
12. Autres précisions
13. Conclusion

download

Leave a Reply

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.