
Introduction au Web Scraping avec Python
CODE RECKONS
Objectif pédagogique :
L'objectif de cette formation est d'enseigner aux apprenants à extraire, traiter et stocker des données à partir de sites Web, à l'aide de Python. Cela en se concentrant sur des pratiques de Web-scraping efficaces, évolutives et éthiques.
Bénéfices attendus :
À la fin de ce cours, les apprenants seront en mesure d'extraire des données à l'aide de requêtes, de BeautifulSoup et de Selenium, de nettoyer et stocker les données récupérées dans des formats tels que CSV ou JSON, de faire évoluer le Web-scraping avec des proxys et la concurrence, ainsi que de suivre des pratiques de Web-scraping légales et éthiques.
Public :
Ingénieurs, techniciens et scientifiques ayant une première expérience en Python.
I. Introduction au web scraping
Qu’est-ce que le web scraping.Limitations.
Les APIs comme alternative au scraping.
II. Requêtes HTTP et bases du HTML
Requêtes HTTP (GET / POST).Codes de statut HTTP basiques.
Utilisation de la bibliothèque requests.
La structure de base d’une page HTML.
III. Introduction à BeautifulSoup
Qu’est-ce que BeautifulSoup ?Analyse (parsing) du HTML et extraction de données.
IV. Introduction à Selenium
Qu’est-ce que Selenium ?Bases de l’automatisation de navigateur.
Interaction avec des pages web.
Localisation des éléments.
V. Nettoyage et stockage des données
Nettoyage des données.Stockage des données dans différents formats.
VI. Mise à l’échelle du web scraping
Utilisation de proxies.Scraping parallèle.
VII. Considérations légales et éthiques
Plateforme en ligne
haute disponibilité
Sur mesure
formation adaptée
À propos du centre CODE RECKONS
CODE RECKONS est une société de recherche informatique spécialiste de la performance et des architectures modernes. Nous mettons en valeur les dernières normes du langage C++, afin de faciliter l'intégration dans l'industrie de leurs dernières nouveautés.
À l'ISO (AFNOR) depuis 2014 pour sa participation la normalisation du langage, l'équipe de CODE RECKONS est une référence en France du langage C++.
Le projet CODE RECKONS s'est monté suite à des années d'expérience de la même équipe fondatrice, dans la prestation et l'analyse informatiques de très haute qualité. L'équipe a bénéficié d'une reconnaissance internationale auprès des plus grands comptes.
Notre offre repose sur notre expérience et sur une demande naissante chez tous nos clients.
Notre objectif est de vous rendre autonomes sur toute la chaîne de développement, à travers de la formation pour les outils (architectures, bibliothèques, Open Source...), de la formation de pointe sur la programmation informatique notamment en C++, et du pilotage de code.
PARCOURS SCIENTIFIQUES ET TECHNIQUES de la responsabilité pédagogique de CODE RECKONS
Joël FALCOU :
- Ingénieur diplômé en informatique
- Docteur en électronique et robotique de l'Université Blaise Pascal de Clermont-Ferrand
- Maître de conférence HDR de l'Université Paris-Saclay
- Membre du Comité National auprès de l'AFNOR pour l'ISO depuis 2011 en tant qu'expert C++
- Créateur et Président de l'association C++FRUG, co-animateur du Meetup C++.
- Présentateur dans de multiples conférences internationales comme BoostCon, C++Now, C++Russia, CppCON et Meeting C++
- Président de CPPP (C++ Paris), le rendez-vous annuel francophone
Jean-Thierry LAPRESTÉ :
- Thèse de troisième cycle en Mathématiques en 1973
- Assistant en Mathématiques au département de Mathématiques appliquées de l'université Blaise Pascal de 1972 à 1981
- Assistant en Mathématiques au département de Mathématiques appliquées à l'École Nationale Supérieure de Chimie de Clermont-Ferrand de 1981 à 1993
- Habilitation à diriger des travaux de recherche (HDR) en 1992
- Directeur de Recherche et membre du jury de multiples professeurs d'aujourd'hui
- Professeur des Universités en 61ème section de septembre 1993 à 2010
- Responsable des Mathématiques et de l'Informatique à l'École Nationale Supérieure de Chimie de Clermont-Ferrand
- Professeur émérite depuis 2010
- Auteurs de trois ouvrages en programmation informatique pour les ingénieurs
Envie d’en savoir plus sur cette formation ?
Documentez-vous sur la formation


