+336 67 57 33 79

Nos formations en web scraping

Cette formation s'adresse aux développeurs PHP et/ou JavaScript/Nodejs souhaitant se former au web scraping. Pourquoi avoir regroupé ces deux langages dans une même vidéo ? Tout simplement parce que le contenu disponible à l'heure actuelle au sujet du web scraping concerne majoritairement le langage Python. Hors, nous somme nombreux à avoir appris le développement web via ces 2 langages complémentaires que sont le PHP et le JavaScript. De plus, le fait d'avoir un comparatif permet de mieux comprendre les spécificités propres à chaque langage. L'objectif de cette formation est donc de vous permettre d'avoir un aperçu global des notions et pratiques centrales qu'il faut intégrer lorsque l'on fait du scraping, et bien sûr de vous former sur différentes librairies complémentaires. La maitrise de ces différents outils vous permettra de disposer d'un champ de compétences assez large pour pouvoir vous adapter aux différents cas de figure face auxquels vous serez amenés à vous retrouver en tant que spécialiste en web scraping.

Ce que vous allez apprendre

Scraper une API avec des requêtes GET ou POST
Scraper un site web en parsant le code HTML
Exporter les données récoltées aux formats .txt et .csv
Enregistrer les données récoltées en base de données MySQL
Comprendre comment fonctionne les dispositifs anti-scraping
Conseils et bonnes pratiques pour un scraping respectueux et pérenne

Plan de la formation

  • 1 - Introduction
  • 2 - Effectuer des requêtes en direction d'une API via la librairie Axios (Nodejs)
  • 3 - Effectuer des requêtes en direction d'une API via la librairie cURL (PHP)
  • 4 - Effectuer une requête POST
  • 5 - Quelques précisions
  • 6 - TP N°1 - Scraping de l'API Wikipedia
  • 7 - TP N°1 - Correction
  • 8 - Récupérer de la donnée en parsant du code HTML en PHP et Nodejs - Introduction
  • 9 - Parser du code HTML avec la librairie Cheerio (Nodejs)
  • 10 - Ecriture des données récoltées aux formats .txt et .csv sous Cheerio (Nodejs)
  • 11 - Parser du code HTML avec la libraireie Simple HTML DOM Parser (PHP)
  • 12 - Ecriture des données récoltées aux formats .txt et .csv sous Simple HTML DOM Parser (PHP)
  • 13 - TP N°2 - Scraper le code HTML d'un site d'annonces immobilières
  • 14 - TP N°2 - Correction
  • 15 - Stocker les données récupérées en base de données
  • 16 - Astuces et bonnes pratiques pour éviter que son script se fasse bloquer - Introduction
  • 17 - Astuces et bonnes pratiques pour éviter que son script se fasse bloquer - Gestion des temps d'éxécution
  • 18 - Astuces et bonnes pratiques pour éviter que son script se fasse bloquer - L'User-Agent
  • 19 - Astuces et bonnes pratiques pour éviter que son script se fasse bloquer - La rotation d'IPs
  • 20 - Conclusion