Le web scraping a évolué, passant d'une simple extraction basée sur des règles à des techniques plus avancées qui s'appuient sur de grands modèles de langage (LLM) pour l'extraction de données en fonction du contexte. ScrapegraphAI est à l'avant-garde de cette évolution, permettant le web scraping grâce à des LLM puissants comme OpenAI, Gemini, et même des modèles locaux comme Ollama. Dans ce blog, nous verrons ce qu'est ScrapegraphAI, comment elle fonctionne et nous présenterons un exemple concret de scraping de données à partir d'un site web avec intégration de proxy.
