Bien sûr ! Voici un programme Python pour scraper des sites web sur le sujet du streaming et extraire des données. Nous utiliserons la bibliothèque `BeautifulSoup` pour le scraping et `requests` pour les requêtes HTTP. Pour un ton fun, nous allons ajouter quelques commentaires amusants et des messages de succès lorsque les données sont extraites.
« `python
import requests
from bs4 import BeautifulSoup
def scrape_streaming_sites(url):
# Envoie une requête HTTP GET à l’URL spécifiée
response = requests.get(url)
# Si la requête échoue, on rit un peu et on passe à autre chose
if response.status_code != 200:
print(f »Oh non, le site {url} est introuvable ! Peut-être qu’il est en vacances 🌴 »)
return None
# Parse le contenu HTML de la page
soup = BeautifulSoup(response.content, ‘html.parser’)
# Extrait les titres des articles (par exemple)
articles = soup.find_all(‘h2’)
# Prépare un message fun pour afficher les résultats
print(« Préparez-vous à être impressionné par ce que nous avons trouvé ! 🎊 »)
for article in articles:
print(f »Titre trouvé : {article.text.strip()} »)
print(« Et voilà, mission accomplie ! 🎉 »)
return articles
def main():
urls_to_scrape = [
‘https://www.example.com/streaming’,
‘https://www.another-example.com/streaming’
]
for url in urls_to_scrape:
print(f »Scrapage en cours pour {url}… 🕵️♂️ »)
scrape_streaming_sites(url)
print(« ————————————–« )
if __name__ == « __main__ »:
main()
« `
Explications amusantes :
1. **Requête HTTP** : On envoie une requête à l’URL et on vérifie si le site est disponible. Si ce n’est pas le cas, on imagine que le site est en vacances 🌴.
2. **Parsing HTML** : On utilise `BeautifulSoup` pour parseur le contenu HTML et extraire les titres des articles.
3. **Messages funs** : On ajoute des messages amusants pour rendre le programme plus sympathique et engageant.
Remarques :
– Assurez-vous d’avoir les bibliothèques `requests` et `beautifulsoup4` installées. Vous pouvez les installer via pip :
« `bash
pip install requests beautifulsoup4
« `
– Ce script est un exemple de base. Les sites web peuvent avoir des structures HTML différentes, donc vous devrez peut-être ajuster les sélecteurs (`soup.find_all(‘h2’)`) en fonction de la structure spécifique des pages que vous scrapez.
Amusez-vous bien avec votre programme de scraping fun et coloré ! 🌈💻