la caverne d'Ali baba informatique.
la caverne d'Ali baba informatique.

Extraire les adresses email d’une page web

Voici une petite astuce qui permet de récupérer toutes les adresses emails d’une page Internet, en une seule ligne de commande sous Linux.

Il faudra bien sûr adapter l’adresse du site avant de lancer la commande :

wget -q -O – http://url-du-site.com | grep -oe ‘\w*.\w*@\w*.\w*.\w\+’ | sort -u

Exemple d’utilisation avec cette page :

wget -q -O – http://www.tux-planet.fr/extraire-les-adresses-email-d-une-page-web | grep -oe ‘\w*.\w*@\w*.\w*.\w\+’ | sort -u

pseudo@gmail.com
prenom.nom@yahoo.fr

Maintenant on comprend mieux pourquoi les spammeurs n’ont aucun mal à trouver les adresses email de leurs futures victimes.

L’astuce a été donnée par un certain « batp ».