Souhaitez-vous apprendre à configurer le serveur Apache pour refuser l’accès aux mauvais Bots et Crawlers ? Dans ce tutoriel, nous allons configurer le serveur Apache pour bloquer l’accès des mauvais bots et crawlers.

• Ubuntu 20
• Ubuntu 19
• Ubuntu 18
• Apache 2.4.41

Dans notre exemple, le serveur Apache héberge le site WWW.GAMEKING.TIPS.

Liste des équipements

La section suivante présente la liste des équipements utilisés pour créer ce didacticiel.

En tant qu’associé Amazon, je gagne des achats admissibles.

Tutoriel Apache - Blocage des mauvais bots et crawlers

Recherchez dans le fichier journal Apache une liste d’agents utilisateur.

Copy to Clipboard

Une liste d’utilisateurs-agents suspects ayant accé à votre site Web sera affichée.

Copy to Clipboard

Créez une liste d’agents utilisateur à bloquer.

Copy to Clipboard

En option, ce projet GitHub offre une liste de mauvais bots et crawlers.

Activez les modules Apache requis.

Copy to Clipboard

Modifiez le fichier de configuration Apache pour le site Web par défaut.

Copy to Clipboard

Ajoutez les lignes suivantes à ce fichier de configuration.

Copy to Clipboard

Modifiez les valeurs USER-AGENT pour refléter vos besoins.

Copy to Clipboard

Voici le fichier, avant notre configuration.

Copy to Clipboard

Voici le fichier, après notre configuration.

Copy to Clipboard

Redémarrez le service Apache.

Copy to Clipboard

Dans notre exemple, le serveur Apache interdra l’accès à une liste de Bots et crawlers sélectionnés par l’administrateur.

À partir d’un ordinateur Linux distant, testez votre configuration.

Copy to Clipboard

Voici la sortie de commande.

Copy to Clipboard

Le serveur Apache interdiquera l’accès à partir de valeurs UTILISATEUR-AGENT spécifiques.

À partir d’un ordinateur Linux distant, essayez d’effectuer l’accès en utilisant n’importe quelle autre valeur USER-AGENT.

Copy to Clipboard

Voici la sortie de commande.

Copy to Clipboard

Le serveur Apache permettra à toute autre valeur USER-AGENT d’accéder à votre site Web.

Félicitations! Vous avez appris à configurer le serveur Apache pour refuser l’accès aux mauvais Bots et Crawlers.