Si desidera imparare a configurare il server Apache per negare l'accesso a bot e crawler non in regola? In questa esercitazione configureremo il server Apache per bloccare l'accesso da bot e crawler non in regola.

• Ubuntu 20
• Ubuntu 19
• Ubuntu 18
• Apache 2.4.41

Nel nostro esempio, il server Apache ospita il sito Web WWW.GAMEKING.TIPS.

Elenco attrezzature

Nella sezione seguente viene presentato l'elenco delle attrezzature utilizzate per creare questa esercitazione.

Come Amazon Associate, guadagno dagli acquisti idonei.

Tutorial Apache - Blocco di bot e crawler cattivi

Cercare nel file di registro Apache un elenco di agenti utente.

Copy to Clipboard

Verrà visualizzato un elenco di agenti utente sospetti che hanno effettuato l'accesso al sito Web.

Copy to Clipboard

Creare un elenco di agenti utente da bloccare.

Copy to Clipboard

Facoltativamente, questo progetto GitHub offre un elenco di bot e crawler cattivi.

Attivare i moduli Apache richiesti.

Copy to Clipboard

Modificare il file di configurazione Apache per il sito Web predefinito.

Copy to Clipboard

Aggiungere le righe seguenti a questo file di configurazione.

Copy to Clipboard

Modificare i valori USER-AGENT in base alle proprie esigenze.

Copy to Clipboard

Ecco il file, prima della nostra configurazione.

Copy to Clipboard

Ecco il file, dopo la nostra configurazione.

Copy to Clipboard

Riavviare il servizio Apache.

Copy to Clipboard

Nel nostro esempio, il server Apache vieterà l'accesso a un elenco di bot e crawler selezionati dall'amministratore.

Da un computer Linux remoto, testare la configurazione.

Copy to Clipboard

Ecco l'output del comando.

Copy to Clipboard

Il server Apache vieterà l'accesso da specifici valori USER-AGENT.

Da un computer Linux remoto, provare a eseguire l'accesso utilizzando qualsiasi altro valore USER-AGENT.

Copy to Clipboard

Ecco l'output del comando.

Copy to Clipboard

Il server Apache consentirà a qualsiasi altro valore USER-AGENT di accedere al tuo sito web.

Congratulazioni! È stato illustrato come configurare il server Apache in modo da negare l'accesso a bot e crawler non autorizzati.