{"id":2195,"date":"2023-02-03T12:26:26","date_gmt":"2023-02-03T12:26:26","guid":{"rendered":"https:\/\/www.lucushost.com\/ayuda\/?p=2195"},"modified":"2023-02-07T12:11:34","modified_gmt":"2023-02-07T12:11:34","slug":"como-bloquear-el-trafico-de-bots","status":"publish","type":"post","link":"https:\/\/www.lucushost.com\/ayuda\/como-bloquear-el-trafico-de-bots\/","title":{"rendered":"C\u00f3mo bloquear el tr\u00e1fico de bots"},"content":{"rendered":"<p>Bot, robot, spider, craw&#8230; Este tipo de aplicaciones de software est\u00e1n programadas para realizar tareas de forma autom\u00e1tica y mucho m\u00e1s r\u00e1pida que si las hiciese un humano.<\/p>\n<p><!--more--><\/p>\n<p>Pr\u00e1cticamente, m\u00e1s de la mitad del tr\u00e1fico de Internet est\u00e1 compuesto por bots que se encargan de escanear e indexar contenido para los motores de b\u00fasqueda, interactuar con p\u00e1ginas web, chatear con usuarios o realizar actividades maliciosas como un ataque inform\u00e1tico. Y todos estos bots tienen una direcci\u00f3n IP asociada.<\/p>\n<p>Por tanto, hay actividades que realizan los bots que s\u00ed interesan, principalmente porque rastrean e indexan contenido en buscadores como Google o Yahoo, pero hay otros que realizan actividades como las siguientes que es conveniente bloquear:<\/p>\n<ul>\n<li>Copiar contenido web.<\/li>\n<li>Explorar vulnerabilidades y crear phising.<\/li>\n<li>Generar un uso excesivo de los recursos de tu plan de hosting, incluso llegando a provocar problemas de lentitud.<\/li>\n<li>Realizar ataques de fuerza bruta como los conocidos DDoS.<\/li>\n<li>Recolecci\u00f3n de direcciones de correo electr\u00f3nico.<\/li>\n<\/ul>\n<div class=\"tds-message-box box-council \">\u00bfQuieres saber m\u00e1s acerca de los bots? Te recomendamos que le eches un ojo a este art\u00edculo de nuestro blog:\u00a0<a href=\"https:\/\/www.lucushost.com\/blog\/que-es-un-bot\/\"><strong>Qu\u00e9 es un bot y para qu\u00e9 se utiliza<\/strong><\/a>. <\/div>\n<p>Y ahora la pregunta que seguramente te est\u00e9s haciendo es&#8230; \u00bfY c\u00f3mo bloqueo el tr\u00e1fico de bots maliciosos?<\/p>\n<p>Pues bien, puedes hacerlo de dos formas diferentes: modificando el fichero <em>.htaccess<\/em> o bien a trav\u00e9s del fichero <em>robots.txt<\/em>.<\/p>\n<h2>Bloquear el tr\u00e1fico de bots desde<em> .htaccess<\/em><\/h2>\n<p>Cuando detectas que est\u00e1 entrando a tu web tr\u00e1fico malicioso, es recomendable que redirecciones todas esas peticiones a una direcci\u00f3n que no existe.<\/p>\n<p>En este ejemplo vamos a bloquear el tr\u00e1fico del bot PetalBot. Para ello, establecemos las siguientes l\u00edneas de c\u00f3digo en el .<em>htaccess<\/em>:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">RewriteEngine On\r\nRewriteCond %{HTTP_USER_AGENT} \"(PetalBot|petalsearch.com)\" [NC]\r\nRewriteRule .* - [F,L]<\/pre>\n<p>Para bloquear varios bots a la vez, simplemente hay que a\u00f1adir una l\u00ednea m\u00e1s por cada uno de ellos:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">RewriteCond %{HTTP_USER_AGENT} \"(xxxxxxxx|xxxxxxxxxx)\" [NC]<\/pre>\n<p>Para que veas un caso real, aqu\u00ed bloqueamos el tr\u00e1fico de SeekportBot y PetalBot:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">RewriteEngine On\r\nRewriteCond %{HTTP_USER_AGENT} \"(SeekportBot|seekport.com)\" [NC]\r\nRewriteCond %{HTTP_USER_AGENT} \"(PetalBot|petalsearch.com )\" [NC]\r\nRewriteRule .* - [F,L]<\/pre>\n<h2>Bloquear el tr\u00e1fico de bots desde<em> robots.txt<br \/>\n<\/em><\/h2>\n<p>Desde el archivo <em>robots.txt<\/em> puedes definir reglas que sugieran a los bots que no accedan ni rastreen el contenido de parte o todo tu sitio.<\/p>\n<p>Por ejemplo, con la siguiente regla puedes bloquear el tr\u00e1fico de Petalbot de tu sitio web:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">User-agent: PetalBot \r\nDisallow: \/<\/pre>\n<p>Tambi\u00e9n es muy habitual utilizar reglas en el<em> robots.txt<\/em> cuando no queremos que Google (o cualquier otro motor de b\u00fasqueda) rastree ciertas secciones de una p\u00e1gina web como, por ejemplo, el \u00e1rea de clientes.<\/p>\n<p>Tomando de base este ejemplo, si no queremos que Google rastree el \u00e1rea de cliente de tu sitio, tendr\u00edas que establecer en el <em>robots.txt<\/em> lo siguiente:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">User-agent: Googlebot\r\nDisallow: \/area-de-clientes<\/pre>\n<p>En cambio, si lo que no quieres es que ning\u00fan bot acceda a esa url, tienes que establecer:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">User-agent: *\r\nDisallow: \/area-de-clientes<\/pre>\n<p>Si utilizas WordPress, por norma general tambi\u00e9n se indica a los motores de b\u00fasqueda que no accedan a la URL de administraci\u00f3n, es decir, al <em>\/wp-admin<\/em>:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">User-agent: * \r\nDisallow: \/wp-admin<\/pre>\n<div class=\"tds-message-box box-council \">Para conocer m\u00e1s a fondo qu\u00e9 es el archivo <em>robots.txt<\/em>, los comandos a utilizar y c\u00f3mo enviarlo a Google te recomiendo que le eches un ojo a esta gu\u00eda de nuestro blog: <strong><a href=\"https:\/\/www.lucushost.com\/blog\/archivo-robots-txt\/\">Archivo Robots.txt: Qu\u00e9 es y c\u00f3mo crearlo<\/a>.<\/strong><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Bot, robot, spider, craw&#8230; Este tipo de aplicaciones de software est\u00e1n programadas para realizar tareas de forma autom\u00e1tica y mucho m\u00e1s r\u00e1pida que si las hiciese un humano.<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[7],"tags":[],"acf":[],"_links":{"self":[{"href":"https:\/\/www.lucushost.com\/ayuda\/wp-json\/wp\/v2\/posts\/2195"}],"collection":[{"href":"https:\/\/www.lucushost.com\/ayuda\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.lucushost.com\/ayuda\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.lucushost.com\/ayuda\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.lucushost.com\/ayuda\/wp-json\/wp\/v2\/comments?post=2195"}],"version-history":[{"count":7,"href":"https:\/\/www.lucushost.com\/ayuda\/wp-json\/wp\/v2\/posts\/2195\/revisions"}],"predecessor-version":[{"id":2203,"href":"https:\/\/www.lucushost.com\/ayuda\/wp-json\/wp\/v2\/posts\/2195\/revisions\/2203"}],"wp:attachment":[{"href":"https:\/\/www.lucushost.com\/ayuda\/wp-json\/wp\/v2\/media?parent=2195"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.lucushost.com\/ayuda\/wp-json\/wp\/v2\/categories?post=2195"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.lucushost.com\/ayuda\/wp-json\/wp\/v2\/tags?post=2195"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}