{"id":6067,"date":"2024-08-27T10:00:29","date_gmt":"2024-08-27T09:00:29","guid":{"rendered":"https:\/\/www.lucushost.com\/blog\/?p=6067"},"modified":"2025-10-28T09:21:55","modified_gmt":"2025-10-28T08:21:55","slug":"archivo-robots-txt","status":"publish","type":"post","link":"https:\/\/www.lucushost.com\/blog\/archivo-robots-txt\/","title":{"rendered":"Archivo Robots.txt: Qu\u00e9 es y c\u00f3mo crearlo"},"content":{"rendered":"<p>Cuando lanzas una p\u00e1gina web o una tienda online necesitas que Google rastree la informaci\u00f3n, pero tambi\u00e9n tienes que darle una serie de directrices o instrucciones acerca de c\u00f3mo debe interactuar con tu contenido. Por tanto, necesitas crear un archivo robots.txt.<\/p>\n<p><!--more--><\/p>\n<p>Pero, \u00bfsabes qu\u00e9 es el archivo robots.txt y para qu\u00e9 sirve? \u00bfNecesitas ayuda para crear uno?<\/p>\n<p>Si es as\u00ed, sigue leyendo porque en este art\u00edculo te explico todo lo que necesitas sabes sobre el archivo robots.txt y c\u00f3mo crear y subir el tuyo a Google.<\/p>\n<p>\u00a1Empecemos!<\/p>\n<div id=\"toc_container\" class=\"no_bullets\"><p class=\"toc_title\">Tabla de contenidos:<\/p><ul class=\"toc_list\"><li><a href=\"#Que_es_el_archivo_robotstxt\">\u00bfQu\u00e9 es el archivo robots.txt?<\/a><ul><li><a href=\"#No_confundas_noindex_con_robotstxt\">No confundas noindex con robots.txt<\/a><\/li><\/ul><\/li><li><a href=\"#Por_que_es_importante_el_archivo_robotstxt\">\u00bfPor qu\u00e9 es importante el archivo robots.txt?<\/a><\/li><li><a href=\"#Como_funciona_un_archivo_robotstxt\">\u00bfC\u00f3mo funciona un archivo robots.txt?<\/a><ul><li><a href=\"#Ubicacion_del_archivo\">Ubicaci\u00f3n del archivo<\/a><\/li><li><a href=\"#Estructura_del_archivo\">Estructura del archivo<\/a><\/li><li><a href=\"#Comportamiento_de_los_bots\">Comportamiento de los bots<\/a><\/li><li><a href=\"#Limitaciones\">Limitaciones<\/a><\/li><\/ul><\/li><li><a href=\"#Donde_esta_el_archivo_robotstxt\">\u00bfD\u00f3nde est\u00e1 el archivo robots.txt?<\/a><\/li><li><a href=\"#Reglas_y_formato_del_archivo_robotstxt\">Reglas y formato del archivo robots.txt<\/a><\/li><li><a href=\"#Principales_comandos_de_robotstxt\">Principales comandos de robots.txt<\/a><ul><li><a href=\"#Comando_User-agent\">Comando User-agent<\/a><\/li><li><a href=\"#Comando_Disallow\">Comando Disallow<\/a><\/li><li><a href=\"#Comando_Allow\">Comando Allow<\/a><\/li><li><a href=\"#Comando_Sitemap\">Comando Sitemap<\/a><\/li><li><a href=\"#Comando_Crawl-delay\">Comando Crawl-delay<\/a><\/li><li><a href=\"#Comodines__y\">Comodines $,\u00a0 * y #<\/a><\/li><\/ul><\/li><li><a href=\"#Como_crear_un_archivo_robotstxt\">C\u00f3mo crear un archivo robots.txt<\/a><\/li><li><a href=\"#Crear_el_archivo_robotstxt_en_WordPress\">Crear el archivo robots.txt en WordPress<\/a><ul><li><a href=\"#Crear_el_archivo_robotstxt_con_Yoast_SEO\">Crear el archivo robots.txt con Yoast SEO<\/a><\/li><li><a href=\"#Crear_el_archivo_robotstxt_con_Rank_Math\">Crear el archivo robots.txt con Rank Math<\/a><\/li><\/ul><\/li><li><a href=\"#Enviar_el_archivo_robotstxt_a_Google\">Enviar el archivo robots.txt a Google<\/a><ul><li><a href=\"#Actualizar_el_archivo_robotstxt_en_Google\">Actualizar el archivo robots.txt en Google<\/a><\/li><\/ul><\/li><li><a href=\"#Te_ha_resultado_complicado_crear_un_archivo_robotstxt_para_tu_web\">\u00bfTe ha resultado complicado crear un archivo robots.txt para tu web?<\/a><\/li><\/ul><\/div>\n\n<h2><span id=\"Que_es_el_archivo_robotstxt\">\u00bfQu\u00e9 es el archivo robots.txt?<\/span><\/h2>\n<p>El archivo robots.txt es un archivo de texto, de ah\u00ed la extensi\u00f3n .txt, que sugiere a los buscadores, como Google, qu\u00e9 URLs de nuestro sitio deben rastrear y a qu\u00e9 partes de la web no quieres que accedan los bots para rastrear el contenido.<\/p>\n<p>Por decirlo de otra manera, el archivo robots.txt contiene un listado de URLs que no deseas que los buscadores como Google rastreen ni se muestren en los resultados de b\u00fasqueda.<\/p>\n<p>Como sabr\u00e1s, por defecto, los robots o ara\u00f1as de Google rastrean todo el contenido de tu p\u00e1gina web (y cuando digo todo, es TODO). Pero, \u00bfqu\u00e9 ocurre si tienes un directorio que no deseas que Google lo indexe? Lo ideal es incluirlo en este archivo. De esta manera, cuando un robot visite tu sitio, antes comprobar\u00e1 el archivo robots.txt y sabr\u00e1 qu\u00e9 instrucciones seguir.<\/p>\n<h3><span id=\"No_confundas_noindex_con_robotstxt\">No confundas <em>noindex<\/em> con robots.txt<\/span><\/h3>\n<p>\u00a1Ojo! Incluir una determinada URL en el archivo robots.txt no garantiza que Google no la vaya a indexar. Al hacerlo, solo le est\u00e1s sugiriendo a Google que no lo haga, pero al final, el que decide es \u00e9l.<\/p>\n<p>Si realmente no quieres que una p\u00e1gina web aparezca en Google, lo ideal es utilizar la etiqueta <em>noindex <\/em>o proteger la p\u00e1gina con una contrase\u00f1a.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\" wp-image-10346 aligncenter\" src=\"https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/para-que-sirve-el-archivo-robots.txt-300x118.jpg\" alt=\"para que sirve el archivo robots.txt\" width=\"867\" height=\"341\" title=\"\" srcset=\"https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/para-que-sirve-el-archivo-robots.txt-300x118.jpg 300w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/para-que-sirve-el-archivo-robots.txt-768x302.jpg 768w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/para-que-sirve-el-archivo-robots.txt-700x275.jpg 700w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/para-que-sirve-el-archivo-robots.txt.jpg 865w\" sizes=\"(max-width: 867px) 100vw, 867px\" \/><\/p>\n<h2><span id=\"Por_que_es_importante_el_archivo_robotstxt\">\u00bfPor qu\u00e9 es importante el archivo robots.txt?<\/span><\/h2>\n<p>Si a\u00fan no tienes claro por qu\u00e9 es imprescindible a\u00f1adir un archivo robots.txt a tu web, aqu\u00ed te muestro algunas razones. \u00a1As\u00ed que toma nota!<\/p>\n<ul>\n<li><strong>Control del rastreo:<\/strong> Permite a los administradores de sitios web gestionar qu\u00e9 partes del sitio pueden ser examinadas por los motores de b\u00fasqueda. Esto es crucial para evitar que se indexen p\u00e1ginas irrelevantes o sensibles y asegura que el rastreo se concentre en las secciones m\u00e1s importantes para el SEO.<\/li>\n<li><strong>Optimizaci\u00f3n del rendimiento del sitio:<\/strong> Al restringir el rastreo de ciertas secciones del sitio, como scripts, hojas de estilo o p\u00e1ginas duplicadas, puedes reducir la carga en tu servidor. Esto es especialmente relevante para sitios grandes o con muchos recursos, ya que los rastreadores pueden consumir ancho de banda y recursos del servidor.<\/li>\n<li><strong>Seguridad del contenido sensible:<\/strong> El archivo robots.txt puede bloquear el acceso de los motores de b\u00fasqueda a directorios o archivos que contienen informaci\u00f3n privada o confidencial, como p\u00e1ginas de inicio de sesi\u00f3n, datos de usuario o contenido delicado. Aunque no garantiza una protecci\u00f3n total, es un primer paso para evitar que esta informaci\u00f3n sea expuesta p\u00fablicamente.<\/li>\n<li><strong>Mejora del SEO:<\/strong> Al guiar a los rastreadores hacia las p\u00e1ginas clave y evitar que indexen contenido irrelevante o duplicado, el archivo robots.txt contribuye a una estrategia de SEO m\u00e1s efectiva. Esto facilita que los motores de b\u00fasqueda se enfoquen en las p\u00e1ginas m\u00e1s importantes para atraer tr\u00e1fico org\u00e1nico.<\/li>\n<li><strong>Control de errores y <a href=\"https:\/\/www.lucushost.com\/blog\/redireccion-301\/\">redirecciones<\/a>:<\/strong> El archivo robots.txt puede ayudarte a gestionar el rastreo de p\u00e1ginas eliminadas o redirigidas, evitando que los motores de b\u00fasqueda muestren contenido desactualizado en sus resultados.<\/li>\n<\/ul>\n<p>Apuesto a que ahora tienes mucho m\u00e1s claro por qu\u00e9 es importante contar con un archivo robots.txt en tu web, \u00bfverdad? \ud83d\ude09<\/p>\n<h2><span id=\"Como_funciona_un_archivo_robotstxt\">\u00bfC\u00f3mo funciona un archivo robots.txt?<\/span><\/h2>\n<p>La funci\u00f3n principal del archivo robots.txt es ofrecer instrucciones a los motores de b\u00fasqueda (tambi\u00e9n conocidos como \u00abbots\u00bb o \u00abcrawlers\u00bb) sobre qu\u00e9 partes del sitio web pueden o no pueden rastrear e indexar. A continuaci\u00f3n, te explico c\u00f3mo funciona:<\/p>\n<h3><span id=\"Ubicacion_del_archivo\">Ubicaci\u00f3n del archivo<\/span><\/h3>\n<p>El archivo robots.txt se sit\u00faa en la ra\u00edz del dominio. Cuando un bot de motor de b\u00fasqueda accede a tu sitio, su primer paso es buscar este archivo para identificar si hay restricciones en el rastreo.<\/p>\n<h3><span id=\"Estructura_del_archivo\">Estructura del archivo<\/span><\/h3>\n<p>El archivo robots.txt sigue una estructura espec\u00edfica para definir las reglas de rastreo. Primero, el comando User-agent indica a qu\u00e9 bots se aplican las siguientes reglas. Los bots, como Googlebot para Google, se identifican por nombres espec\u00edficos, aunque tambi\u00e9n se puede usar el asterisco (*) como comod\u00edn para aplicar las directrices a todos los bots.<\/p>\n<p>A continuaci\u00f3n, el comando Disallow especifica las URL o directorios que no deseas que los bots rastreen. Si quieres bloquear una URL en particular, simplemente la colocas despu\u00e9s de Disallow.<\/p>\n<p>El comando Allow permite el rastreo de subrutas espec\u00edficas dentro de un directorio bloqueado. Si dentro de un directorio prohibido quieres permitir el acceso a una p\u00e1gina concreta, lo puedes hacer con Allow.<\/p>\n<p>Finalmente, aunque no es obligatorio, puedes a\u00f1adir una l\u00ednea con Sitemap para incluir la URL de tu archivo sitemap.xml. Esto ayuda a los bots a encontrar y rastrear todas las p\u00e1ginas de tu sitio que deseas que se indexen.<\/p>\n<p>Si te parece complicado, no te preocupes. Te mostrar\u00e9 un ejemplo sencillo para que lo entiendas mejor:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\">User-agent: *\r\nDisallow: \/admin\/\r\nAllow: \/admin\/help.html\r\nSitemap: www.tuweb.com\/sitemap.xml<\/pre>\n<p>Como puedes ver, todos los bots (**User-agent: * **) tienen prohibido rastrear el directorio <em>\/admin\/<\/em>, pero se les permite acceder a la p\u00e1gina espec\u00edfica <em>\/admin\/help.html<\/em>. Adem\u00e1s, se proporciona la ubicaci\u00f3n del archivo del mapa del sitio para facilitar la indexaci\u00f3n de las p\u00e1ginas del sitio web.<\/p>\n<h3><span id=\"Comportamiento_de_los_bots\">Comportamiento de los bots<\/span><\/h3>\n<p>Los bots de motores de b\u00fasqueda leen el archivo robots.txt para decidir qu\u00e9 contenido deben explorar o evitar. Las p\u00e1ginas y archivos que se permiten en robots.txt ser\u00e1n rastreados e indexados, lo que significa que podr\u00e1n aparecer en los resultados de b\u00fasqueda.<\/p>\n<p>Aunque la mayor\u00eda de los bots siguen las instrucciones del robots.txt, algunos bots maliciosos pueden no cumplirlas.<\/p>\n<h3><span id=\"Limitaciones\">Limitaciones<\/span><\/h3>\n<p>Bloquear una p\u00e1gina en robots.txt no la protege de ser accesible, solo indica a los motores de b\u00fasqueda que no la rastreen. Si una URL bloqueada es enlazada desde otro sitio, puede ser indexada sin rastreo.<\/p>\n<p>Como mencion\u00e9 anteriormente y quiero reiterar (m\u00e1s que nada, ya que es muy importante \ud83d\ude0a), si otros sitios enlazan a una p\u00e1gina bloqueada y los bots la descubren, esta puede ser indexada a pesar de que el archivo robots.txt lo proh\u00edba. Para prevenir la indexaci\u00f3n, es necesario utilizar m\u00e9todos adicionales, como la etiqueta noindex en el HTML de la p\u00e1gina.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\" wp-image-10349 aligncenter\" src=\"https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/archivo-robots-txt-ejempl-300x118.jpg\" alt=\"archivo robots txt ejemplo\" width=\"874\" height=\"344\" title=\"\" srcset=\"https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/archivo-robots-txt-ejempl-300x118.jpg 300w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/archivo-robots-txt-ejempl-768x302.jpg 768w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/archivo-robots-txt-ejempl-700x275.jpg 700w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/archivo-robots-txt-ejempl.jpg 865w\" sizes=\"(max-width: 874px) 100vw, 874px\" \/><\/p>\n<h2><span id=\"Donde_esta_el_archivo_robotstxt\">\u00bfD\u00f3nde est\u00e1 el archivo robots.txt?<\/span><\/h2>\n<p>Anteriormente, cuando te expliqu\u00e9 el funcionamiento del archivo robots.txt, ya te adelant\u00e9 que este archivo se encuentra en la ra\u00edz de tu p\u00e1gina web. De hecho, tiene una ruta del tipo:<\/p>\n<ul>\n<li><em>https:\/\/tudominio.com\/robots.txt<\/em><\/li>\n<\/ul>\n<h2><span id=\"Reglas_y_formato_del_archivo_robotstxt\">Reglas y formato del archivo robots.txt<\/span><\/h2>\n<p>Antes de ver los principales comandos que puedes incluir en el archivo robots.txt, es importante que tengas en cuenta algunos aspectos.<\/p>\n<ul>\n<li>El archivo debe llamarse s\u00ed o s\u00ed robots.txt. No puede tener otro nombre, de lo contrario no ser\u00e1 le\u00eddo por los robots.<\/li>\n<li>Tu web \u00fanicamente puede tener un archivo robots.txt.<\/li>\n<li>El archivo robots.txt debe ubicarse en la ra\u00edz de la web, no en un subdirectorio. Por tanto, <em>https:\/\/tudominio.com\/robots.txt<\/em> ser\u00eda v\u00e1lido, pero https:\/\/tudominio.com\/blog\/robots.txt no lo ser\u00eda.<\/li>\n<li>Puedes crear un archivo robots.txt para un subdominio que aplique \u00fanicamente a ese subdominio. Por ejemplo, https:\/\/shop.tudominio.com\/robots.txt ser\u00eda v\u00e1lido para el subdominio <em>shop.tudominio.com<\/em>.<\/li>\n<\/ul>\n<h2><span id=\"Principales_comandos_de_robotstxt\">Principales comandos de robots.txt<\/span><\/h2>\n<p>Para crear el archivo robots.txt, es importante que conozcas algunos comandos b\u00e1sicos.<\/p>\n<h3><span id=\"Comando_User-agent\">Comando User-agent<\/span><\/h3>\n<p>Este comando indica qu\u00e9 robot tiene que cumplir las directivas que componen en el archivo.<\/p>\n<p>Si no quieres especificar qu\u00e9 robot debe cumplir las indicaciones, utiliza el siguiente comando:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">User-agent: *<\/pre>\n<p>Para dar instrucciones espec\u00edficas al robot de Google debes establecer:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">User-agent: googlebot<\/pre>\n<p>En el caso del robot de Bing debes utilizar:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">User-agent: googlebot<\/pre>\n<h3><span id=\"Comando_Disallow\">Comando Disallow<\/span><\/h3>\n<p>Este comando indica qu\u00e9 directorio o p\u00e1gina de tu web no debe incluirse en los resultados de b\u00fasqueda.<\/p>\n<p>En WordPress, es muy com\u00fan bloquear todas las URLs del panel de administraci\u00f3n. Para ello se utiliza:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">Disallow: \/wp-admin<\/pre>\n<p>O, en el caso del \u00e1rea de clientes, podr\u00edas utilizar:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">Disallow: \/area-de-clientes<\/pre>\n<p>Para indexar todo el contenido:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">Disallow:<\/pre>\n<p>O, por el contrario, si no quieres que se rastree ninguna p\u00e1gina del sitio:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">Disallow: \/<\/pre>\n<h3><span id=\"Comando_Allow\">Comando Allow<\/span><\/h3>\n<p>Con este comando, indicas a los motores de b\u00fasqueda qu\u00e9 p\u00e1ginas o directorios deseas que sean rastreados.<\/p>\n<p>Por defecto, se rastrea todo el contenido, por lo que solo necesitas este comando si quieres permitir el acceso a un contenido que has bloqueado con el comando Disallow. Por ejemplo:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">Disallow: \/noticias\r\n\r\nAllow: \/noticias\/actualidad<\/pre>\n<h3><span id=\"Comando_Sitemap\">Comando Sitemap<\/span><\/h3>\n<p>El archivo robots.txt ayuda a los motores de b\u00fasqueda a indexar el contenido, por lo que tambi\u00e9n es muy \u00fatil incluir en \u00e9l el sitemap de tu sitio web.<\/p>\n<p>Aunque es opcional, puedes a\u00f1adir este comando incluyendo la ruta del mapa o mapas de tu sitio:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">Sitemap: https:\/\/tudominio.com\/sitemap.xml<\/pre>\n<h3><span id=\"Comando_Crawl-delay\">Comando Crawl-delay<\/span><\/h3>\n<p>Este comando sirve para retrasar el tiempo de rastreo entre p\u00e1gina y p\u00e1gina para no afectar al rendimiento de tu sitio. Es especialmente \u00fatil para sitios web muy grandes.<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-linenumbers=\"false\">Crawl-delay: 1<\/pre>\n<h3><span id=\"Comodines__y\">Comodines $,\u00a0 * y #<\/span><\/h3>\n<p>Adem\u00e1s de los comandos, existe una serie de comodines que resultan \u00fatiles y necesarios para crear un archivo robots.txt:<\/p>\n<ul>\n<li><strong>$<\/strong>: el s\u00edmbolo del d\u00f3lar indica el final de una URL.<\/li>\n<li><strong>*<\/strong>: el asterisco representa \u00abtodos\u00bb.<\/li>\n<li><strong>#<\/strong>: la almohadilla sirve para incluir comentarios en el archivo.<\/li>\n<\/ul>\n<h2><span id=\"Como_crear_un_archivo_robotstxt\">C\u00f3mo crear un archivo robots.txt<\/span><\/h2>\n<p>Cuando instalas algunas aplicaciones como PrestaShop o <a href=\"https:\/\/www.lucushost.com\/blog\/mautic\/\">Mautic<\/a>, ver\u00e1s que ya tienen el archivo robots.txt preconfigurado en la ra\u00edz del dominio. Sin embargo, en otros gestores de contenido como WordPress, es necesario crear y subir el archivo robots.txt al hosting.<\/p>\n<p>\u00bfQuieres ver c\u00f3mo crear un archivo robots.txt? Vamos a ello.<\/p>\n<ol>\n<li>Abre un editor de texto como, por ejemplo, el bloc de notas de Windows.<\/li>\n<li>Establece el user-agent. Puedes utilizar el comod\u00edn * para referirte a cualquier robot, o \u00abgooglebot\u00bb si las directrices son \u00fanicamente para el robot de Google.<\/li>\n<li>Escribe las reglas que debe interpretar el user-agent. Utilizando los comandos que te mostr\u00e9 anteriormente, establece qu\u00e9 URL prefieres que Google no rastree.<\/li>\n<li>A\u00f1ade la ruta del sitemap de tu sitio.<\/li>\n<li>Guarda el archivo con el nombre robots.txt y s\u00fabelo a la ra\u00edz de tu sitio. Esto puedes hacerlo mediante una conexi\u00f3n FTP o utilizando el \u00abAdministrador de archivos\u00bb si utilizas un <a href=\"https:\/\/www.lucushost.com\/blog\/keyword-research\/\">hosting cPanel<\/a>.<\/li>\n<li>Comprueba si es archivo robots.txt es legible o presenta alg\u00fan error desde la herramienta <a href=\"https:\/\/www.google.com\/webmasters\/tools\/robots-testing-tool\" rel=\"nofollow noopener\" target=\"_blank\"><strong>Robots Testing Tools<\/strong><\/a> de Google Search Console<\/li>\n<\/ol>\n<p>Aqu\u00ed tienes un ejemplo de un archivo robots.txt sencillo:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-6202\" src=\"https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/ejemplo-archivo-robots-txt.png\" alt=\"Ejemplo de un archivo Robots.txt\" width=\"913\" height=\"598\" title=\"\" srcset=\"https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/ejemplo-archivo-robots-txt.png 913w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/ejemplo-archivo-robots-txt-300x196.png 300w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/ejemplo-archivo-robots-txt-768x503.png 768w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/ejemplo-archivo-robots-txt-700x458.png 700w\" sizes=\"(max-width: 913px) 100vw, 913px\" \/><\/p>\n<h2><span id=\"Crear_el_archivo_robotstxt_en_WordPress\">Crear el archivo robots.txt en WordPress<\/span><\/h2>\n<p>Teniendo en cuenta que WordPress es el<strong> <a href=\"https:\/\/www.lucushost.com\/blog\/gestor-de-contenidos\/\">gestor de contenidos<\/a><\/strong> m\u00e1s utilizado para crear p\u00e1ginas web, es importante aclarar que, aunque este gestor de contenidos no genera el archivo robots.txt por defecto durante la instalaci\u00f3n, muchos plugins, como Yoast o <strong><a href=\"https:\/\/www.lucushost.com\/blog\/rank-math\/\">Rank Math<\/a><\/strong> lo hacen autom\u00e1ticamente por ti.<\/p>\n<p>\u00bfVemos c\u00f3mo la hacen?<\/p>\n<h3><span id=\"Crear_el_archivo_robotstxt_con_Yoast_SEO\">Crear el archivo robots.txt con Yoast SEO<\/span><\/h3>\n<p>Si tienes instalado Yoast SEO en tu aplicaci\u00f3n, puedes crear y modificar este archivo en solo un par de clics. De hecho, es as\u00ed de sencillo:<\/p>\n<ol>\n<li>Accede al panel de administraci\u00f3n de WordPress y, en el men\u00fa lateral, haz clic en \u00abYoast SEO\u00bb para abrir la configuraci\u00f3n del plugin.<\/li>\n<li>Abre la secci\u00f3n \u00abTools\u00bb o \u00abHerramientas\u00bb y selecciona la segunda opci\u00f3n \u00abFile editor\u00bb.<\/li>\n<li>Desde aqu\u00ed ver\u00e1s que Yoast SEO te da la opci\u00f3n de crear el archivo robots.txt pulsando en el bot\u00f3n \u00abCreate robots.txt file\u00bb.<\/li>\n<li>Por defecto, se genera un archivo robots.txt como este, pero puedes a\u00f1adir nuevas directrices o eliminar las que no se ajusten a tu sitio. <img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-6208\" src=\"https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/archivo-robots-txt-yoast-seo.png\" alt=\"Archivo robots.txt creado con Yoast SEO\" width=\"1281\" height=\"604\" title=\"\" srcset=\"https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/archivo-robots-txt-yoast-seo.png 1281w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/archivo-robots-txt-yoast-seo-300x141.png 300w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/archivo-robots-txt-yoast-seo-1024x483.png 1024w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/archivo-robots-txt-yoast-seo-768x362.png 768w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/archivo-robots-txt-yoast-seo-700x330.png 700w\" sizes=\"(max-width: 1281px) 100vw, 1281px\" \/><\/li>\n<\/ol>\n<h3><span id=\"Crear_el_archivo_robotstxt_con_Rank_Math\">Crear el archivo robots.txt con Rank Math<\/span><\/h3>\n<p>Si utilizas este plugin para <a href=\"https:\/\/www.lucushost.com\/blog\/seo-checklist\/\">mejorar el SEO<\/a> de tu sitio, el proceso es igual de sencillo que con el plugin que acabamos de ver.<\/p>\n<ol>\n<li>Accede al panel de administraci\u00f3n de tu web y, en el men\u00fa de WordPress, pulsa en Rank Math.<\/li>\n<li>Ve a \u00abGeneral Settings\u00bb (ajustes generales) y, a continuaci\u00f3n, haz clic en \u00abEdit robots.txt\u00bb.<\/li>\n<li>Se abrir\u00e1 una pesta\u00f1a como esta en la que debes incluir las directrices que quieres que sigan los motores de b\u00fasqueda. <img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-6209\" src=\"https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/crear-archivo-robots-txt-rank-math.png\" alt=\"Crear el archivo robots.txt con Rank Math\" width=\"1250\" height=\"722\" title=\"\" srcset=\"https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/crear-archivo-robots-txt-rank-math.png 1250w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/crear-archivo-robots-txt-rank-math-300x173.png 300w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/crear-archivo-robots-txt-rank-math-1024x591.png 1024w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/crear-archivo-robots-txt-rank-math-768x444.png 768w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/crear-archivo-robots-txt-rank-math-345x198.png 345w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/crear-archivo-robots-txt-rank-math-700x404.png 700w\" sizes=\"(max-width: 1250px) 100vw, 1250px\" \/><\/li>\n<\/ol>\n<blockquote><p><strong>\ud83d\udce2 Importante:<\/strong> Aunque utilices alguno de estos plugins para crear el archivo robots.txt, no olvides <a href=\"https:\/\/www.lucushost.com\/blog\/verificar-dominio-google-search-console\/\">verificar el dominio en Search Console<\/a> y enviarlo a Google a trav\u00e9s de esta herramienta.<\/p><\/blockquote>\n<h2><span id=\"Enviar_el_archivo_robotstxt_a_Google\">Enviar el archivo robots.txt a Google<\/span><\/h2>\n<p>Una vez que hayas creado el archivo robots.txt, te preguntar\u00e1s: \u00bfc\u00f3mo hago para enviarlo a Google?<\/p>\n<p>En la p\u00e1gina de Google Developers, se indica lo siguiente:<\/p>\n<p>U<em>na vez que hayas subido y probado tu archivo robots.txt, los rastreadores de Google buscar\u00e1n y empezar\u00e1n a usar el archivo robots.txt autom\u00e1ticamente. No tienes que hacer nada<\/em>.<\/p>\n<h3><span id=\"Actualizar_el_archivo_robotstxt_en_Google\">Actualizar el archivo robots.txt en Google<\/span><\/h3>\n<p>Si ya has creado el archivo y solo has actualizado las directrices a\u00f1adiendo o eliminando alguna, entonces deber\u00e1s reemplazar el archivo existente con la nueva versi\u00f3n.<\/p>\n<p>En este caso, desde Google Developers nos indican que <em>los rastreadores detectan los cambios hechos en el archivo robots.txt y actualizan la versi\u00f3n almacenada cada 24 horas.<\/em><\/p>\n<p>Pero\u2026 \u00bfNo puedes esperar tantas horas? \u00bfNecesitas que se actualice con mayor rapidez? Entonces haz lo siguiente:<\/p>\n<ol>\n<li>Abre el <strong><a href=\"https:\/\/www.google.com\/webmasters\/tools\/robots-testing-tool?hl=es\" rel=\"nofollow noopener\" target=\"_blank\">Probador de robots.txt<\/a><\/strong> de Search Console y haz clic en \u00abVer la versi\u00f3n subida\u00bb para comprobar qu\u00e9 archivo robots.txt se est\u00e1 utilizando.<\/li>\n<li>Haz clic en \u00abEnviar\u00bb para avisar a Google de que tu archivo se ha actualizado.<\/li>\n<\/ol>\n<p>Si quieres, puedes comprobar que esta actualizaci\u00f3n se realiz\u00f3 correctamente volviendo a la herramienta de Probador de robots.txt del punto 1.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-6212\" src=\"https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/probador-robots-txt-search-console.png\" alt=\"Probador del archivo robots.txt de Search Console\" width=\"1845\" height=\"752\" title=\"\" srcset=\"https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/probador-robots-txt-search-console.png 1845w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/probador-robots-txt-search-console-300x122.png 300w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/probador-robots-txt-search-console-1024x417.png 1024w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/probador-robots-txt-search-console-768x313.png 768w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/probador-robots-txt-search-console-1536x626.png 1536w, https:\/\/www.lucushost.com\/blog\/wp-content\/uploads\/2022\/08\/probador-robots-txt-search-console-700x285.png 700w\" sizes=\"(max-width: 1845px) 100vw, 1845px\" \/><\/p>\n<h2><span id=\"Te_ha_resultado_complicado_crear_un_archivo_robotstxt_para_tu_web\">\u00bfTe ha resultado complicado crear un archivo robots.txt para tu web?<\/span><\/h2>\n<p>Un archivo robots.txt permite a los buscadores, como Google, saber qu\u00e9 URLs de una p\u00e1gina web deben rastrear y a qu\u00e9 partes no deben acceder los bots.<\/p>\n<p>Este archivo, que debe tener la extensi\u00f3n .txt y estar ubicado en la ra\u00edz del sitio, indica a qu\u00e9 partes de la web no quieres que accedan los rastreadores de los motores de b\u00fasqueda.<\/p>\n<p>Como hemos visto, puedes crear este archivo usando el Bloc de notas. No obstante, si utilizas WordPress, la mayor\u00eda de los plugins de SEO te permiten hacerlo con solo un par de clics.<\/p>\n<p>Ahora dime, \u00bfya has creado tu archivo robots.txt? \u00bfTienes alguna duda? D\u00e9jame un comentario y te echo una mano \ud83d\ude42<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Cuando lanzas una p\u00e1gina web o una tienda online necesitas que Google rastree la informaci\u00f3n, pero tambi\u00e9n tienes que darle una serie de directrices o instrucciones acerca de c\u00f3mo debe interactuar con tu contenido. Por tanto, necesitas crear un archivo robots.txt.<\/p>\n","protected":false},"author":3,"featured_media":6489,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[45,44,42],"tags":[],"_links":{"self":[{"href":"https:\/\/www.lucushost.com\/blog\/wp-json\/wp\/v2\/posts\/6067"}],"collection":[{"href":"https:\/\/www.lucushost.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.lucushost.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.lucushost.com\/blog\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/www.lucushost.com\/blog\/wp-json\/wp\/v2\/comments?post=6067"}],"version-history":[{"count":40,"href":"https:\/\/www.lucushost.com\/blog\/wp-json\/wp\/v2\/posts\/6067\/revisions"}],"predecessor-version":[{"id":13657,"href":"https:\/\/www.lucushost.com\/blog\/wp-json\/wp\/v2\/posts\/6067\/revisions\/13657"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.lucushost.com\/blog\/wp-json\/wp\/v2\/media\/6489"}],"wp:attachment":[{"href":"https:\/\/www.lucushost.com\/blog\/wp-json\/wp\/v2\/media?parent=6067"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.lucushost.com\/blog\/wp-json\/wp\/v2\/categories?post=6067"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.lucushost.com\/blog\/wp-json\/wp\/v2\/tags?post=6067"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}