← Todos los artículos SEO de Navegación por Facetas en Shopify: Deja de Desperdiciar Presupuesto de Rastreo en URLs de Filtros

SEO de Navegación por Facetas en Shopify: Deja de Desperdiciar Presupuesto de Rastreo en URLs de Filtros

Los filtros de Shopify crean miles de URLs duplicadas que agotan el presupuesto de rastreo y suprimen rankings. Aquí está la estrategia exacta para

Los filtros de colecciones de Shopify son una de las herramientas UX más efectivas de la plataforma y uno de los errores SEO más dañinos que los comerciantes cometen sin darse cuenta. Cuando cada combinación de filtro genera su propia URL rastreable, Googlebot gasta su presupuesto en páginas delgadas y casi duplicadas en lugar de tus páginas de dinero real. La solución es una arquitectura de rastreo deliberada, no un simple cambio de configuración.

Puntos clave

  • Una tienda de 500 productos con 3 colecciones y 3 variantes por producto puede generar más de 8,000 URLs rastreables de solo 500 productos reales, quemando presupuesto de rastreo en duplicados.
  • Google ignora las etiquetas de canonical automáticas de Shopify entre el 30-40% de las veces cuando los enlaces internos apuntan a URLs de ruta de colección en lugar de la ruta de canonical /products/.
  • Cuatro personalizaciones de robots.txt cubren la gran mayoría del desperdicio de rastreo para tiendas con menos de 100,000 páginas.
  • Los parámetros de filtro por faceta deben manejarse con una de tres estrategias: bloquear en robots.txt, añadir noindex, o usar estados del lado del cliente basados en fragmentos.
  • La aplicación Search and Discovery es gratuita y controla qué atributos de filtro generan URLs rastreables, lo que la convierte en tu primer punto de acción antes de tocar código alguno.

Por qué la navegación por facetas rompe el SEO de Shopify

El filtrado de tienda de Shopify, construido sobre la aplicación Search and Discovery, genera URLs con parámetros de consulta como /collections/shirts?filter.p.tag=blue. Por defecto, Shopify no siempre aplica etiquetas de canonical a cada combinación de filtro, lo que significa que Google ve una cascada de páginas casi idénticas, cada una diferente por un valor de parámetro.

Auditorías recientes de sitios de comercio electrónico, incluyendo tiendas de Shopify Plus, encontraron que cuatro de cada cinco tenían más del 60% de sus solicitudes de rastreo de Googlebot landing en URLs que ningún humano escribiría o compartiría jamás, principalmente combinaciones de filtros y parámetros de ordenamiento. No es un problema marginal. Es el resultado predeterminado cuando instalas una aplicación de filtro y no haces nada más.

La escala se compone rápidamente. Para una tienda de 500 productos donde los productos promedian 3 colecciones y 3 variantes, la arquitectura de Shopify puede crear más de 8,000 URLs rastreables para solo 500 productos reales. Ese es presupuesto de rastreo siendo gastado en páginas duplicadas en lugar de tu contenido real, como se detalla en un análisis técnico de mayo de 2026 por Black Belt Commerce.

El problema de la etiqueta de canonical que lo agrava

Shopify sí genera etiquetas de canonical automáticamente. Los productos obtienen un canonical apuntando a /products/{handle}, que es la señal correcta. El problema es que Google ignora las etiquetas de canonical entre el 30-40% de las veces, especialmente cuando los enlaces internos en todo el sitio apuntan a las versiones de ruta de colección como /collections/shirts/products/blue-tee.

Esto significa que el canonical por sí solo no es suficiente. Cada enlace interno en tu tema, incluyendo carruseles "También te puede interesar", breadcrumbs, y fichas de cuadrícula de colecciones, necesita resolver a la URL /products/, no a la ruta consciente de colección. Audita las plantillas Liquid de tu tema y verifica dónde se generan las URLs de producto. En la mayoría de temas, la URL de ruta de colección se usa por defecto dentro de bucles de colecciones, y ese es exactamente el comportamiento incorrecto.

Para validar el impacto del mundo real, ve a Google Search Console, abre Cobertura > Excluidos, y busca "Duplicado, URL enviada no seleccionada como canonical". Si ves cientos de entradas ahí, tus enlaces internos están socavando tus etiquetas de canonical.

Tres estrategias para cada tipo de filtro

No todos los filtros merecen el mismo tratamiento. El árbol de decisión es directo:

1. Bloquear en robots.txt (para filtros sin valor SEO)

Las páginas de colecciones basadas en etiquetas (ej. /collections/shirts+blue) y los parámetros de ordenamiento raramente tienen intención de búsqueda independiente. Añade Disallow: /collections/*/tagged/ a tu archivo robots.txt.liquid para prevenir que Googlebot las rastree en absoluto. Desde mediados de 2021, Shopify ha permitido a los comerciantes personalizar el robots.txt via una plantilla robots.txt.liquid en el editor de código de temas, dándote control por patrón sin herramientas externas.

Añadir una regla de Disallow para páginas filtradas por etiqueta previene desperdicio de rastreo en contenido delgado que casi nunca se posiciona por sí solo. Esa única línea cubre una superficie sorprendentemente grande en tiendas que usan etiquetado de productos de Shopify intensamente.

2. Noindex (para filtros que ayudan a UX pero no tienen intención de búsqueda independiente)

Algunos filtros, como tamaño o color en una colección amplia, son esenciales para la usabilidad en el sitio pero nunca se posicionarán para una consulta distinta. Permite que el bot rastree estas páginas para que pueda ver la directiva noindex, pero asegúrate de que la página no está bloqueada por robots.txt. La regla es: las páginas bloqueadas no pueden comunicar noindex a Google, así que usa uno u otro, nunca ambos.

En el Liquid de tu tema, puedes generar condicionalmente la etiqueta noindex:

liquid {% if request.page_type == 'collection' and current_tags %} <meta name="robots" content="noindex, follow"> {% endif %}

Esto se dirige solo a vistas de colección filtradas por etiqueta, dejando tus páginas de colección base completamente indexables.

3. Estados basados en fragmentos (para filtros sin valor SEO en absoluto)

Para filtros puramente dirigidos por UX donde el objetivo es cero visibilidad de búsqueda, considera renderizar el estado del filtro en el fragmento de URL (ej. #color=blue) en lugar de como parámetro de consulta. La orientación propia de Google confirma que generalmente no usa fragmentos de URL para rastreo e indexación, lo que mantiene esos estados fuera de la búsqueda por diseño. Esto requiere JavaScript personalizado para gestionar el estado, pero es la solución arquitectónica más limpia para filtros que nunca deberían aparecer en un índice.

Lo que la aplicación Search and Discovery controla (y lo que no)

La aplicación gratuita Search and Discovery de Shopify es por donde comienza la arquitectura de filtros. Controla qué atributos de producto se vuelven filtrables y cómo se ordenan los valores de filtro. Una limitación importante de la plataforma: las colecciones con más de 5,000 productos no muestran filtros en absoluto. Si tienes un catálogo grande, esta es una razón para dividir colecciones amplias en subcolecciones más ajustadas, lo que también resulta ser mejor para SEO (páginas de colecciones más dirigidas, rutas de rastreo más limpias).

Lo que la aplicación no controla es cómo se comportan las URLs de filtro resultantes en búsqueda. Esa es tu responsabilidad via etiquetas de canonical, robots.txt, y enlaces internos. La aplicación configura la capa UX. La capa SEO es una preocupación de ingeniería separada.

Para tiendas de escala empresarial donde los límites de la aplicación nativa son demasiado restrictivos, las aplicaciones de filtro de terceros añaden más flexibilidad, pero introducen JavaScript adicional que puede aumentar tu Largest Contentful Paint (LCP) más allá del umbral de 2.5 segundos que Google usa como señal de ranking. Cada aplicación que instales añade scripts cargados en cada página, así que sopesa funcionalidad de filtro contra velocidad de página en base por aplicación.

El playbook de robots.txt.liquid

Aquí está el conjunto condensado de reglas que cubre la mayoría de tiendas de Shopify. Añade estas a tu archivo robots.txt.liquid:

Disallow: /collections/*/tagged/ Disallow: /search Disallow: /cart Disallow: /checkout Disallow: /account

La línea /collections/*/tagged/ es la más impactante para tiendas usando etiquetas de producto como filtros. Las páginas de búsqueda internas indexadas por Google diluyen tu presupuesto de rastreo con contenido delgado duplicado, así que bloquea esas también. Las páginas de carrito, checkout, y cuenta nunca deberían ser indexadas y ya están bloqueadas en el robots.txt por defecto de Shopify, pero hacerlas explícitas futurizaría tu configuración contra cambios de plataforma.

Después de hacer cambios, usa la herramienta Inspección de URL en Google Search Console para verificar que las páginas individuales responden como se espera. Monitorea el informe Crawl Stats semanalmente durante dos a cuatro semanas después de cualquier cambio de robots.txt. Un pico en exclusiones "bloqueado por robots.txt" es normal y esperado. Una caída en impresiones para tus páginas de colecciones principales no lo es, e indica una regla de Disallow demasiado amplia.

Enlaces internos: la solución que las etiquetas de canonical no pueden hacer solas

La solución estructural que la mayoría de comerciantes se saltan es actualizar la salida de enlaces internos de su tema. En Liquid, las URLs de producto dentro de bucles de colecciones típicamente se generan como:

liquid {{ product.url | within: collection }}

Esto genera la URL de ruta de colección. Para SEO, quieres la ruta de canonical:

liquid {{ product.url }}

El filtro | within: collection es el culpable detrás de la mayoría de reportes de desajuste de canonical. Quitarlo de enlaces de tarjeta de producto, breadcrumbs, y carruseles de productos relacionados significa que el rastreo de Google sigue la misma URL a la que estás canonicalizando. El canonical y los enlaces internos entonces están de acuerdo, que es cuando Google honra confiablemente tu señal de canonical.

Si quieres una revisión más profunda de la salida Liquid de tu tema y arquitectura de rastreo, el servicio SEO de Shopify que ofrezco cubre una auditoría de rastreo completa como parte del compromiso.

Higiene del sitemap

El sitemap.xml generado automáticamente de Shopify es un acelerador de rastreo útil, pero requiere revisión periódica. El sitemap correctamente excluye URLs de producto de ruta de colección por defecto, que es uno de los comportamientos SEO subestimados de la plataforma. Lo que no filtra automáticamente son páginas de colecciones basadas en etiquetas y, en algunas configuraciones de tienda, URLs de colecciones paginadas más allá de la página uno.

Shopify no te permite eliminar manualmente entradas de sitemap, pero puedes suprimir páginas de indexación usando etiquetas noindex basadas en Liquid, que señala a Google que esas URLs deberían ser excluidas del índice incluso si el sitemap las lista. No confíes solo en la omisión de sitemap como señal de noindex. Usa la etiqueta meta robots en el <head> para cualquier página que quieras definitivamente excluida.

Validando el trabajo

Después de implementar correcciones de canonical, actualizaciones de robots.txt, y correcciones de enlaces internos, valida con esta secuencia:

  • Google Search Console > Cobertura > Excluidos: el conteo de "Duplicado, URL enviada no seleccionada como canonical" debe caer en 4-8 semanas.
  • Informe Crawl Stats: las solicitudes de rastreo totales deberían disminuir o estabilizarse; la proporción que va a URLs de ruta de colección debe caer.
  • Screaming Frog o Ahrefs Site Audit: rastrea nuevamente después de 30 días y compara la proporción de URLs 3xx, noindex, y desajuste de canonical a tu base de referencia.
  • Inspección de URL: verifica spot-check de 5-10 URLs de filtro para confirmar que el canonical seleccionado de Google coincide con tu URL /products/ intendida.

Para una lista de verificación técnica completa que va más allá de la navegación por facetas en Core Web Vitals y datos estructurados, mira la guía de optimización de velocidad de Shopify que publiqué anteriormente.

La dimensión del rastreador de IA

Un factor que no existía a escala hace dos años: los rastreadores de IA de ChatGPT, Perplexity, y el sistema AI Overview de Google ahora están añadiendo tráfico de bot que golpea tu tienda. Estos rastreadores operan bajo agentes de usuario separados, y el robots.txt predeterminado de Shopify solo aborda User-agent: *. Si quieres explícitamente permitir o restringir bots de IA, necesitas reglas de agente de usuario nombradas en tu robots.txt.liquid. Lo que es más importante, estos rastreadores dependen fuertemente de datos estructurados para entender tus páginas de producto. Un sitemap que surface tus páginas de colecciones de canonical y producto, combinado con schema de Product correcto, es lo que obtiene tu inventario citado en respuestas generadas por IA.

Arregla primero la arquitectura de rastreo. Las URLs de canonical que surfaces a Googlebot son las mismas que los rastreadores de IA usarán para entender y recomendar tus productos.

shopify seotechnical seopresupuesto rastreonavegación facetascolecciones shopifydesarrollador shopify

Preguntas frecuentes

¿Shopify corrige automáticamente los problemas SEO de navegación por facetas?

Shopify añade etiquetas de canonical a páginas de productos automáticamente, pero no gestiona la indexación de URLs de filtros, reglas de robots.txt para páginas de etiquetas, o rutas de enlaces internos. Los comerciantes necesitan configurar esto por separado usando la plantilla robots.txt.liquid y ediciones de tema Liquid.

¿Debería bloquear todas las URLs de filtro de colecciones en robots.txt?

No. Solo bloquea combinaciones de filtros que tienen cero intención de búsqueda independiente, como parámetros de ordenamiento y páginas filtradas por etiqueta. Los filtros que representan consultas de búsqueda genuinas, por ejemplo una colección filtrada a un material específico, pueden merecer su propia página indexable con una URL de canonical única.

¿Cuánto tiempo tarda en ver mejoras de ranking después de corregir problemas de presupuesto de rastreo?

Las correcciones de presupuesto de rastreo típicamente muestran resultados en Google Search Console en 4-8 semanas a medida que Googlebot rastrea nuevamente y reevalúa tus canonicals. Las mejoras de ranking orgánico en resultados de búsqueda usualmente siguen 2-3 meses después de que las correcciones de indexación se estabilicen.