Optimizar sitios web para la búsqueda con IA generativa es la próxima frontera del SEO, y la mayoría de los especialistas en marketing encargados de impulsar el tráfico orgánico buscan formas de mejorar la visibilidad en este tipo de búsquedas. Pero ¿qué pasaría si uno de los consejos de SEO más comunes estuviera equivocado?
Se están escribiendo numerosos artículos sobre este tema, y la mayoría de ellos se centran en algunos puntos en común:
- Usa jerarquías de encabezados claras
- Escribe contenido conversacional
- Crea secciones de preguntas frecuentes y comparativas
- Construye autoridad temática
- Agrega marcado de datos estructurados (schema)
Si bien todas estas son recomendaciones sólidas y definitivamente ayudan a mejorar la usabilidad del sitio web, facilitar el rastreo y optimizar la indexación de tu contenido, nuestra investigación ha encontrado que la incorporación de data schema no necesariamente se correlaciona con una mayor visibilidad en la búsqueda con IA generativa. Pero antes de sacar conclusiones apresuradas, profundicemos un poco más.
El papel del schema markup
El schema markup es un código que resalta datos estructurados utilizando anotaciones estándar para ayudar a los motores de búsqueda a comprender el contenido de un sitio web. En términos simples, si tu página contiene información que podría organizarse en una tabla, por ejemplo, marca de automóvil, modelo, año de fabricación, color, entonces el schema te permite señalar la presencia de estos valores de datos estructurados a los motores de búsqueda y a los LLMs, para que “entiendan” a qué se refiere esa información.
Los sitios de comercio electrónico, publicaciones de investigación, listados de eventos, sitios de reseñas y bibliotecas de podcasts son solo algunos ejemplos de negocios que se benefician de la variedad de schemas disponibles. Motores de búsqueda como Google rastrean los datos dentro del schema markup y pueden utilizarlos para indexarlos de forma adecuada en resultados enriquecidos de búsqueda, como listados de compras, videos incrustados o reseñas.
Más recientemente, los modelos de lenguaje de gran escala, utilizados por la IA, también emplean los datos estructurados contenidos en el schema para nutrir sus bases de conocimiento.
Los requisitos de datos de la búsqueda generativa
ChatGPT, Google Gemini y otros sistemas de búsqueda generativa dependen de una comprensión semántica profunda del contenido para sintetizar respuestas. Al recuperar información, estos sistemas analizan el contenido de tus páginas web y extraen hechos y relaciones. Los modelos generativos son más propensos a “alucinaciones” cuando los datos de origen son inexactos o poco confiables.
El schema markup es un mecanismo clave para que los sitios web contribuyan al gráfico de conocimiento sobre el que se construyen los motores de búsqueda generativa. Un sitio web mal estructurado dificulta que los LLMs comprendan hechos clave, como precios de productos, ingredientes de recetas o fechas de grabación de un pódcast.
Sin embargo, el schema markup no es el único mecanismo que la IA utiliza para extraer estos datos. Y nuestra investigación muestra que los algoritmos modernos son capaces de entender información bien estructurada, incluso sin código de schema.
Resultados de nuestra investigación
Realizamos más de 2,000 consultas en cada una de las tres plataformas de búsqueda con IA más populares: ChatGPT, Google AI Overviews y Perplexity. Las respuestas sintetizadas por estas plataformas incluyeron 9,000 fuentes citadas. Una cita se define como cualquier sitio web o marca mencionada en una respuesta de búsqueda con IA que incluya un enlace a la URL de origen.
Nuestros especialistas en datos y expertos en GEO analizaron las fuentes citadas para detectar la presencia y los tipos de schema utilizados en esas páginas web.
¿Ayuda el schema markup a aumentar la visibilidad de la marca en la búsqueda generativa?
De manera general, el 81 % de las páginas web que fueron citadas incluían schema markup, y solo el 19 % no incluía ningún schema markup.
Solo con mirar estos datos, se podría llegar a la conclusión de que incluir schema es un requisito para ser citado en respuestas de IA. Pero esa no sería una suposición precisa.
Para entender esto, es importante identificar los tipos de schema que realmente importan.
Tipos de schema prácticos para la optimización de la búsqueda generativa
No todo el schema markup resalta contenido que pueda ser citado directamente en respuestas generadas por IA. Atributos como Person y Organization pueden definir al autor de la publicación y el nombre de la empresa, pero no aportan información específica sobre el contenido de la página en sí.
Al considerar el contenido principal que los usuarios buscan en las respuestas de IA, otros tipos de schema son más importantes para marcar esa información:
- HowTo – Instrucciones que explican cómo hacer algo a través de una secuencia de pasos.
- FAQPage – Página que presenta una o más “Preguntas Frecuentes”.
- Question – Pregunta específica dentro de un documento de Preguntas Frecuentes.
- Product – Cualquier producto o servicio ofrecido.
- Event – Cualquier evento, como un concierto o partido, que ocurre en un momento y lugar determinados.
- Review – Reseña de un elemento, como una película o libro.
Al analizar nuestro conjunto de datos, encontramos que el uso de estos schemas relacionados con el contenido estaba mucho menos presente en las fuentes citadas.
Schemas más populares utilizados por las fuentes citadas en búsquedas con IA
El Person schema resultó ser el más popular: el 58,9 % de las fuentes citadas utilizan este schema. Esto coincide con el requisito de las búsquedas con IA de contar con fuentes de calidad y autoridad. Los autores confiables, con reputación de producir contenido preciso y de alta calidad, son más propensos a ser citados con frecuencia.
Por otro lado, los schema Article y ListItem parecen tener menor relevancia. Esto resulta contraintuitivo: si el uso de schema fuera tan importante, se esperaría que los listículos con el ListItem schema fueran mucho más frecuentes entre las fuentes citadas. Sin embargo, el 57,6 % de las fuentes citadas no usan el ListItem schema, aunque los listículos son fuentes muy populares y los resultados en búsquedas con IA a menudo se presentan en formato de lista para facilitar su uso. De manera similar, el 59,3 % de las fuentes citadas no utilizan el Article schema.
Schemas aún más específicos para FAQs y productos mostraron tener poca o ninguna influencia en la visibilidad de las fuentes en las respuestas de IA. Solo el 1,8 % de las fuentes citadas utilizaban el FAQPage schema, el 6,9 % usaba Product, y el 3,1 % empleaba Question. Los schema HowTo y Review estaban presentes en menos del 1 % de las fuentes citadas.
Impacto del schema markup en las citas por motores de búsqueda generativa
Al analizar los datos de cada uno de los motores de búsqueda con IA más populares, encontramos variabilidad en la importancia relativa del schema para cada plataforma.
¿Qué schema markup es importante para las citas en Google AI Overview?
El Person schema tiene cierta relevancia, ya que se encontró que el 56,0 % de las fuentes citadas lo utilizan. Sorprendentemente, el número de fuentes citadas que no usan otros schema supera al de las que sí lo hacen. Los schema Organization y Article no parecen ser factores importantes para la citación en Google AI Overview.
Además, a la búsqueda de Google AI no le importa si se utiliza el ListItem schema en el contenido, incluso cuando la consulta solicita una lista de elementos.
¿Qué schema markup es importante para las citas en ChatGPT?
ChatGPT es la única plataforma de IA conversacional cuya función de búsqueda valora el schema. La plataforma de IA más popular del mundo da mucho peso al Person schema, ya que el 70,4 % de las fuentes citadas lo incluyen. La confianza, autoridad, precisión y fiabilidad de las fuentes son muy importantes para ChatGPT, a fin de que los usuarios confíen en sus respuestas.
No es sorprendente, por lo tanto, que la herramienta de OpenAI valore el Person schema, ya que identificar el nombre del autor permite conectar el artículo con el grafo social del autor, lo que a su vez indica la autoridad y fiabilidad de la fuente.
Los schema Organization y Article también reciben cierta importancia. ChatGPT da más peso al ListItem schema que cualquier otra plataforma de búsqueda con IA importante, aunque no es un factor determinante para la citación o mención de la fuente.
¿Qué schema markup es importante para las citas en Perplexity?
Los factores de citación de Perplexity parecen ser opuestos a los de ChatGPT. Los schema Person, Organization y Article no influyen en la probabilidad de ser citado. Los sitios web que no incluyen estos schema fueron más visibles en Perplexity.
La plataforma tampoco presta atención al ListItem schema, aunque las respuestas en Perplexity a menudo pueden basarse en información de listículos.
Estudios de caso: Ejemplos reales de resultados generativos impulsados por schema
Verificar el uso de schema markup es muy fácil con el Validador de Schema Markup. Esta práctica herramienta puede usarse para comprobar que el schema de tu sitio web está correctamente implementado, y también para examinar el uso de schema por tus competidores u otros sitios web populares. Podemos usar la herramienta para analizar estudios de caso de sitios web comúnmente citados y determinar cómo (o si) utilizan schema.
Wikipedia – Uno de los sitios web más citados, Wikipedia usa schema de manera muy limitada. Los wikis que incluyen 50 fuentes, una tabla de elementos principales, miniaturas de imágenes y hechos clave generalmente tendrán como máximo un puñado de atributos de schema, mayormente relacionados con el artículo de Wikipedia en sí, pero casi nada que ayude a los LLMs a extraer detalles sobre el contenido del wiki, ¡ni siquiera una descripción resumida!
Reddit – Otra fuente de citas extremadamente popular, especialmente para Google AI Overviews. Reddit no utiliza marcado de schema.org en ninguna de sus páginas, salvo un par de etiquetas articleBody codificadas erróneamente.
TripAdvisor – Uno de los sitios de reseñas de viajes más populares, TripAdvisor utiliza FAQPage schema para resaltar preguntas y respuestas en sus populares páginas de discusión (por ejemplo, “¿Cuáles son los restaurantes más populares en Londres?”). Aunque el marcado puede haber sido implementado para responder a búsquedas por voz, también ha ayudado al sitio a destacar entre el ruido del contenido generado por usuarios (UGC) y lograr que sus respuestas principales sean citadas frecuentemente en ChatGPT, Perplexity y Google.
Conclusiones clave
En general, el schema markup parece tener una relevancia muy limitada como factor de posicionamiento, visibilidad o citación en cualquiera de las principales plataformas de búsqueda con IA. Usar el código HTML correcto importa mucho más. Por ejemplo, etiquetar listas con <ul><li>…</li></ul> o listas numeradas como <ol><li>…</li></ol> logrará el mismo resultado.
Esto no significa que no debas usar schema markup. El schema sigue siendo importante para la búsqueda orgánica, y definitivamente no está de más hacer que tus datos clave sean más accesibles y comprensibles para los LLMs. Sin embargo, si aún no estás usando schema, no hay necesidad de entrar en pánico, siempre que utilices marcado HTML semántico y un código claro.
Aumenta tu visibilidad en las búsquedas de IA
Metodología
ChatGPT, Google AI Overviews y Perplexity fueron seleccionados como objetivos de este estudio porque son los tres motores de búsqueda con IA más utilizados. La investigación comenzó con la identificación de una amplia variedad de prompts derivados de búsquedas populares en Google en Reino Unido, Europa y EE. UU., abarcando temas que van desde literatura hasta comercio electrónico y cultura popular. Los prompts se ejecutaron manualmente y mediante herramientas de IA como Otterly.ai, que rastrean las respuestas de búsqueda con IA, para comparar los resultados, garantizar un cierto grado de consistencia y eliminar posibles sesgos.
Las citas incluidas en las respuestas de IA fueron verificadas manualmente por nuestro equipo de analistas de SEO y GEO para su clasificación, y luego fueron rastreadas con el Screaming Frog SEO Spider para detectar el uso de schema en las URLs citadas. Las citas legítimas debían incluir la mención de un sitio web o marca en la respuesta de IA junto con un enlace a la URL de origen. Se descartaron cualquier enlace roto, URLs 404 (página no encontrada) o páginas web “alucinadas”.