Google sigue siendo importante. Pero en 2025, ChatGPT, Perplexity, Claude y Gemini se están convirtiendo en el primer punto de contacto entre usuarios e información. Si los spiders de IA no entienden tu sitio, no existes.
Analizar tu sitio gratis →Los motores de búsqueda tradicionales usan rastreadores que leen HTML, siguen enlaces y analizan palabras clave. La nueva generación de spiders de IA hace algo radicalmente diferente: intentan entender el significado de tu contenido.
Para ello, se basan en datos estructurados, marcado semántico y estándares abiertos. Un sitio sin estos elementos es ignorado o mal interpretado por los modelos de lenguaje.
El resultado: sitios técnicamente correctos, bien posicionados en Google, pero completamente invisibles para la IA.
Así como robots.txt habla a los crawlers y sitemap.xml describe la estructura, el archivo llms.txt es el estándar emergente para comunicar directamente a los modelos de lenguaje quién eres, qué haces y cómo quieres ser citado.
Defines tú cómo quieres ser descrito por ChatGPT, Claude y Perplexity cuando responden preguntas en tu sector.
Los modelos de lenguaje usan esta información para citar correctamente la fuente, aumentando las probabilidades de que tu sitio sea mencionado en las respuestas.
Un simple archivo de texto. Sin plugins, sin código. Solo súbelo a la raíz del sitio o en /.well-known/.
Adoptado por OpenAI, Anthropic y Perplexity como señal voluntaria de optimización de IA. Cuanto antes lo implementes, antes te beneficias.
llms.click analiza tu sitio en 6 categorías fundamentales, cada una con impacto directo en la visibilidad de IA.
Schema.org es el vocabulario compartido entre Google, Bing, Yahoo y Yandex para describir el contenido de las páginas de forma legible por máquinas.
Los modelos de lenguaje como GPT-4 y Claude leen tu HTML como lo haría un lector humano — pero son mucho más sensibles a la estructura.
Un sitemap XML bien formado es la forma más directa de comunicar a los spiders qué páginas quieres que se indexen.
Los metadatos OGP (ogp.me) controlan cómo aparece tu sitio cuando se comparte en redes sociales, pero también influyen en las vistas previas de los asistentes de IA.
Las directrices WCAG 2.1 del W3C no son solo una obligación moral: en Europa son un requisito legal para organismos públicos y grandes empresas.
Google convirtió los Core Web Vitals en factor de ranking oficial en 2021.
La Unión Europea ha introducido en los últimos años una serie de normativas que impactan directamente en la estructura técnica de los sitios web. La ignorancia no es una excusa — las sanciones pueden ser significativas.
El Reglamento General de Protección de Datos requiere consentimiento explícito para las cookies de perfilado, avisos de privacidad claros y accesibles, y nombramiento de un DPD para determinadas categorías de responsables. Los sitios no conformes arriesgan sanciones de hasta el 4% del volumen de negocios anual mundial.
El primer reglamento del mundo sobre inteligencia artificial. Entró en vigor en agosto de 2024, impone obligaciones de transparencia sobre los contenidos generados por IA (marcas de agua, divulgación). Los sitios que usan IA para generar contenidos sin divulgación arriesgan sanciones crecientes desde 2025.
Obliga a las administraciones públicas y grandes empresas privadas a garantizar la accesibilidad WCAG 2.1 AA de sus sitios y aplicaciones. Desde 2025 se amplía a nuevas categorías de sujetos privados con sanciones de hasta el 5% de la facturación.
El Digital Services Act impone obligaciones de transparencia y responsabilidad a las plataformas digitales. Para los sitios con más de 45M de usuarios UE aplican obligaciones amplísimas, pero también los sitios menores deben garantizar mecanismos de denuncia e informaciones claras.
La Directiva sobre seguridad de las redes y sistemas de información extiende las obligaciones de ciberseguridad a muchas más categorías de empresas. Impone medidas técnicas mínimas (HTTPS, gestión de vulnerabilidades, respuesta a incidentes) con sanciones de hasta 10M€ o el 2% de la facturación.
La directiva ePrivacy regula el uso de cookies y tecnologías de seguimiento. El nuevo Reglamento ePrivacy, aún en negociación, introducirá normas de consentimiento aún más estrictas.
Estos son los principales crawlers de IA activos en 2025. Cada uno tiene un user-agent específico y diferentes políticas de acceso. Tu robots.txt debe gestionarlos conscientemente.
| Bot | Empresa | User-Agent | Usado para | Respeta robots.txt |
|---|---|---|---|---|
| GPTBot | OpenAI | GPTBot/1.0 |
Training ChatGPT, browsing | Sí |
| ClaudeBot | Anthropic | ClaudeBot/1.0 |
Training Claude, ricerca | Sí |
| PerplexityBot | Perplexity AI | PerplexityBot/1.0 |
Risposta in tempo reale | Sí |
| Google-Extended | Google-Extended |
Training Gemini, SGE | Sí | |
| Applebot-Extended | Apple | Applebot-Extended |
Training Apple Intelligence | Sí |
| CCBot | Common Crawl | CCBot/2.0 |
Dataset aperti, molti LLM | Parcialmente |
| Bytespider | ByteDance | Bytespider |
Training modelli TikTok | Parcialmente |
| OAI-SearchBot | OpenAI | OAI-SearchBot/1.0 |
ChatGPT Search (live) | Sí |
Google penaliza los sitios con múltiples URLs que sirven el mismo contenido sin etiqueta . El PageRank se dispersa entre las versiones y ninguna se posiciona bien.
Desde 2018 Chrome marca los sitios HTTP como "no seguros". Google usa HTTPS como factor de ranking desde 2014. Los crawlers de IA rechazan o penalizan los contenidos de sitios no cifrados.
LCP > 4s, CLS > 0,25 o INP > 500ms activan la penalización Page Experience de Google. Los sitios lentos pierden posiciones frente a competidores más rápidos con contenido similar.
Los rich results (estrellas de reseñas, FAQ, breadcrumbs en SERPs) requieren datos estructurados válidos. Los marcados erróneos se ignoran o pueden llevar a la eliminación de los rich snippets.
Las imágenes sin atributo alt son invisibles para los spider de IA y los motores de búsqueda de imágenes. Además, violan WCAG 2.1 y pueden exponer a sanciones legales por accesibilidad.
Sin sitemap los crawlers deben descubrir las páginas siguiendo los enlaces — proceso lento e incompleto. Las páginas huérfanas (sin enlaces internos) nunca se indexan.
Más allá de la puntuación técnica, llms.click Gold consulta IA reales con preguntas en el idioma de tu sitio y mide tu presencia real en las respuestas de IA.
5 preguntas generadas específicamente para el tema y el enfoque geográfico de tu sitio — no consultas genéricas que cualquier sitio importante podría responder.
Sitio italiano → preguntas en italiano. Sitio francés → preguntas en francés. Las respuestas de IA se verifican en el mismo idioma de tu audiencia.
Cada consulta muestra citado/no citado, las fuentes devueltas y un fragmento de la respuesta de IA. Completamente accionable.