Influencia IA — qué bots de IA pueden rastrearte y qué productos de IA te envían tráfico

¿Qué es Influencia IA?

Influencia IA muestra cómo las superficies de IA interactúan con tu sitio. Cubre dos cosas que realmente puedes medir:

Acceso de rastreadores de IA — cuál de los 29 bots de IA monitoreados permiten o bloquean tus declaraciones de robots.txt, llms.txt y Content-Signal.
Referencias de IA — qué productos de IA (ChatGPT, Claude, Perplexity, Gemini, Copilot, DeepSeek y 20+ más) te envían visitantes humanos.

Abre el panel de tu sitio y selecciona la pestaña Influencia IA (en el grupo Behavior de la barra lateral izquierda). Es gratis en todos los planes. Hay tres pestañas: Resumen, Rastreadores y Métricas.

La pestaña Resumen

Un Resumen compacto (cuántos de los 29 bots pueden rastrearte, cuántos están bloqueados, visitas humanas de IA) más una tarjeta Robots y Señales que te permite verificar el veredicto por ti mismo:

Los enlaces Ver en bruto abren tu robots.txt y llms.txt reales.
La declaración Content-Signal se parsea y se muestra como chips.
La lista exacta de bots bloqueados en la raíz se lista por nombre.

¿Qué es Content-Signal?

Content-Signal es una directiva (emitida por la «Managed robots.txt» de Cloudflare y un número creciente de sitios) que declara la intención de uso de IA por separado del acceso de rastreo:

search — ¿puede tu contenido construir un índice de búsqueda?
ai-input — ¿puede usarse como entrada en vivo para una respuesta generativa?
ai-train — ¿puede usarse para entrenar un modelo de IA?

Cada uno se muestra como yes, no o unset.

La pestaña Rastreadores

Una tabla de solo lectura de los 29 rastreadores de IA monitoreados y el acceso de cada bot en tu sitio. No es un panel de control — Zenovay lee robots.txt, no bloquea bots en el edge. Busca, ordena y filtra por categoría (Asistentes de IA en vivo, Entrenamiento de modelos, Agentes de navegador IA, Scrapers comerciales, Búsqueda con superposiciones de IA).

Qué significa cada veredicto

La única pregunta que importa es «¿puede este bot alcanzar mi contenido?», por lo que el veredicto tiene tres estados:

Permitido (verde) — autorizado en la raíz de tu sitio. Esto incluye bots que están permitidos en la raíz pero excluidos de rutas genéricas de infraestructura como /api o /_next — esas exclusiones se muestran como una nota, no una advertencia, porque no restringen tu contenido.
Bloqueado (rojo) — prohibido en la raíz del sitio por robots.txt.
Desconocido (gris) — no pudimos leer tu robots.txt, o el sitio aún no ha tenido su primera verificación (dentro de las 24 horas posteriores a agregarlo).

Volver a verificar bajo demanda

El botón Volver a verificar ahora vuelve a obtener tu robots.txt + llms.txt, reevalúa los 29 bots y ejecuta 5 sondas HTTP HEAD en vivo (una por categoría) para detectar bloqueos Cloudflare WAF / anti-bot de CDN que no son visibles en robots.txt. Limitado a una vez por minuto por sitio.

La pestaña Métricas

Analítica de referencias de IA — visitantes humanos que llegaron desde productos de IA. Cada fuente de IA detectada se lista con visitantes, porcentaje, conversión y (si está habilitado) ingresos, más una Distribución del método de detección que se reconcilia con la lista de fuentes.

Cómo identificamos referencias de IA

Cuatro señales, en orden de prioridad:

Coincidencia de referente — document.referrer coincide con un host de IA conocido (chat.openai.com, claude.ai, perplexity.ai, gemini.google.com, …).
Coincidencia UTM — la URL de campaña lleva utm_source=chatgpt, etc.
Coincidencia User-Agent — la visita vino del navegador in-app de un producto de IA.
Heurística comportamental (IA oscura) — visitas de tráfico directo cuyo patrón coincide con huellas de llegada IA.

¿Qué es la "IA oscura"?

Una gran parte del tráfico llegado por IA no lleva referente — el usuario pegó tu enlace desde una ventana de chat, o la superficie de IA eliminó el referente. Una heurística diaria lo captura: aterrizaje en contenido profundo (URL de cola larga, no /), lectura focalizada de 30–300 s con > 70 % de scroll, visitante primerizo con baja interacción, llegada en horario laboral. Una puntuación ≥ 60 la marca como originaria de IA vía behavioral_heuristic con confianza 0,5–0,95.

Preguntas comunes

«Estoy bloqueando GPTBot en robots.txt pero el panel dice 'Permitido'. ¿Por qué?»

La causa más común: usas la Managed robots.txt de Cloudflare, que añade un bloque gestionado que prohíbe bots de IA — pero un grupo personalizado posterior en el mismo archivo vuelve a permitir algunos de ellos. Según RFC 9309, todos los grupos User-agent para un bot se combinan y el resultado efectivo es lo que un rastreador real obedece. Zenovay reporta ese acceso efectivo — por lo que un bot re-permitido en un grupo posterior muestra correctamente Permitido. Abre Ver en bruto en la pestaña Resumen para ver las reglas exactas. De lo contrario: confirma que https://yourdomain.com/robots.txt es accesible con un bloque literal User-agent: GPTBot / Disallow: /, luego presiona Volver a verificar ahora.

«¿Bloquear bots de IA en robots.txt realmente los detendrá?»

Los rastreadores respetables (OpenAI, Anthropic, Google, Perplexity, Microsoft, Apple) respetan robots.txt. Los menos respetables lo ignoran. Para cumplimiento necesitas reglas Cloudflare AI-Bot, una regla WAF/rate-limit que coincida con User-Agent (→ 403), o una baliza del lado del servidor (Zenovay V1.5 — mide eventos de rastreo reales, no solo acceso configurado).

«¿Por qué Citation y Assist están marcadas como 'Próximamente en V2'?»

Podríamos lanzar números vanidosos hoy, pero no te engañaremos. Citation (dónde aparece tu marca dentro de las respuestas de IA) necesita un proveedor de monitoreo de prompts o nuestro propio rastreador. Assist (impulso aguas abajo tras exposición a IA) es demasiado ruidoso en volúmenes pequeños. Cuando se lance V2, cada métrica lleva una etiqueta medido vs. inferido.

«¿Influencia IA rastrea visitantes individuales?»

No. Influencia IA lee los mismos datos de visitantes que el resto de tu panel, por lo que hereda la postura de seguimiento de Zenovay: modo sin cookies soportado, IP hasheadas con una sal de rotación diaria (nunca en texto plano), y no añade nuevos scripts ni cookies. Reporta fuentes de IA y patrones agregados, no individuos nombrados.

Disponibilidad por plan

Gratis en todos los planes. La visibilidad del tráfico de IA es una señal de adquisición de línea base que todo cliente de Zenovay debería tener.