¿Por qué usar herramientas HTTP?
El protocolo HTTP es la base de toda página web. Un problema HTTP significa contenido mal indexado, un sitio lento o recursos desperdiciados. Sin análisis HTTP, ignoras lo que Googlebot ve realmente de tus páginas y si tus visitantes hacen clic en enlaces seguros.
Cinco situaciones en las que estas herramientas son indispensables:
- Página demasiado pesada → Googlebot trunca el HTML más allá de 2 MB, tus enlaces internos y FAQ desaparecen del índice
- Headers incorrectos → Un
Content-Typemal configurado o unX-Robots-Tag: noindexolvidado puede desindexar una página entera - Crawl budget desperdiciado → Subrecursos excesivos y la ausencia de compresión reducen el número de páginas rastreadas por Google
- Enlace sospechoso recibido → Un email o SMS contiene un enlace dudoso, necesitas verificar si está señalado como phishing o malware antes de hacer clic
- Redirección de dominio → Cambias de nombre de dominio o rediriges un apex a www, y necesitas HTTPS en el dominio de origen
Cómo usar las herramientas HTTP
Paso 1: Elegir la herramienta
| Necesidad | Herramienta a usar |
|---|---|
| Analizar el peso, los headers y el crawl de una página | Page Crawl Checker |
| Verificar si un enlace es phishing o malware | Phishing URL Checker |
| Analizar la cadena de redirección de una URL | Redirect Checker |
| Redirigir un dominio con HTTPS | Redirect Hosting |
Paso 2: Introducir la URL
Introduce la URL completa en el campo de entrada. Ambas herramientas de análisis aceptan cualquier URL pública:
https://www.captaindns.com/es/blog
Para el Page Crawl Checker, prueba primero tus páginas más largas (categorías, páginas de productos, artículos con muchas imágenes). Para el Phishing URL Checker, pega directamente el enlace sospechoso recibido por email o SMS.
Paso 3: Analizar los resultados
Cada herramienta proporciona un informe detallado:
- Page Crawl Checker: tamaño HTML, puntuación de crawl budget (0-100), inventario de subrecursos, verificación robots.txt, headers HTTP, detección de redirecciones del lado del cliente, huella SHA-256
- Phishing URL Checker: veredicto global (limpio, sospechoso, malicioso), puntuación de riesgo (0-100), detalles por fuente de threat intelligence, diagnósticos de cobertura
- Redirect Hosting: código HTTP de redirección (301 o 302), estado del certificado TLS, reenvío de ruta y query strings
Detalles de las herramientas
Page Crawl Checker
Análisis completo del crawl de una página web desde el punto de vista de Googlebot:
| Funcionalidad | Descripción |
|---|---|
| Análisis de tamaño | Peso bruto y descomprimido del HTML, ratio respecto al límite de 2 MB (o 64 MB para los PDF) |
| Puntuación de crawl budget | Nota sobre 100 que evalúa la eficiencia de la página para el crawl, con detalle de los factores |
| Subrecursos | Inventario completo de scripts, CSS, imágenes, fuentes e iframes con tamaño y estado |
| Verificación robots.txt | Acceso de Googlebot autorizado o bloqueado, crawl-delay, sitemaps declarados |
| Headers HTTP | Content-Type, Content-Encoding, Cache-Control, X-Robots-Tag, HSTS, Server |
| Redirecciones del cliente | Detección de meta refresh y redirecciones JavaScript invisibles para Googlebot |
| Comparación móvil/escritorio | Diferencias de tamaño, headers y contenido entre las versiones smartphone y escritorio |
| Huella SHA-256 | Hash del contenido para detectar cambios entre análisis |
| Detección WAF | Identificación del firewall de aplicación con fallback multi-User-Agent |
Utilidad: Diagnosticar los problemas de tamaño y crawl que afectan la indexación en Google, optimizar el crawl budget y detectar las redirecciones JavaScript que Googlebot no sigue.
Phishing URL Checker
Verificación de una URL contra 4 bases de threat intelligence:
| Funcionalidad | Descripción |
|---|---|
| 4 fuentes consultadas | URLhaus (malware), Google Safe Browsing (phishing), PhishTank (phishing comunitario), VirusTotal (70+ antivirus) |
| Puntuación de riesgo | Puntuación ponderada de 0 a 100 según la fiabilidad de cada fuente |
| Veredicto global | Limpio, sospechoso, malicioso o indeterminado |
| Detalles por fuente | Estado individual, tipos de amenazas detectadas y tiempo de respuesta |
| Formatos aceptados | URL completa, nombre de dominio desnudo o dirección IP |
| Diagnósticos | Información sobre fuentes no disponibles, timeouts y cobertura limitada |
Utilidad: Verificar un enlace sospechoso antes de hacer clic, proteger tu organización contra campañas de phishing y comprobar que tu propio dominio no esté señalado falsamente (falso positivo).
Redirect Checker
Análisis completo de la cadena de redirección de una URL:
| Funcionalidad | Descripción |
|---|---|
| Cadena de redirección | Seguimiento de cada salto HTTP (301, 302, 307, 308) con código de estado, headers y tiempo de respuesta |
| Análisis en lote | Verificación de múltiples URLs en una sola solicitud |
| Despliegue de URL | Resolución de enlaces acortados (bit.ly, t.co, tinyurl) hacia el destino final |
| Detección de bucles | Identificación de redirecciones circulares antes de que bloqueen el navegador |
| Headers HTTP | Visualización completa de los headers de respuesta en cada paso de la cadena |
Utilidad: Diagnosticar problemas de redirección, verificar el destino final de un enlace acortado y analizar el comportamiento HTTP de una URL antes de visitarla.
Redirect Hosting
Redirección de dominio con HTTPS automático y gestión de certificados TLS:
| Funcionalidad | Descripción |
|---|---|
| HTTPS automático | Certificado TLS mediante Let's Encrypt, emitido en 60 segundos |
| 301 y 302 | Redirección permanente (SEO) o temporal (campañas) |
| Reenvío de ruta | Preservación del path y de los query strings |
| Verificación de dominio | Prueba de propiedad mediante registro TXT, compartida con MTA-STS y BIMI |
| Apex y subdominios | Soporte A/AAAA para dominios raíz, CNAME para subdominios |
Utilidad: Redirigir un dominio antiguo a uno nuevo, forzar www en un apex, o gestionar redirecciones temporales para campañas de marketing, todo con HTTPS válido sin configuración de servidor.
Casos de uso concretos
Caso 1: Página e-commerce truncada por Googlebot
Síntoma: La FAQ y los enlaces de navegación en la parte inferior de tu página de categoría no aparecen en los resultados de Google.
Diagnóstico: El Page Crawl Checker revela que la página pesa 3,2 MB de HTML. Googlebot trunca a 2 MB y pierde los últimos 200 productos, la FAQ y el enlazado interno del footer.
Acción: Limitar el listado inicial, usar paginación con carga diferida y mover la FAQ a la parte superior de la página.
Caso 2: Email de phishing bancario
Síntoma: Recibes un email urgente de tu "banco" con un enlace de verificación de cuenta.
Diagnóstico: El Phishing URL Checker devuelve una puntuación de 75 (alta). Google Safe Browsing y PhishTank señalan la URL como phishing de ingeniería social.
Acción: No hacer clic. Reportar el email como phishing. Acceder al sitio de tu banco escribiendo la dirección directamente en el navegador.
Caso 3: Puntuación de crawl budget baja
Síntoma: Google rastrea pocas páginas de tu sitio a pesar de tener contenido actualizado regularmente.
Diagnóstico: El Page Crawl Checker muestra una puntuación de 35/100. La página carga 85 subrecursos, de los cuales 40 son scripts de terceros (analytics, widgets, AB testing).
Acción: Cargar los scripts de terceros en diferido (defer/async), eliminar los scripts no utilizados, activar la compresión gzip/brotli.
Caso 4: Enlace acortado sospechoso en un SMS
Síntoma: Un SMS contiene un enlace bit.ly que te pide "actualizar tu paquete".
Diagnóstico: Después de expandir el enlace acortado, el Phishing URL Checker señala la URL final. URLhaus la referencia como distribución de malware.
Acción: Eliminar el SMS y bloquear el número. Los servicios de mensajería legítimos nunca piden pagos por SMS.
Caso 5: Migración de dominio
Síntoma: Estás migrando de antiguo.captaindns.com a captaindns.com y los visitantes del dominio antiguo ven un error.
Diagnóstico: El dominio antiguo no apunta a ningún sitio. Sin una redirección HTTPS, los navegadores muestran un error de certificado o una página en blanco.
Acción: Configurar el Redirect Hosting con una redirección 301 y el reenvío de ruta activado. Los visitantes de antiguo.captaindns.com/pagina llegan a captaindns.com/pagina con el código SEO correcto.
❓ FAQ - Preguntas frecuentes
P: ¿Por qué analizar las páginas web con herramientas HTTP?
R: Las herramientas HTTP detectan problemas invisibles: páginas demasiado pesadas para Googlebot (truncamiento más allá de 2 MB), headers mal configurados (X-Robots-Tag: noindex olvidado), redirecciones JavaScript que Googlebot no sigue. Estos problemas afectan directamente tu posicionamiento sin aviso en Search Console.
P: ¿Cómo verificar si un enlace es phishing?
R: Pega la URL en el Phishing URL Checker. La herramienta consulta 4 bases de threat intelligence en paralelo (URLhaus, Google Safe Browsing, PhishTank, VirusTotal) y devuelve un veredicto con una puntuación de riesgo de 0 a 100.
P: ¿Qué es el límite de 2 MB de Googlebot?
R: Google puede descargar e indexar los primeros 2 097 152 bytes de HTML de una página. Más allá, el contenido se trunca. El límite se aplica al HTML descomprimido: la compresión gzip/brotli no evita este límite.
P: ¿Qué es el crawl budget?
R: El crawl budget es el número de páginas que Googlebot puede rastrear en un tiempo determinado. Las páginas pesadas con muchos subrecursos consumen más recursos. El Page Crawl Checker calcula una puntuación sobre 100 para evaluar la eficiencia de cada página.
P: ¿Cuál es la diferencia entre phishing y malware?
R: El phishing imita un servicio legítimo para robar credenciales. El malware distribuye software malicioso (virus, ransomware, troyanos). Una URL puede estar señalada por ambos. El Phishing URL Checker distingue estas categorías en los resultados.
P: ¿El resultado del Phishing URL Checker es fiable al 100%?
R: Ninguna herramienta garantiza una detección al 100%. La vida media de una URL de phishing es inferior a 24 horas. Un resultado "limpio" significa que ninguna fuente la señala en el momento de la verificación, no que sea definitivamente segura.
P: ¿Cómo reducir el peso de una página web?
R: Elimina el CSS y JavaScript inline innecesario, activa la compresión gzip o brotli, externaliza los SVG, minifica el HTML y usa lazy loading. El Page Crawl Checker identifica los puntos de mejora específicos.
P: ¿Cómo redirigir un dominio a otro?
R: Usa el Redirect Hosting de CaptainDNS. Verifica la propiedad de tu dominio mediante un registro TXT, configura el destino y el tipo de redirección (301 o 302), y luego apunta tus DNS. El certificado HTTPS se emite automáticamente.
P: ¿La redirección conserva el SEO?
R: Sí, una redirección 301 (permanente) transfiere casi toda la autoridad SEO al destino. El Redirect Hosting soporta redirecciones 301 y reenvío de ruta, lo que preserva el posicionamiento de tus páginas en los motores de búsqueda.
Herramientas complementarias
| Herramienta | Utilidad |
|---|---|
| Búsqueda DNS | Verificar los registros DNS de tu dominio |
| Auditoría de entregabilidad email | Analizar MX, SPF, DKIM y DMARC de tu dominio |
| Verificador de propagación DNS | Confirmar que tus cambios DNS se han propagado |
| IP Blacklist Checker | Verificar si una IP está en listas negras de email |
| Domain Blacklist Checker | Verificar si un dominio está en lista negra por spam o phishing |
| Redirect Checker | Analizar cadenas de redirección y expandir enlaces acortados |
| Redirección de dominio | Configurar redirecciones 301/302 HTTPS para tus dominios |
Recursos útiles
- Google - Documentación sobre los límites de crawl (documentación oficial de Googlebot)
- Google - Mobile-first indexing (guía de mobile-first indexing)
- Google Safe Browsing (protección contra sitios peligrosos)
- URLhaus by abuse.ch (base comunitaria de URLs maliciosas)
- HTTP Archive - State of the Web (estadísticas sobre el peso de las páginas web)