Ir al contenido principal

Herramientas HTTP

Analiza tus páginas web: crawl, peso, headers y seguridad de los enlaces

Dos herramientas para diagnosticar los problemas HTTP de tus páginas web. El Page Crawl Checker analiza el peso HTML, los headers, el crawl budget y los subrecursos. El Phishing URL Checker verifica un enlace sospechoso contra 4 bases de threat intelligence.

Page Crawl Checker

Analiza el peso HTML, los headers, el crawl budget, los subrecursos y las redirecciones del lado del cliente. Verifica la conformidad con el límite de 2 MB de Googlebot.

Phishing URL Checker

Verifica si una URL está señalada como phishing o malware por URLhaus, Google Safe Browsing, PhishTank y VirusTotal. Puntuación de riesgo y veredicto en segundos.

¿Por qué usar herramientas HTTP?

El protocolo HTTP es la base de toda página web. Un problema HTTP significa contenido mal indexado, un sitio lento o recursos desperdiciados. Sin análisis HTTP, ignoras lo que Googlebot ve realmente de tus páginas y si tus visitantes hacen clic en enlaces seguros.

Cuatro situaciones en las que estas herramientas son indispensables:

  • Página demasiado pesada → Googlebot trunca el HTML más allá de 2 MB, tus enlaces internos y FAQ desaparecen del índice
  • Headers incorrectos → Un Content-Type mal configurado o un X-Robots-Tag: noindex olvidado puede desindexar una página entera
  • Crawl budget desperdiciado → Subrecursos excesivos y la ausencia de compresión reducen el número de páginas rastreadas por Google
  • Enlace sospechoso recibido → Un email o SMS contiene un enlace dudoso, necesitas verificar si está señalado como phishing o malware antes de hacer clic

Cómo usar las herramientas HTTP

Paso 1: Elegir la herramienta

NecesidadHerramienta a usar
Analizar el peso, los headers y el crawl de una páginaPage Crawl Checker
Verificar si un enlace es phishing o malwarePhishing URL Checker

Paso 2: Introducir la URL

Introduce la URL completa en el campo de entrada. Ambas herramientas aceptan cualquier URL pública:

https://www.captaindns.com/es/blog

Para el Page Crawl Checker, prueba primero tus páginas más largas (categorías, páginas de productos, artículos con muchas imágenes). Para el Phishing URL Checker, pega directamente el enlace sospechoso recibido por email o SMS.

Paso 3: Analizar los resultados

Cada herramienta proporciona un informe detallado:

  • Page Crawl Checker: tamaño HTML, puntuación de crawl budget (0-100), inventario de subrecursos, verificación robots.txt, headers HTTP, detección de redirecciones del lado del cliente, huella SHA-256
  • Phishing URL Checker: veredicto global (limpio, sospechoso, malicioso), puntuación de riesgo (0-100), detalles por fuente de threat intelligence, diagnósticos de cobertura

Detalles de las herramientas

Page Crawl Checker

Análisis completo del crawl de una página web desde el punto de vista de Googlebot:

FuncionalidadDescripción
Análisis de tamañoPeso bruto y descomprimido del HTML, ratio respecto al límite de 2 MB (o 64 MB para los PDF)
Puntuación de crawl budgetNota sobre 100 que evalúa la eficiencia de la página para el crawl, con detalle de los factores
SubrecursosInventario completo de scripts, CSS, imágenes, fuentes e iframes con tamaño y estado
Verificación robots.txtAcceso de Googlebot autorizado o bloqueado, crawl-delay, sitemaps declarados
Headers HTTPContent-Type, Content-Encoding, Cache-Control, X-Robots-Tag, HSTS, Server
Redirecciones del clienteDetección de meta refresh y redirecciones JavaScript invisibles para Googlebot
Comparación móvil/escritorioDiferencias de tamaño, headers y contenido entre las versiones smartphone y escritorio
Huella SHA-256Hash del contenido para detectar cambios entre análisis
Detección WAFIdentificación del firewall de aplicación con fallback multi-User-Agent

Utilidad: Diagnosticar los problemas de tamaño y crawl que afectan la indexación en Google, optimizar el crawl budget y detectar las redirecciones JavaScript que Googlebot no sigue.


Phishing URL Checker

Verificación de una URL contra 4 bases de threat intelligence:

FuncionalidadDescripción
4 fuentes consultadasURLhaus (malware), Google Safe Browsing (phishing), PhishTank (phishing comunitario), VirusTotal (70+ antivirus)
Puntuación de riesgoPuntuación ponderada de 0 a 100 según la fiabilidad de cada fuente
Veredicto globalLimpio, sospechoso, malicioso o indeterminado
Detalles por fuenteEstado individual, tipos de amenazas detectadas y tiempo de respuesta
Formatos aceptadosURL completa, nombre de dominio desnudo o dirección IP
DiagnósticosInformación sobre fuentes no disponibles, timeouts y cobertura limitada

Utilidad: Verificar un enlace sospechoso antes de hacer clic, proteger tu organización contra campañas de phishing y comprobar que tu propio dominio no esté señalado falsamente (falso positivo).


Casos de uso concretos

Caso 1: Página e-commerce truncada por Googlebot

Síntoma: La FAQ y los enlaces de navegación en la parte inferior de tu página de categoría no aparecen en los resultados de Google.

Diagnóstico: El Page Crawl Checker revela que la página pesa 3,2 MB de HTML. Googlebot trunca a 2 MB y pierde los últimos 200 productos, la FAQ y el enlazado interno del footer.

Acción: Limitar el listado inicial, usar paginación con carga diferida y mover la FAQ a la parte superior de la página.


Caso 2: Email de phishing bancario

Síntoma: Recibes un email urgente de tu "banco" con un enlace de verificación de cuenta.

Diagnóstico: El Phishing URL Checker devuelve una puntuación de 75 (alta). Google Safe Browsing y PhishTank señalan la URL como phishing de ingeniería social.

Acción: No hacer clic. Reportar el email como phishing. Acceder al sitio de tu banco escribiendo la dirección directamente en el navegador.


Caso 3: Puntuación de crawl budget baja

Síntoma: Google rastrea pocas páginas de tu sitio a pesar de tener contenido actualizado regularmente.

Diagnóstico: El Page Crawl Checker muestra una puntuación de 35/100. La página carga 85 subrecursos, de los cuales 40 son scripts de terceros (analytics, widgets, AB testing).

Acción: Cargar los scripts de terceros en diferido (defer/async), eliminar los scripts no utilizados, activar la compresión gzip/brotli.


Caso 4: Enlace acortado sospechoso en un SMS

Síntoma: Un SMS contiene un enlace bit.ly que te pide "actualizar tu paquete".

Diagnóstico: Después de expandir el enlace acortado, el Phishing URL Checker señala la URL final. URLhaus la referencia como distribución de malware.

Acción: Eliminar el SMS y bloquear el número. Los servicios de mensajería legítimos nunca piden pagos por SMS.


❓ FAQ - Preguntas frecuentes

P: ¿Por qué analizar las páginas web con herramientas HTTP?

R: Las herramientas HTTP detectan problemas invisibles: páginas demasiado pesadas para Googlebot (truncamiento más allá de 2 MB), headers mal configurados (X-Robots-Tag: noindex olvidado), redirecciones JavaScript que Googlebot no sigue. Estos problemas afectan directamente tu posicionamiento sin aviso en Search Console.


P: ¿Cómo verificar si un enlace es phishing?

R: Pega la URL en el Phishing URL Checker. La herramienta consulta 4 bases de threat intelligence en paralelo (URLhaus, Google Safe Browsing, PhishTank, VirusTotal) y devuelve un veredicto con una puntuación de riesgo de 0 a 100.


P: ¿Qué es el límite de 2 MB de Googlebot?

R: Google puede descargar e indexar los primeros 2 097 152 bytes de HTML de una página. Más allá, el contenido se trunca. El límite se aplica al HTML descomprimido: la compresión gzip/brotli no evita este límite.


P: ¿Qué es el crawl budget?

R: El crawl budget es el número de páginas que Googlebot puede rastrear en un tiempo determinado. Las páginas pesadas con muchos subrecursos consumen más recursos. El Page Crawl Checker calcula una puntuación sobre 100 para evaluar la eficiencia de cada página.


P: ¿Cuál es la diferencia entre phishing y malware?

R: El phishing imita un servicio legítimo para robar credenciales. El malware distribuye software malicioso (virus, ransomware, troyanos). Una URL puede estar señalada por ambos. El Phishing URL Checker distingue estas categorías en los resultados.


P: ¿El resultado del Phishing URL Checker es fiable al 100%?

R: Ninguna herramienta garantiza una detección al 100%. La vida media de una URL de phishing es inferior a 24 horas. Un resultado "limpio" significa que ninguna fuente la señala en el momento de la verificación, no que sea definitivamente segura.


P: ¿Cómo reducir el peso de una página web?

R: Elimina el CSS y JavaScript inline innecesario, activa la compresión gzip o brotli, externaliza los SVG, minifica el HTML y usa lazy loading. El Page Crawl Checker identifica los puntos de mejora específicos.


Herramientas complementarias

HerramientaUtilidad
Búsqueda DNSVerificar los registros DNS de tu dominio
Auditoría de entregabilidad emailAnalizar MX, SPF, DKIM y DMARC de tu dominio
Verificador de propagación DNSConfirmar que tus cambios DNS se han propagado
IP Blacklist CheckerVerificar si una IP está en listas negras de email
Domain Blacklist CheckerVerificar si un dominio está en lista negra por spam o phishing

Recursos útiles