El gigante tecnológico Google ha aclarado cómo sus páginas de GoogleBot clasifican, diciendo que rastreará los primeros 15 MB de una página web y cualquier cosa después de que este límite no se incluirá en los cálculos de clasificación.
Google especificó en el documento de ayuda que cualquier recurso mencionado en el HTML, como imágenes, videos, CSS y JavaScript, se obtienen por separado.
Después de los primeros 15 MB del archivo, Googlebot deja de rastrear y solo considera los primeros 15 MB del archivo para la indexación, dijo Google.
El límite del tamaño del archivo se aplica en los datos sin comprimir, agregó.
Según el informe, esto dejó a algunos en la comunidad de SEO preguntándose si esto significaba que Googlebot ignoraría por completo el texto que cayera debajo de las imágenes en el límite en los archivos HTML.
Es específico para el archivo HTML en sí mismo como está escrito, aclaró John Mueller, defensor de la búsqueda de Google a través de Twitter.
Los recursos/contenido incrustado atraído con etiquetas IMG no son parte del archivo HTML, agregó.
Para asegurarse de que GoogleBot lo pondere, ahora se debe incluir contenido importante cerca de la parte superior de las páginas web.
Esto significa que el código debe estructurarse de una manera que ponga la información relevante de SEO con los primeros 15 MB en un HTML o un archivo de texto compatible.
También significa que las imágenes y los videos deben comprimirse, no estar codificados directamente en el HTML, siempre que sea posible.