Google indexa JavaScriptEl 23 de Mayo Google ha anunciado en el blog para webmasters una noticia de gran importancia en SEO y es que ya es capaz de ejecutar JavaScript e indexar ese contenido (y aplicar CSS). Era una noticia esperada, es normal que no quiera quedarse atrás ante la creciente riqueza y dinamismo de los sitios webs. Ahora, ya es capaz de ver ese contenido, cómo hacen los navegadores modernos.

Tradicionalmente sólo veía el contenido textual bruto, y no interpretaba aquel prestado con JavaScript que el navegador podía ver. Pero han trabajado para entender mejor las páginas web y su sistema de indexación lleva meses renderizando un número sustancial de páginas web que usan JavaScript.

No obstante, explican que puede no funcionar, con el consiguiente impacto negativo en los resultados de búsqueda, por los siguientes motivos:

  • Si los recursos JavaScript o CSS, en archivos separados, son bloqueados desde el archivo robots.txt. Esto tiene especial importancia cuando se trata de sitios móvil, dónde estos recursos externos (JavaScript y CSS) ayudan a los algoritmos a entender que las páginas están optimizadas para móvil.
  • Si tu servidor es incapaz de manejar un volumen elevado de peticiones de rastreo.
  • Si el JavaScript es demasido complejo o arcano para ejecutarlo, en cuyo caso no podrán renderizar la página completa y adecuadamente.
  • Si el JavaScript hace la función de eliminar contenido en lugar de añadirlo, impedirá a los robots indexar dicho contenido.
  • No obstante, tu sitio debería estar preparado para que los usuarios pudieran disfrutar de tu contenido, aunque utilizaran un navegador que no soportase JavaScript o lo tuviera deshabilitado.

Además, en pocos días Google va a lanzar una herramienta en Webmaster tools que ayude a los webmasters a entender mejor como Google presta el contenido de un sitio web.

Fuente: http://googlewebmastercentral.blogspot.co.uk/2014/05/understanding-web-pages-better.html

Actualización (Mayo, 2015)

SearchEngineLand publica una serie de tests asociados a diferentes funciones JavaScript que demuestran como son ejecutadas por GoogleBot,e indexado su contenido:

“We Tested How Googlebot Crawls Javascript And Here’s What We Learned”

Actualización (Mayo, 2018)

Google nos explica como indexa “JasavaScript powered pages”, que puede resumirse en el siguiente proceso:

  1. Tan pronto como el contenido es renderizado en el servidor, Google indexará la página para mantener el index lo más “fresco” posible.
  2. Si el sitio web usa renderización del lado del cliente (páginas con contenido dinámico, etc), dicho contenido no será indexado en esa primera fase, dado que requiere recursos adicionales.
  3. Por tanto, la renderización de ese contenido será diferida hasta que Google tenga recursos disponibles para procesar dicho contenido. Y ese contenido será indexado más tarde, incluso días después.
  4. Eso implica que algunos detalles pueden perderse. Por tanto, no confíes en que algo será renderizado en el lado del cliente, porque la segunda fase de indexación que lleva a cabo Google en estas páginas, no coteja la etiqueta canonical (entre otros aspectos) Esto implica que no podemos usar soluciones como Google Tag Manager para inyectar dicho contenido.

A su vez, en dicha presentación, Google lanza una nueva propuesta para la indexación de páginas basadas en JavaScript. Un renderizado dinámico que detecte el user-agent de Google y le ofrezca una versión web para ser completamente renderizada (y por tanto indexada) del lado del servidor.

2 thoughts on “Google ya ejecuta JavaScript e indexa su contenido

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *