« Yahoo ha suspendido oficialmente la herramienta de sugerencia de palabras clave de Overture | Search Illustrated: 5 consejos para optimizar una página de detalles de producto en un sitio de comercio electrónico »
1 Jul, 2008 a las 00:00 por Vannesa Fox
Ahora Google rastrea e incluye en su índice el contenido Flash
Históricamente, los buscadores no han sido capaces de extraer contenidos, tales como texto y enlaces, de los archivos Flash (SWF). Por lo tanto, mucho contenido basado en Flash no era disponible en los resultados de búsqueda. Esta situación ha resultado frustrante para los desarrolladores web, quienes han intentado encontrar alternativas que podrían ayudar a los buscadores en indexar y posicionar sus páginas Flash.
La situación tampoco ha sido ideal para los usuarios de búsqueda, ya que ésta limitación les ha dificultado ver resultados buenos que podrían resolver sus dudas, porque éstos estaban atrapados dentro de archivos Flash.
Según Adobe y Google, todo eso cambia. Google está lanzando lo que llaman “un cambio profundo de algoritmo”, que se potenciará con una tecnología lector de Flash, suministrada por Adobe, que permite “leer” los archivos Flash y extraer texto y enlaces, para mejorar el índice y el posicionamiento. Puede que sea una gran noticia tanto para los propietarios de sitios web como para los usuarios de buscadores.
Abajo vienen más detalles del funcionamiento, y también unas advertencias para los que ven en esto una especie de panacea Flash y piensan que ya no tienen que preocuparse de que sus aplicaciones Flash sean amables con los buscadores.
Ahora Google puede rastrear e incluir en su índice los archivos Flash
Desde hace tiempo Google ha estado trabajando para mejorar el proceso de rastreo e incluir en su índice rich media (como Flash y JavaScript), y de hecho, ya tenía la capacidad de extraer algo de texto y enlaces de los archivos Flash. No obstante, sus métodos no eran perfectos, y me cuentan que la nueva tecnología de Adobe hace que sus algoritmos “tengan menos errores” y permite acceder a contenido en cualquier versión de Flash, en varios idiomas.
Adobe proporciona un reproductor Flash optimizado para buscadores y están colaborando con Google y Yahoo!. Yahoo! todavía no ha implementado la tecnología, aunque ha dicho que
“Yahoo! se compromete a apoyar a las necesidades de los webmasters, con un plan de apoyar la búsqueda de SWF y estamos trabajando con Adobe para determinar la mejor implementación posible.”
Adobe no ha puesto esta tecnología la disposición de Microsoft Live Search, aunque han dicho que
“buscamos formas de hacer la tecnología disponible de manera más general y ayudar a que el contenido SWF sea más fácil de encontrar”.
Adobe no ha hecho ningún comentario sobre el hecho de que Microsoft está desarrollando una tecnología de competencia llamada Silverlight, y si esto ha tenido algo que ver con su decisión de no colaborar con Microsoft Live Search en este primer comunicado.
Un gran paso adelante
Anteriormente, la documentación de ayuda en Google aconsejaba no implementar sitios de Flash solo:
“Por lo general, los buscadores se basan en texto. Esto significa que para rastrear tus contenidos e incluirlos en nuestro índice, deben tener un formato de texto. Esto no significa que no puedas tener imágenes, archivos Flash u otros contenidos tipo rich media en tu sitio; solo quiere decir que cualquier contenido incrustado debe estar disponible también en un formato de texto, de lo contrario, los buscadores no podrán acceder a ello.”
Google ha sugerido utilizar Flash de manera parca o bien emplear un método como Scalable Inman Flash Replacement (sIFR - Inman sustitución Flash escalable) para proporcionar una fuente de HTML que se puede presentar como Flash o no.
Parece que eso ha cambiado. No se ha actualizado la documentación de ayuda, pero hay una entrada en el blog de Google Webmaster que dice ahora Googlebot puede extraer contenido textual y enlaces, para que Google pueda rastrear, indexar y posicionar el sitio web.
Tanto Google como Adobe enfatizaron que esto es una ganancia importante tanto para los propietarios de sitios web como para los usuarios de buscadores. Anotaron que los desarrolladores Flash no tienen que hacer nada en sus aplicaciones para que la tecnología funcione con sus sitios.
Desde luego es una noticia positiva para la web, y también indica que los buscadores, que son el método principal de navegar en Internet, evolucionan más allá del texto y toman en cuenta nuevas tecnologías web.
¿Qué impacto tendrá este cambio en la relevancia de búsqueda? Es difícil saberlo, tendremos que ver los cambios, y Google dice éstos tardan en difundirse. Destacan que los snippets (pedazos de texto), descripciones que aparecen en cada resultado de búsqueda, mejorarán. Antes, era normal que Google no podía extraer ningún tipo de contenido de un archivo Flash, y la descripción de una página Flash aparecía vacía o bien contenía solo el texto disponible en el archivo, por ejemplo el nombre de la versión Flash o la palabra “loading” (cargando).
Aunque el comunicado de prensa de Adobe habla de mejoras “dramáticas” en los resultados de búsqueda y de resultados más relevantes para “millones de RIAs” (aplicaciones rich internet), ni Adobe ni Google podrían facilitarme el número de cuántas páginas encima de lo normal Google podrá rastrear e indexar ahora, o el impacto que tendrá esto en los resultados de búsqueda.
Una vista rápida de como se indexa los archivos SWF actualmente muestra que se puede mejorar y mucho, así que, efectivamente, esto puede ser una gran noticia para search.
Los desarrolladores Flash aún debería dedicar tiempo a SEO
Sin embargo, esta solución no es tan perfecta como puede parecer. Adobe asegura a los desarrolladores que “desarrolladores RIA y los que producen contenido rich media no tendrá que cambiar el contenido futuro para convertirlo en algo que se puede buscar– pueden fiarse de que ahora los usuarios en todo el mundo lo encontrará.” Pero eso no es cierto de todo, sobre todo para páginas Flash que tienen poco texto.
Solo afecta a texto y enlaces
Como dijo Danny Sullivan, el año pasado cuando se empezó a hablar del trabajo que hacía Google en esto, la mayoría del contenido Flash no consiste en palabras. Consiste en imágenes, vídeo, animación y nada de eso saldrá en los nuevos resultados de búsqueda con este avance. Los nuevos algoritmos Flash de Google solo extraen texto y enlaces. Todo lo demás se queda en una caja negra.
Asocia una URL exclusiva con cada contenido único
Adicionalmente, la experiencia del usuario se mejora con una implementación Flash que proporciona una URL única para cada contenido. Algunas implementaciones Flash cargan el texto de forma dinámica mientras el usuario utiliza la aplicación, pero la URL no cambia. En este escenario, ahora Googlebot puede seguir esas interacciones (de manera limitada) y si la URL no cambia, se carga dinámicamente todo el contenido, ya que el progreso de interacciones se asocia con una URL única.
Adobe dice que el reproductor Flash que proporciona a los buscadores
“permite a sus arañas de búsqueda contemplar y navegar dentro de una aplicación SWF activa como si fueran usuarios virtuales. La tecnología del reproductor Flash, optimizada para las arañas de búsqueda, permite atravesar y analizar sintácticamente todos los caminos distintos en una RIA basada en SWF, es parecido a la travesía de múltiples páginas en una aplicación web estándar.”
Esto significa que si el contenido que se carga dinámicamente a la aplicación Flash en la quinta interacción coincide con una consulta de búsqueda, puede que se muestre esa aplicación Flash en los resultados de búsqueda. Pero cuando el usuario hace clic en ese resultado, el contenido no se encontrará en esa página. El usuario tendría que utilizar la aplicación hasta que se cargue ese contenido. Los usuarios pueden sentirse frustrados y abandonar la página. Para que sea positiva la experiencia del usuario y mejore la conversión en búsqueda, los desarrolladores Flash deberían ejercer mucho cuidado, evitando esta situación con la creación de distintas URLs para cada contenido individual. Esta implementación ayuda a que el sitio Flash sea más viral, porque los usuarios pueden mandar un correo electrónico, utilizar Digg, o compartir el contenido fácilmente.
Google admite que esto no es la experiencia ideal para el usuario que busca, pero dice que otros archivos con formatos no-HTML tienen las mismas limitaciones. Cuando un usuario hace clic en un resultado de búsqueda en Google, y el resultado es un archivo PDF, el contenido que coincidía con la consulta de búsqueda igual no está en la primera página de esa PDF, y el usuario tiene que navegar todo el archivo para encontrar el contenido deseado. Google dice que, igual que pone anotaciones en los archivos PDF para advertir a los usuarios que los resultados no son HTML, hacen lo mismo con los archivos Flash, como se ve abajo.
Lo que significa para los SEOs
A menudo el Flash se ha convertido en una fuente de frustración para los SEOs que argumentan que el texto debería aparecer en HTML, con el Flash solo para contenidos sin textos, como ilustraciones vídeo. ¿Ahora los SEOs pueden quitar “repasar implementación Flash” de sus listas de control? Probablemente no. Sin embargo a partir de ahora, será más fácil que los SEOs trabajen con sitios basados en Flash.
Los SEOs deberían tomar en cuenta que estos nuevos algoritmos no consideran metadata ni markup de formatos en el archivo Flash, y por ahora, el cache de Google no mostrará una representación del texto extraído y por lo tanto, los propietarios de sitios web no pueden verificar lo que realmente se ha rastreado simplemente con mirar la copia de cache. Es más, ya que Googlebot no ejecuta la mayoría de JavaScript, Google no rastreará ni indexará Flash ejecutado con JavaScript. Cualquier fuente externa que el archivo Flash carga, se indexará de forma separada, y no como parte del archivo Flash. Como se apuntó anteriormente, todo contenido no-textual se quedará sin rastrear. Este nuevo apoyo Flash vale para todos los idiomas salvo los bidireccionales (hebreo y árabe) y vale para todas las versiones Flash.
Lo que significa para la accesibilidad y la usabilidad
Los desarrolladores Flash deben seguir pensando no solo en si se encuentra sus aplicaciones en buscadores, pero también si son accesibles y utilizables.
Eric Wittman, director de distribución de plataforma y desarrollo del negocio en Adobe, me dijo que se puede construir sitios Flash para la usabilidad y accesibilidad. Comentó que 98% de los ordenadores admiten Flash, aunque tuvo que reconocer que no sabía cuantos habrán instalado bloqueadores de Flash, y no dio números precisos sobre el porcentaje de usuarios de móviles que no no admiten Flash.
Se fijó en que el apoyo para el lector de pantalla ha estado disponible desde la 6ª versión de Flash Player, y que la nueva estructura Flex incluye apoco para la accesibilidad.
A lo largo del Día para Desarrolladores en SMX Advanced, hablamos mucho de hacer las aplicaciones Flash más accesibles y más amables con los buscadores, utilizando el aumento progresivo* y surgieron tanto sFIR como SWFObject como métodos buenos para garantizar esto. Creo que sigue siendo un consejo útil a pesar de este comunicado.
En resumen, esta noticia es positiva tanto para los propietarios de contenidos como para los usuarios de buscadores. Los desarrolladores web empiezan a enfocarse en el diseño de arquitectura de sus sitios para que se les puede encontrar en buscadores, ya que search se ha convertido en unos de los principales canales de adquisición online. Con la evolución de las tecnologías web, es importante que los buscadores evolucionan también, para asegurar la provisión de los resultados más relevantes para sus usuarios. Tengo muchas ganas de ver si este cambio resulte ser importante, aunque los desarrolladores web deberían seguir utilizando prácticas amables con los buscadores cuando desarrollan sitios.
* Nota del traductor: “graceful degradation” en el original, sinónimo de “progressive enhancement” en inglés.




