Google indexe les sites en Flash : un coup d’épée dans l’eau

La nouvelle a fait le tour du web. Google indexe désormais les sites en Flash, ou plutôt le contenu textuel présent dans les fichiers SWF. L’annonce d’Adobe précise que le plus populaire des moteurs de recherche sera bientôt suivi de Yahoo!.

Est-ce l’avènement des sites à interface riche réalisés en Flash / Flex, la fin des techniques hybrides comme celle présentée ici même ? Malheureusement non.

Google précise que son robot est incapable d’indexer les fichiers SWF chargés avec Javascript, or nombre de sites Flash modernes utilisent le script SWF Object qui permet une bonne gestion de l’absence du plugin d’Adobe. Pire le contenu chargé dynamiquement par l’appel de fichiers XML, ce qui est le cas de tous les sites d’une taille respectable (boutiques en ligne, CMS, …), ne sera pas non plus pris en compte directement (les fichiers XML pourront être indexés séparément).

De plus, le format Flash souffre de limitations intrinsèques qui nuisent à la l’extraction de données pertinentes :

  • Alors que les balises sémantiques du HTML (<h1>, <h2>, <strong>, <p>, …) permettent de structurer l’information et de rendre les données intelligible aux programmes informatiques, seul du texte brut peut être extrait des fichiers Flash ce qui nuira fortement à leur positionnement.
  • Sans hacks tel que l’utilisation de SWF Address, il n’est pas possible d’accéder à une “page” précise à l’intérieur d’un fichier Flash. Prenons le cas d’une boutique en ligne réalisée en Flex proposant à la vente quelques milliers d’articles et d’un internaute recherchant un sac bleu. Un fichier Flash se présentant sous la forme d’un bloc à un seul point d’entrée, l’internaute effectuant sa recherche ne pourra accèder qu’à la page d’acceuil du site. Il devra ensuite parcourir l’ensemble des menus et sous-menus pour arriver la fiche du dit sac bleu, perdant ainsi tout l’intérêt d’utiliser un moteur de recherche plutôt qu’un quelquonque annuaire. Mmême l’utilisation de SWF Address ne résoudrait pas ce problème car il utilise Javascript, langage actuellement non interprété par les robots du géant de la recherche comme vu plus haut.

Cette annonce, grand coup marketing pour Adobe, se révèle pourtant relativement désuette. L’indéxation des fichiers Flash par Google est à rapprocher de celui des documents Word ou PDF. Ils ne resteront que des réponses annexes, des résultats complémentaires, et ne risquent pas d’atteindre les premières pages des mots-clefs convoités.

Leave a Reply

  1. Pingback: Indexsys.fr

  2. Bonjour,
    je ne suis pas adepte de flash, j’ai toujours “rechigné” à installer ce type d’application qui ne m’inspire pas !
    Pourquoi ?
    Peut-être parce que je n’y est jamais rien compris !
    Amicalement, Isabelle

  3. Le grand (seul ?) intérêt de Flash se situe selon moi au niveau du design.
    Cette technologie permet de réaliser des sites visuellement impressionnants, beaucoup plus fluides que tout ce qui est faisable en AJAX.
    Pour quelques exemples de sites pour lesquels la technologie Flash est adapté consultés The FWA : http://www.thefwa.com/

  4. Qui sait, peut-être vont-ils mettre au point un algorithme révolutionnaire capable d’analyser le contenu et de différencier les titres…
    Moi je voit bien Google procéder de la même manière dont ils ont toujours fait. Je m’explique: cela ne m’étonnerait pas qu’il définisse de nouvelles règles à suivre pour le référencement des animations flash, du genre placer le titre à tel endroit de tel manière tel qu’ils l’ont fait pour le html, en tout cas nous le sauront dans un futur proche…

    Par contre, totalement d’accord avec le deuxième point de ton article, je ne vois vraiment pas comment ils comptent faire pour accéder à une page précise d’un site en flash… ‘demande à voir !

  5. Qu’Adobe fasse évoluer le format pour qu’il soit plus accessible aux moteurs de recherche, c’est possible et c’est ce que leur collaboration avec Google et Yahoo! laisse présager.
    Mais ce changement, s’il survient, n’interviendra qu’à moyen ou long terme. Dans l’immédiat, la technologie Flash nécessite un traitement particulier pour ne pas pénaliser le référencement des sites qui l’utilise.