Arquivo

Arquivo de Julho, 2008

O Google realmente indexa conteúdo em aplicações Flex?

19, Julho, 2008 yarcub Nenhum comentário

O desafio foi lançado (no início do mês), criar uma aplicação simples em Flex que carregue um texto dinamicamente contendo uma frase específica e esperar que o Google a indexe.

A ideia de um concurso veio do Platform Evangelist, Ryan Stewart, e todas as participações têm de seguir as seguintes regras:

  • Utilizar a Flex Framework
  • A frase tem de ser carregada dinamicamente, ou seja, não pode existir aquando da compilação.
  • O carregamento tem de ser feito apenas se ocorrer interacção (e.g. click num botão).
  • O resultado dado pelo Google (se tal acontecer) deverá apontar directamente para o estado onde essa frase é carregada (deeplinking).
  • Código fonte disponível
  • Várias participações permitidas

(+Detalhes)

O que realmente interessa aqui é saber se o Google está a indexar conteúdos percorrendo uma aplicação como pseudo-utilizador e o que se nota é que ao colocar a variável concurso se desvirtua o concurso.
Eu percebo que o Ryan apenas tenha colocado a hipótese de prémios para tentar que o máximo de programadores tentassem as mais variadas maneiras de contruir a aplicação mas o que se viu é que sem regras que foquem o objectivo final isso é difícl. Por exemplo:

  • Apenas permitir a frase no conteúdo carregado para o Flash Player.
    O que se nota é que a maior parte do conteúdo indexado é a sobre as aplicações e não as aplicações em si.
  • Outro caso, um dos participantes comprou o domínio e nomeou o swf com a mesma palavra e é isso que faz aparecer a sua entrada em 1º, mesmo que o conteúdo não esteja a ser indexado (até hoje,19Julho, não estava).

Finalmente a minha participação:
Esta tentativa baseia-se em 3 pressupostos que penso serem os que garantem melhores hipóteses de o Google realmente indexar o conteúdo, lembro que são apenas palpites e que aparte do Google/Adobe ninguém sabe o que se passa.

  • Display List: Cada vez que o Flash Player faz o render o playerbot percorre a display list e quanto encontra objectos de descendam/contenham do/o TextField, indexa o texto. Se isto acontecer, a probabilidade de os objectos serem encontrados aumenta com a proximidade à raiz (Stage) da display list.
  • HTTP: O playerbot deve monotorizar todos os requests feitos pelo Flash Player, se o pedido feito for um ficheiro ASCII (XML) é mais fácil ser indexado do que um formato binário (AMF Remoting).
  • Formatação: É provável que o Google de relevância à formatação do texto, como em HTML, por isso a palavra chave está formatada com uma tag H1 definida em CSS.

Sem mais demoras e com código fonte disponível (Right-Click > View Source):
http://blog.nunorosa.com/wp-content/uploads/exemplos/Flex/SEO/

PS:Estou a fazer o tracking dos clicks através do Google Analytics mas penso que este não regista a passagem de bots. Alguém tem uma dica de como fazer isso?

Novidades na indexação de SWFs.

2, Julho, 2008 yarcub Nenhum comentário

A Adobe anunciou que tem estado a trabalhar com a Google e Yahoo! para melhorar a indexação de conteúdos contextualizados dentro de ficheiros SWF.

Esta nova tecnologia consiste num “Flash Player” modificado que permite aos bots dos motores de pesquisa interagirem com uma aplicação flash como se de um utilizador se tratasse activando os vários estados da aplicação e indexar o conteúdo carregado dinâmicamente do exterior do Flash Player. É uma signigicativa diferença do que acontecia até aqui em que apenas o texto estático presente na aplicação aquando da compilação era indexado.

Mas não se pense que basta compilar a aplicação/website colocar online e esperar que os resultados apareçam, ainda assim é necessário ajudar o conteúdo a ficar mais acessível fornecendo por exemplo pontos de entrada para determinados estados (deeplinking).

Exemplo: o google indexa os contactos e localização num certo estado do website. Se esse estado não tiver um url que permita aceder directamente, quando o utilizador carregar no resultado da pesquisa o website vai abrir no seu estado inicial e não onde está a informação que se queria.

Dúvidas

Qual a melhor forma de embeber um SWF no HTML?
Hoje em dia o SWFObject é o mais consensual e está previsto ser incluído no Dreamweaver/Flash CS4. Mas lendo o blog do Google sobre o assunto é esclarecido que o bot não executa alguns tipos de javascript o que pode fazer com que este nem se aperceba que existe um SWF para indexar.

E se o conteúdo dinâmico forem outros SWF’s?
Esta parece ser quanto a mim a grande limitação desta tecnologia, novamente recorrendo ao anúncio do Google, todos os ficheiros carregados externamente pelo SWF que está a ser indexado não vão ser tratado como parte dele mas sim indexados separadamente (será do algoritmo utilizado pelo bot ou do próprio FP?).
Isto é um grande problema porque na maioria dos websites desenvolvidos no Flash utilizam como workflow vários ficheiros SWF para separar secções distintas sendo o principal apenas um contentor com a interface. Voltando ao exemplo anterior o resultado da pesquisa iria direccionar o utilizador para contacto.swf em vez de um link para o endereço principal com deeplinking.

Conclusão

Por enquanto as informações disponíveis ainda não indicam claramente aquilo que o programador pode fazer para obter o melhor partido destas novas alterações, as experiências da comunidade podem ser uma boa ajuda, no entanto as antigas técnicas continuam válidas (deeplinking, sitemaps, etc).

Fontes

Adobe  – Press Release

Adobe – SWF searchability FAQ

Google – Webmaster Central Blog