Stoa :: Ewout ter Haar :: Blog :: Dados na Web

dezembro 13, 2007

default user icon
Postado por Ewout ter Haar

Henry Story do Sun deu uma palestra sobre o trabalho dele no IME terça-feira passada a convite do Prof. Imre. Fiquei feliz de ver alguém ligado à Web moderna na USP.

[Atualização 19/12: Veja também o relato do Henry]

Blogs Corporativos

Já conheci Henry pelo seu envolvimento com Atom e pelo seu blog. A Sun é um lugar onde blogs fazem parte da cultura e estratégia de comunição empresarial. Tem da ordem de 4000 blogs e o mais popular é do próprio CEO da empresa. É um exemplo muito bem implementado de como tecnologias modernas de comunicação podem funcionar para instituições grandes. Não é muito surpreendente: a Sun é uma empresa de internet e contrataram o Tim Bray, um dos inventores de XML, para ajudar com a implementação.

Perguntei a Henry se o investimento em tempo e energia de escrever um blog valia a pena. Respondeu que sim, que é uma maneira de não se repetir. Comparou escrever blogs com o seu envolvimento com uma comunidade de código aberto que levou diretamente ao seu atual emprego no Sun. Deixe isso servir de lição, meninos e meninas: o seu blog aqui pode servir como vitrine dos seus talentos e te conseguir um emprego bom Rindo!

A Web Semântica

Henry começou dar uma introdução rápido à Web Semântica. Ainda vou escrever um post mais detalhado sobre isto, mas resumidamente, a Web Semântica quer fazer para dados o que a Web fez para documentos. A Web de hoje em grande parte consiste de documentos interligados entre se com links. É informação organizada de forma não ou semi-estruturado. Documentos são fáceis de ler e produzir por humanos, com os seus cérebros afinados por centenas de milhares de anos de evolução para estruturar informação serializado. Mas para computadores e algoritmos é bem mais complicado extrair informação úteis de documentos.

Por outro lado, informação estruturada tem um tipo ou categoria para cada parcela de informação, tem esquemas fixos e é muito mais fácil de processar por algoritmos. Geralmente é armazenada em bases de dados. Mas os bases de dados não falam entre se, São o equivalente a documentos guardados e acessíveis somente nos computadores pessoais das pessoas. Armazenando dados de forma isolado assim, perde-se todos os efeito de rede que fazem informação compartilhada tão útil. A Web Semântica quer fornecer um espaço de informação estruturado e distribuído que possibilita a interligação de dados diversos.

Aplicações e Usos da Web Semântica

Mas tem um problema de galinha e ovo: sem aplicações não tem incentivo para as pessoas disponibilizar os seus dados de forma compartilhável e re-usável, mas sem dados não tem aplicações legal. A solução é construir aplicativos que podem ser úteis neste instante. Henry mostrou Beatnik, um gerenciador de contatos que pega informação estruturado sobre os seus contatos na rede. Seria uma parte do software integrando o "desktop semântico" (o interface de usuário não é o Navegador)

screenshot de beatnikUma sugestão do público foi tentar fazer uma aplicação que analise artigos científicos e faz ligações do conteúdo, referências, co-autores etc. De fato, existem muitas outras tentativas de fazer aplicações tão úteis que as pessoas são motivados para colocar os seus dados no Web. Por exemplo, Henry mostrou o Tabulator, um extensão de FireFox que quer facilitar a navegação da Web de Dados. Instalei a versao alpha mas não funcionou direito para mim. Pelo menos ao navegar o dbpedia o meu FireFox trava imediatamente.

Uma tentativa mais interessante para mim são as iniciativas do grupo Simile. Segundo Henry eles dão muito ênfase em aplicativos que rodam no navegador, mas acho que isto justamente é uma vantagem. Exhibit é uma aplicação interessante por exemplo. Da mesma forma que pessoas tendem a gastrar muita energia em deixar os seus documentos bonitos, Exhibit tente seduzir as pessoas disponibilizar os seus dados dando ferramentas que possibilitam uma bonita apresentação e uma melhor interatividade. Fiz uma apresentação de alguns dados relacionados com o orçamento da USP. Não é muito bonito porque não gastei tempo em enfeitar. Mas estes dados do orçamento da USP são muito melhor apresentados assim do que o formato original, um pdf opaco difícil de indexar e quase impossível de usar em outros contextos.

Palavras-chave: Exhibit, Henry Story, Imre, Simile, Tabulator, web semântica

Esta mensagem está sob a licença CreativeCommons Atribuição.

Postado por Ewout ter Haar | 5 usuários votaram. 5 votos

Comentários

  1. henry. escreveu:

    ( After having read this with http://translate.google.com )

    Concerning Tabulator, did you make sure to configure Firefox as specified on the right hand side of the page? You need to do this in order to allow the javascript to be able to fetch information from other web sites. Not sure what the security risks are, so it may be wise to disable that again after having played with it.

    Also you may want to start with a smaller file such as http://bblfish.net/people/henry/card .

    default user iconhenry. ‒ sexta, 14 dezembro 2007, 08:51 BRST # Link |

  2. Ewout ter Haar escreveu:

    Hi Henry, good to see that you found me. Actually, I tried the Firefox extension implementation of Tabulator. You are right, it works better with smaller files. With this page, http://dbpedia.org/data/Amsterdam?output=xml the script chokes.

    But it certainly deserves attention. Another blog post idea I will put in the waiting list. 

    Ewout ter HaarEwout ter Haar ‒ sexta, 14 dezembro 2007, 10:07 BRST # Link |

  3. Tom escreveu:

    Perguntei a Henry se o investimento em tempo e energia de escrever um blog valia a pena. Respondeu que sim, que é uma maneira de não se repetir. Comparou escrever blogs com o seu envolvimento com uma comunidade de código aberto que levou diretamente ao seu atual emprego no Sun. Deixe isso servir de lição, meninos e meninas: o seu blog aqui pode servir como vitrine dos seus talentos e te conseguir um emprego bom!

    Ewout, divulgado. Mencionei também o caso do Scott Aaronson, que você e o Edgar comentaram. ;-)

    default user iconTom ‒ sexta, 14 dezembro 2007, 18:45 BRST # Link |

  4. Tom escreveu:

    Aliás, muito interessante o formato da página principal dos blogs da Sun. Poderíamos pegar algumas idéias, como o das caixas feitas em CSS e a seção de blogs populares. Uso mais o Spotplex para acompanhar a estatística de acesso ao meu blog. Acho que isso poderia gerar um saudável competição no Stoa. Já tinha sugerido algo nesse sentido das caixas para o Maurício antes mesmo de ver essa página e ele gostou da idéia. :-)

    default user iconTom ‒ sexta, 14 dezembro 2007, 18:56 BRST # Link |

  5. Virgínia virginia. escreveu:

    Parabéns pelo pouco que vi você entende e muito sobre internet..legal gosto de aprender sobre isso...gostaria de lhe perguntar já que entende tanto acho que você é uma das  únicas pessoas que conseguiram responder....

    HÁ FORMAS DE ENCONTRAR DADO SPESSOAIS SOBRE PESSOAS NA INTERNET OU VOCÊ TEM QUE SE TORNAR UM HACKER PRA ISSO??? ME RESPONDA O MAIS RÁPIDO POSSIVEL POR FAVOR NO E-MAIL!!!!

    Boa Noite e obrigada!!! excelente fds!!!

    default user iconVirgínia virginia. ‒ quinta, 17 janeiro 2008, 23:51 BRST # Link |

Você deve entrar no sistema para escrever um comentário.

Termo de Responsabilidade

Todo o conteúdo desta página é de inteira responsabilidade do usuário. O Stoa, assim como a Universidade de São Paulo, não necessariamente corroboram as opiniões aqui contidas.