Stoa :: Ewout ter Haar :: Blog :: web

Maio 11, 2010

default user icon
Postado por Ewout ter Haar

[Fiz uma apresentação para um grupo de trabalho que está pensando sobre Design Instrucional no contexto de projetos de Educação apoiado pelas tecnologias novas de informação e de comunicação.]

Intro: A Web Moderna é fundamentalmente diferente de mídia de massa. Permite consumidores passivos se tornarem produtores ativos. As novas tecnologias de rede e a Web participativa em particular têm aplicacões óbvias ao desenho dos nossos ambientes educacionais. Vou mostrar alguns resultados, acertos e erros do projeto Stoa e mostrar algumas possibilidades de ferramentas da Web para a construcão do ambiente online do curso de licenciatura em ciências. 

Três teorias (melhor: concepcões) de aprendizagem ou pedogagias e as suas consequências para o design de ambientes educacionais. 

  1. "Behavioural" / Cognitivo.  É um modelo onde o instructor e o conteúdo está no centro das atencões, transferindo conteúdo / conhecimento. "Content is King". 
  2. Construtivismo. Desde Dewey, Freire, etc. há críticas no modelo "transferência de informacão". Conhecimento é construído, em grupos, e é altamente dependente do contexto social. Uma metodologia alternativa ou complementar reconhece que aprendemos fazendo. As metodologias pedagógicas são mais centradas no aluno ou pequenos grupos. Exemplo: Problem based learning. 
  3. Connectivismo. Inspirado em "Redes". A característica de redes é que não tem centro: não existe uma única entidade que controla o andamento das coisas. 

Experiências com Stoa

  - Proposta vs usos reais (mero espaco de arquivos e blog, mas se é só isso, porque não usar plataformas genéricos: uso de espaco institucional tem que ter algum valor agregado)

  - Número de cadastros, aumento enorme quando Docentes comecam usar Moodle

  - Tensão entre "plataforma aberta" e hiearquias tradicionais da Universidade. 

Proposta concreta

 - Moodle. Mais: usar Buddypress para dar "um espaco na Web" para alunos, tutores e docentes. Ferramentas de criacão de grupos (Fóruns). Portal que agrega atividades. Outras ferramentas: Wiki, Web-Conferência (DimDim), email e lista de email, Chat. Ferramentas "Web2.0" de terceiros.  

 - Precisamos planejar / pensar sobre

  + como incentivar o uso destes espacos (usar tutores e docentes)

  + como evitar que os participantes se sentam perdidas no espaco virtual: organizacão vs autonomia

  + até onde deixar "aberto" as contribuicões 

  + é mesmo uma boa ideia mesclar formal - informal e pessoal - institucional?

  + qual métricas / indicadores acompanhar?

  + qual servicos "de terceiros" podemos usar? Google Apps, outros servicos Web2.0. 

Referências:

 - "Lost in social space: Information retrieval issues in Web 1.5" http://journals.tdl.org/jodi/article/viewArticle/443/280 

 - "The Theory and Practice of Online Learning, second edition" http://www.aupress.ca/index.php/books/120146

Palavras-chave: educação, TIC, web, web social

Esta mensagem está sob a licença CreativeCommons Atribuição.

Postado por Ewout ter Haar | 0 comentário

default user icon
Postado por Ewout ter Haar

Um jornalista me pediu opiniões sobre "o uso da redes sociais na internet". Isto não acontece muito mas dar opiniões e palpites todo mundo gosta. Veja o que respondi

2010/5/11 Gladson Angeli Donadia :

>
> Qual é a principal função das redes sociais na internet atualmente? São
> voltadas para o lazer ou usada também como ferramenta de trabalho?

Primeiro, gostaria ampliar e generalizar o conceito de "rede social"
para incluir tecnologia da Web que permite indivíduos *participar* e
*contribuir* ao vez de ser meros  consumidores de conteúdo. Desde o
seu início (anos 70 e 80) a Internet possibilitou estas novas
tecnologias "participativas" (pense usenet, ICQ, IRC, email, etc.) mas
foi somente com a Web nos anos 90 e 00 o seu uso ficou realmente
massificado (pense blogs, sites de compartilhamento (de fotos e
vídeos) e também redes sociais como Orkut, Facebook e Twitter).

Voltando a pergunta: acredito que estas ferramentas de expressão
individual inicialmente eram ignorados pelas corporações e
instituições tradicionais (como empresas, universidades e governos).
Assim, inovações na Web como weblogs, fóruns e redes sociais eram
inicialmente voltados para atividades informais. Mas logo as
instituições se deram conta do potencial das novas ferramentas e agora
estão tentando usá-las para os seus fins.

No caso de Educação,  as novas tecnologias de rede e a Web
participativa em particular têm aplicações *óbvias* ao desenho dos
nossos ambientes educacionais. Desde a massificação e universalização
da Educação há críticas (Dewey, Paulo Freire, etc.) do modelo
"transferência de informacão" onde o alunos assiste passivamente aulas
e procure-se criar modelos pedagógicas que permitem e incentivam
posturas mais ativas por parte dos alunos. Tecnologia de redes socais
se encaixa muito bem nesta busca por modelos pedagógicas novas.

> O senhor acredita que as redes na internet podem substituir as redes de
> contatos fora do mundo virtual?

Não gosto muito da expressão "mundo virtual", porque dá a impressão
que tecnologia de rede, a Internet ou a Web seria de alguma forma
"irreal". Na verdade, são meios de comunicação e plataformas de
expressão, tão real quanto qualquer outro meio de comunicação como
telefone ou plataforma de expressão como livros.

Então, acredito que seria melhor perguntar de que forma as novas
tecnologias de rede podem contribuir para os nossos objetivos na vida.
Certamente acredito que eles tem muito a contribuir.

> O senhor acredita que o número de redes sociais tende a crescer?

O uso das novas tecnologias de rede vai crescer cada vez mais, sem
dúvida. Uma pergunta interessante é se vai ter *concentração* de
mercado, da mesma maneira que alguns grandes conglomerados de mídia
detém o controle de uma fração cada vez maior do mercado de
comunicações. Certamente há o perigo que grandes empresas como Google
e Facebook monopolizam cada vez mais a Web, mas sou otimista que as
forças de-centralizadores conseguem manter um equilíbrio neste
sentido.

> O senhor acredita que seja vantajoso aderir a várias redes sociais, ou o
> internauta deve focar em uma que seja voltada para o público de específico
> de sua área de atuação?

Acrdito que é perfeitamente natural criar vários "personagens" na rede
e na Web e tentar manter eles separados. Poderia criar uma identidade
profissional por exemplo e manter um blog sobre assuntos
profissionais, criar um perfil na linkedin ou na rede social da sua
empresa ou escola, etc. E ao mesmo criar um outro blog, outros perfis
em outros redes para manter uma personagem informal.

Me parece importante ter este flexibilidade.

> O senhor tem alguma dica de atitude correta e de comportamento inadequado
> dentro de uma rede social na internet?

http://pt.wikipedia.org/wiki/Netiqueta e obedecer as regras de boa
educação que aprendeu na sua casa e sua escola.

> De que forma o uso das redes sociais na internet podem ser prejudiciais?
>

Da mesma forma que outras interações sociais podem ser prejudiciais ou
beneficiais. As características de pessoas não mudam porque usam uma
determinada tecnologia de comunicação. Agora, é verdade que pessoas
tendem a ser menos educadas quando a comunicação é feito a distância,
parece que se esqueçam que tem uma pessoa real no outro lado. Aí pode
ter um papel para a escola: devem ensinar e socializar as crianças
para lidar bem com estas novas tecnologias.

> Gladson Angeli
> Repórter
> RPC – Gazeta do Povo
WWW.RPC.COM.BR
Espero que ajudou, entre em contato se precisar algo a mais, Atenciosamente, Ewout ter Haar - CEPA - IFUSP F. 30916696

Palavras-chave: educação, redes sociais, web

Postado por Ewout ter Haar | 1 usuário votou. 1 voto | 0 comentário

Abril 01, 2010

default user icon
Postado por Ewout ter Haar

Privacidade e Autenticidade da Comunicação

Um professor que coloca as notas no Júpiter ou alguém que usa o webmail da USP se identificam com as suas senhas ao servidor remoto. É importante manter estas senhas secretas, por razões óbivas. Mas além das limitações do cérebro humano, que não consegue lembrar senhas complexas, tem dois outros problemas.

Primeiro: o usuário entre a senha no seu navegador (Internet Explores, FireFox, Chrome, etc.), que então manda para o servidor remoto. Qualquer um que consegue interceptar a comunicação entre o navegador e os servidores na USP pode capturar estas senhas. E não é difícil interceptar tráfego na rede. 

Segundo: como o professor ou usuário do webmail.usp.br (por exemplo) sabem que de fato estão falando com o servidor certo? Podem estar sendo enganado por um esquema de phishing.

A solução para ambas os problemas é criptografia, que consegue assegurar a privacidade, a integridade da comunicação e da autenticidade da identidade de quem está no outro lado do canal de comunicação. Se ambos os lados, o navegador e o servidor remoto, compartilham um segredo (uma senha ou chave secreto), podem construir um canal seguro de comunicação.

 

[MAS! Como falei no post anterior, encriptar sem autenticar não tem valor. Se você não sabe com quem está se comunicando, é melhor nem tentar encriptar as suas mensagens porque a sua segurança é ilusório.]

A pergunta é: como distribuir estas novas senhas/chaves secretas? Não é viável para todos os usuários do webmail.usp.br ir fisicamente no CCE para trocar um segredo. É um problema do tipo ovo e galinha: é preciso compartilhar um segredo antes de comunicação, para que o usuário possa usar a sua senha de identificação de maneira segura, mas como é possível mandar um segredo sobre um canal não-seguro?

Criptografia de chaves públicas

Criptografia de chaves públicas (ou assimétrica) parece resolver esta questão. Por incrível que pareça, é possível estabelecer um canal seguro de comunicação com alguém só sabendo um número, que pode ser público (!). Pode encriptar a sua mensagem com este número público e somente o outro lado (o dono de um número secreto correspondendo a o número público) pode decriptar. Por exemplo, se te dou este número

30 81 89 02 81 81 00 BD 0D D6 B5 20 8A 6C A2 40
E7 1C 1E 31 26 C9 97 69 B3 A7 4B FD 8E DB CE 38
79 51 F9 19 67 7B 6F D6 D5 54 6B DF 4E E0 2F 4B
A4 67 14 1B 85 A3 34 18 E5 C2 28 FF 74 7E 5B 82
6D A7 7C 91 4C EF C1 18 99 70 FF 57 AD 0B CF 6D
96 26 C2 3E 06 F0 B6 11 0E 04 9A 0E 65 FC 51 5B
7F DE 8C 20 56 09 3E 2F 1E 6E 44 56 11 33 C5 40
BE 25 9D A7 FD CE F7 17 10 DD 84 AB F5 D6 03 16
41 FA 44 86 7C DE 99 02 03 01 00 01

você pode se comunicar de forma segura com o servidor por trás do stoa.usp.br. Só o servidor do Stoa vai poder entender o que está mandando. Resolve as nossas problemas?

Não! Como você sabe que de fato este número pertence ou está associado a o domínio stoa.usp.br? Novamente, há o problema do ovo e a galinha: um impostor podia muito bem apresentar uma chave pública qualquer a um navegador desavisado. Só porque eu falei que este é a chave pública do domínio stoa.usp.br não quer dizer nada! (Como você sabe que eu sou quem estou dizendo, estamos falando de comunicação a distância).

É preciso um mecanismo que associa chaves públicas com domínios como o stoa.usp.br (ou, em geral, com nomes ou alguma outra forma de identificação). 

Certificados

Public key infrastructure seria uma solução. Neste sistema, "Autoridades Certificadores" (CA) em que todos confiam "assinam" um certificado, dizendo basicamente que esta chave pública de fato pertence a este domínio. Se visitar um site usando https (note o "s" de segura), o seu navegador e o servidor fazem uma pequena dança.

O servidor diz, "este é a minha chave pública, pode usar para encriptar (por exemplo) a sua senha". O navegador diz "ah é? como sei que é você?". O servidor mostra o seu certificado, "está vendo? este certificado diz que esta chave público pertence ao domínio "exemplo.com". O navegador pensa "hmmpf, qualquer um pode fazer um certificado fake". Mas o navegador pode checar a autenticidade do certificado pela assinatura da entidade em que todos confiam (Thawte, na imagem em baixo).

Se tudo der certo, cores tranquilizantes como azul ou verde e ícones de cadeados aparecem na barra de endereços do seu navegador.

Repare um problema: qual são as entidades que todos confiam? O governo? Uma empresa nos EUA? É o ovo e a galinha de novo! Mas aí entram os vendedores / fornecedores de navegadores e sistemas operacionais: eles dizem efetivamente qual "Autoridades Certificadores" são confiáveis. Se o chamado "certificado raiz" do CA que assinou o certificado do stoa.usp.brestá instalado no seu navegador, e

Em Windows, é o Microsoft que determina que é ou não é confiável. No FireFox, é a fundação Mozilla. [Veja este post do Ed Felten para alguns problemas deste modelo.] 

Seja como for, é esta a tecnologia que temos. Mas o que acontece se o site apresenta um certificado que não é assinado por uma entidade aprovado pelos fabricantes de navegadores? Veja o que o meu navegador faz quando um site me apresenta um certificado que não é assinado por uma entidade em que confia:

De fato, é o interface de usuário aterrorizante é correto, porque um certificado assinado por uma entidade desconhecida é indistinguível de um ataque "Man in the Middle", onde o atacante intercepta e de-codifica todo tráfego. Novamente, sem saber com quem está falando, encriptar o tráfego é completamente inútil.

Certificados auto-assinados

Na minha opinião, certificados que não são assinados por CAs já pre-instalados nos navegadores de usuários comuns, são piores do que inúteis. Existe, em princípio, a possibilidade de instalar o certificado raiz de um CA qualquer no seu navegador. Mas usuários comuns não conseguem fazer isto e de qualquer maneira, como este certificado raiz vai chegar neles de forma segura. 

Se usar certificados auto-assinados (ou atrelados a CAs não-instalados por padrão em IE ou FF) você na verdade está treinando os seu usuários a abrir exceções e não prestar mais atenção nos ícones de cadeia, etc. 

A única situação onde faz sentido usar certificados assinados é onde o administrador controla todos os computadores e navegadores que os seus usuários vão usar. Isto faz sentido num ambiente corporativo. Mas para serviços, "de consumidor", voltado para o público, é essencial que o certificado já está instalado. 

Porque na USP não se usa TLS?

Bom, alguns sites usam. Os sistemas Júpiter ou MarteWeb, do DI, usam. Mas sites importantes como o webmail.usp.br ou os webmails das unidades não usam. [O webmail da IME use um certificado auto-assinado].

Ao meu ver, a razão é que certificados são difíceis de comprar se não tiver cartão de crédito internacional, inviabilizando o uso em projetos pequenas. [Recentemente fiquei sabendo que talvez não é tão difícil: parece que pode comprar via a imprensa oficial].

Iniciei uma conversa na lista de sysadmins da USP que vou resumir num outro post.

Porque o Stoa não usa TLS?

Na verdade, usamos o ano passado, com um certificado que comprei com o meu próprio dinheiro. Agora o CCE gentilmente comprou certificados do Thawte para os domínios stoa.usp.br e moodle.usp.br. Vou configurar o Stoa em breve para que pelo menos as senhas trafegam seguramente. 

Palavras-chave: criptografia, segurança, senhas, ssl, sysadmin, tls, web

Esta mensagem está sob a licença CreativeCommons Atribuição.

Postado por Ewout ter Haar | 3 comentários

Março 14, 2010

default user icon
Postado por Ewout ter Haar

Redes sociais na Web são objetos interessantes de estudo, na interface entre sociologia e ciência de computação. A primeira coisa que vem à mente é estudar as propriedades estruturais: quem está ligado com quem? Veja um exemplo do crescimento do Stoa, por exemplo

Mas é claro que na realidade as ligações entre pessoas não sáo binários, sim ou não. Algumas ligações são mais fracas do que outros. Granovetter ("The Strength of Weak Ties", American Journal of Sociology, Vol. 78, Issue 6, May 1973, pp. 1360-1380.) foi um dos primeiros de conceituar ligações fracos e fortes entre pessoas (mostrando que para achar um novo emprego era importante ter conexões sociais "fracas" porque via estas conexões é possível  achar oportunidades mais diversas.)

Embaixo incorporei uma palestra interessante de Karrie Karahalios que relatou os resultados de trabalho que fez com Erich Gilbert quantificando o grau de intensidade das conexões entre pessoas no Facebook. Na apresentação e no paper é mostrado como um modelo simples, usando dados como número de palavras trocados em mensagens, distância geográfica, número de vezes que aparece em fotos, número de contatos mútuos, etc. etc. pode prever com quase 90% de precisão a intensidade da conexão (como relatado numa entrevista feito em laboratório). 

Não está no paper (que é do início de 2009),  mas fizeram algo muito mais interessante: tendo o modelo em mãos, transferiram o para Twitter e aplicaram nos contatos lá. O resultado é We Meddle, um serviço que tente agrupar os seus contatos no Twitter baseado na suposta intensidade da conexão. 

E funciona até razoavelmente bem! Primeiro, o programa agrupa os seus contatos em grupos: 

(pode fazer ajustes manuais). Mas o interessante mesmo é o cliente de Twitter que fizeram. Este cliente mostre os Tweets dos seus contatos maior ou menos baseado na intensidade da conexão: pode mostrar sobretudo Tweets das suas conexões mais próximos, por exemplo. 

É claro que é só um começo, mas achei muito interessante a ideia de um cliente Twitter (ou outra plataforma de streaming) que faz mais do que simplesmente mostrar tudo em ordem de chegada. De fato, há um monte de coisas legais que pode ser feito com as informações agora disponível da Web Social.

Fique com a apresentação, vale a pena.

Palavras-chave: conexões, web, web social

Esta mensagem está sob a licença CreativeCommons Atribuição.

Postado por Ewout ter Haar | 1 usuário votou. 1 voto | 0 comentário

Março 13, 2010

default user icon
Postado por Ewout ter Haar

Para fazer desenvolvimento de software é preciso usar uma plataforma. Antigamente, só tinha plataformas proprietárias, controladas por uma única entidade, como por exemplo Microsoft ou IBM. Este tipo de software roda no seu desktop (ou, no caso de computação móvel, no seu handset), usando as bibliotecas fornecidos pelo sistema operacional. 

Recentemente ficou viável fazer aplicativos "da Web". Um dos exemplos mais impressionantes, para a época, era gmail, que mostrou que aplicativos da Web podiam competir em pé de igualdade com aplicativos "nativos" do ponto de vista do usuário.

Para o usuário, o que importa é somente funcionalidade. Mas para desenvolvedores e do ponto de vista de diversidade e "generatividade" o que importa é quem controla a plataforma. Nenhuma única entidade ou organização controla a Web. Por bem ou por mal, é um conjunto de acordos entre fornecedores de navegadores, desenvolvedores Web, fornecedores de servidores Web, provedores de serviço de internet, etc. etc. 

E isto leva a uma baixa barreira de entrada de novas idéias (ninguém precisa pedir permissão para começar implementar uma nova idéia) e assim uma grande quantidade de inovação. Por outro lado, levar a própria plataforma para frente é mais difícil, justamente por não ser controlado por uma única entidade. 

Estamos numa fase de proliferação de plataformas. O domínio de Windows acabou. Também, a distinção clara entre aplicativos no desktop e aplicativos da Web na verdade não é tão claro: Adobe AIR por exemplo é um espécie de intermediário, um chamada plataforma para fazer "Rich Internet Apllications", aplicativos que rodam no desktop, mas ao mesmo tempo desenvolvedores podem usar técnologia da Web (css, javascript). 

Supostamente, para aplicativos nativos ou do tipo Adobe AIR a experiência do usuário é melhor, porque podem usar as funcionalidades mais avançadas da plataforma. Veja então a minha surpresa com a minha experiência de usuário quando instalei TweetDeck, um cliente para Twitter escrito com AIR. A instalação era tranquila (embora que sempre fico nervoso ter que dar acesso ao meu computador, aplicativos Web são muito mais seguros neste sentido). Mas olha o que acontece quando roda o programa pela primeira vez:

 Notem:

 

  1. um diálogo modal avisando que o aplicativo está fazendo uma conexão com servidor não confiável  (até olhei o certificado, porque acho que entendo de certificados e criptografia na internet, mas não tinha nenhuma informação que podia me ajudar tomar uma decisão racional).
  2. um diálogo de atualização da própria plataforma
  3. um tweet, solto no meio da tela
  4. um diálogo de introdução do aplicativo
  5. no fundo, mais um monte de ruído visual
Dizem que plataformas proprietários fazem interfaces de usuários melhores, mas obviamente não é verdade. Na Web, as interfaces são mais simples, mas razoavelmente bem padronizadas (e assim viram "intuitivo", por hábito). 

Não gosto de AIR. Para desenvolvedores, não acredito que vale a pena correr o risco de ficar dependendo de uma única controladora, no caso Adobe, que pode de repente tirar o tapete. Para usuários, não vale a pena se submeter aos idiosincracias de mais uma plataforma. A Web faz tudo que precisa e de forma muito melhor e segura.

Próximo episódio: porque não deveriam desenvolver para Apple. 

 

 

Palavras-chave: Adobe AIR, AIR, desenvolvimento, plataformas, software, web

Esta mensagem está sob a licença CreativeCommons Atribuição.

Postado por Ewout ter Haar | 0 comentário

Novembro 22, 2008

default user icon
Postado por Ewout ter Haar

Segunda-feira Everton e eu apresentamos o Stoa a um público de cientistas de informação no CIPECC de 2008. Veja a minha apresentação:

Stoa: A Web Social na USP
View SlideShare presentation or Upload your own. (tags: sns stoa)

Parte 1: Digitalização e Abundância de Informação

Nesta primeira parte quero mostrar como a digitalização de mídia resulta numa abundância de informação e que precisamos criar novos mecanismos para achar conteúdo relevante. Afirmo que da mesma maneira que Google usou a Web como plataforma para rankear documentos, vamos ter que criar em cima da Web convencional uma nova plataforma, a Web Social, que por sua vez pode ser usado para criar estes novos mecanismos. 

Estamos no equivalente do incunábulo  da era digital. Para cada transição tecnológica tem  um período onde se busca como melhor realizar as novas possibilidades desta tecnologia.   A invenção da página (que possibilita referenciar um trecho no meio de um texto) no século 3 permitiu Orígenes fazer análises críticos de texto. A invenção da imprensa permitiu Cervantes inventar a novela (quando livros não são mais objetos únicos pode tratar de assuntos fictícios e leves).

Assim, a digitalização de mídia requer repensar modelos de negócios baseados em direitos autorais (porque informação digital intrinsicamente e naturalmente tem custo zero para redistribuir). Precisamos repensar a classificação e organização de Informação porque em forma digital não ocupa espaço e podemos experimentar com novas maneiras de organização como folksonomies. 

Mas a mudança mais revolucionário é como mídia digital facilitou a criação de novos recursos. Na Web em particular  é extremamente fácil criar um novo post, subir uma nova foto num site de compartilhamento de fotos, etc. etc. Para ter uma idéia: são subidas 60 fotos por segundo no flickr.com e nos últimos 6 meses foram colocados o mesmo número de horas de vídeo que nos últimos 40 anos pelas redes de televisão tradicionais.

Como lidar desta abundância de informação? A solução deve envolver a Web Social (ver próxima seção) que permite usar a sua rede de contatos para funcionar como filtro e para fazer recomendações. A analogia é com Google que usa o número de links apontando para um determinado documento  para avaliar a sua "relevância". (Na verdade, links a partir de documentos com relevância alta vão conferir por sua vez relevância alta). Em comparação com Altavista, que somente analisava o conteúdo dos documentos esta maneira de buscar documentos relevantes era muito mais eficaz.

Note que Google usa a Web (no caso, hipertexto) como plataforma em cima de qual é construído uma aplicação inovadora. Na segunda parte analisaremos melhor como isto é possível.

Recomendações como as do Amazon ou Netflix em parte são baseado na similaridade do conteúdo mas também via a "rede social" de pessoas que compraram conteúdo parecido que eu. Rankear conteúdo colaborativamente também é muito usado para sites como Digg ou Reddit. Mas em nenhum destes casos é possível realmente personalizar as recomendações.

Nos últimos anos vemos florescer o uso de "mídia social" onde pessoas podem ativamente "seguir" as atividades e interesses de outras pessoas e usar a sua rede de contatos para achar material relevante. Dou o exemplo do site de compartilhamento de documentos na Web delicious.com. Em primeiro lugar, posso seguir o que os meus contatos acham interessante. Mas posso também achar outras pessoas e assim ampliar o meu horizonte. Se marco um determinado documento como interesante, posso ver neste site outras pessoas com as mesmas interesses e achar outros documentos relacionados. É uma maneira muito eficaz de achar conteúdo parecido e relevante.

Afirmo que repositórios de mídia digital e sistema de gestão de conhecimento em geral vão precisar usar este tipo de funcionalidade para atender às necessidades do seu público e para poder oferecer material minimamente relevante, do mar quase-infinito de conteúdo disponível.

Parte 2: A Web como Plataforma

A Web é o sistema de informação mais bem sucedido na história da humanidade. Se quisermos criar novos sistemas, sejam educacionais, sejam de gestão de informação, certamente devemos tentar abstrair as razões pelo qual a Web tive tanto sucesso e aplicá-los aos nosso sistemas.

Uma primeira lição é que devemos construir os nossos sistemas para que exibem "efeitos de rede", a idéia que o sistema fique mais útil quanto mais pessoas usam. Isto nos ensina o valor de interoperabilidade e o uso de padrões abertas (para que o maior número possível de pessoas podem participar. 

A Web é uma plataforma neutra e aberta com arquitetura distribuída. Isto quer dizer que nenhuma entidade controla sozinha a Web e que ninguém precisa pedir permissão para participar e criar novas aplicações usando a plataforma. Isto é a receita para aplicações inovadoras. A Web é construída em cima da Internet, que tem uma arquitetura parecida. Nos dois casos se dá nomes às entidades importantes (servidores e documentos respectivamente) e define um protocolo de comunicação entre elas (HTTP e o atributo href resp.).

Uma arquitetura que dá nomes às entidades importantes e dutos de comunicação "burros" entre elas às vezes é chamado do tipo "end to end" ou "ponta a ponta". Neste tipo de arquitetura não deve tentar controlar como as entidades usam a rede. A inovação é permitido acontecer na "beira da rede". 

Da mesma maneira, precisamos construir a Web Social de forma que vire uma plataforma distribuída, neutra e aberta, identificando pessoas de alguma forma, permitindo conexões entre elas, para que possam ser construídas aplicações inovadores em cima desta plataforma. Software Social já existe, mas este tipo de plataforma distribuído ainda não.Talvez as padrões emergentes OpenSocial, OpenID e iniciativas como Diso são passos na direção certa. 

Parte 3: A Rede Social Acadêmica Stoa

O projeto Stoa é uma implementação de software social (ou, como prefiro, "a Web moderna") na USP. Os objetivos principais são oferecer ferramentas a comunidade USP que facilitam o compartilhamento da produção acadêmica, possibilitam a gestão de identidade digital e que criam uma plataforma de aprendizagem. A idéia também é criar o equivalente virtual de espaços públicos como corredores e lanchonetes para que os membros da comunidade USP podem interagir. Aprendizagem é um processo social, além de cognitivo.

Num ano e meio de operação tivemos da ordem de 5000 cadastros, dos quais a metade customizou o seu perfil. Foram criados 3000 posts, 6000 comentários. A maioria dos participantes tem menos do que 25 anos. Não existem usuários "típicos": as distribuições de vários indicadores de atividades são altamente desigual e "skewed".

Recentemente houve uma discussão acerca do papel que este tipo de plataforma pode e deve ter num ambiente educacional  e institucional. Como o conteúdo disseminado na plataforma deve ser moderado? A minha visão pessoal do Stoa é que é uma plataforma onde cada usuário é responsável pelo seu espaço. Qualquer moderação, nesta visão, deve acontecer num nível superior, em cima desta plataforma, de preferência de forma distribuida. Gostaria de em construir uma plataforma em vez de uma aplicação. Não é óbvio que isto é o modelo melhor ou possível para um sistema institucional.

Palavras-chave: stoa, usp, web, web social

Postado por Ewout ter Haar | 6 usuários votaram. 6 votos | 1 comentário

Agosto 31, 2008

default user icon
Postado por Ewout ter Haar

A web é o sistema de informação distribuído mais bem sucedido na história. Mas nem todo mundo aprendeu as lições da Web. Viram a última propaganda do Mastercard, aquela que a mulher jovem ensina mexer com a Internet a um grupo de velhinhos? O vídeo está online e queria salvar o link, para depois mostrar aos meus alunos. Queria mandar o link via email, queria dar o link para o vídeo aqui,  mas não posso. Em vez disso, vou ter que dizer: vai para http://www.naotempreco.com.br/ , clique no "Historias premiadas", clique no "Histórias que viraram comerciais na TV" e se tiver sorte, se fizer isto agora (e não, por exemplo, daqui a um ano) vai ver o vídeo. Parece que estamos nos anos 80, usando FTP!

Sites feito em Flash não fazem parte e não querem fazer parte da Web. A arquitetura da Web tem três pilares que sustentam a plataforma toda em cima do qual foram construídas tantas aplicativos: um protocolo, um formato e um esquema de identificação global. HTTP, HTML e URL respectivamente.

O protocolo HTTP define as mensagens com que servidor e cliente (o navegador, geralmente) se comunicam. A especificação do protocolo é aberta (pode ser implementado livremente por todo mundo, como todo protocolo da Internet) e simples, possibilitando a criação de uma grande variedade de software, feito por uma grande variedade de pessoas, para uma grande variedade de finalidades. Uma propriedade mais característica é o fato que o servidor não precisa manter "estado"acerca das mensagens trocados anteriormente com um cliente. Neste aspecto é como a peixe Doris no Procurando Nemo: toda requisição de um cliente é nova. Isto faz sistemas que usam HTPP "escalável" porque pode ter intermediários (cache, proxies) entre o cliente e o servidor.

O formato HTML é uma linguagem de marcação muito simples. A decisão de fazer da Web um espaço distribuído de documentos textuais possibilitou o efeito "ver código". Assim como grandes artistas roubam, milhões de autores iniciantes de sites começam com uma adaptação do código HTML dos outros. Como linguagem de marcação ou formato de hipertexto não é grandes coisas. Em particular, supostamente, hipertexto devia ser feito com ligações entre documentos, links, que são bi-direcionais para evitar links quebrados. Mas a possibilidade de fazer um link sem permissão e sem perguntar o dono do outro documento na verdade é uma grande virtude. Junto com a simplicidade de HTML, isto possibilita o crescimento rápido da Web de documentos inter-ligados.

O pilar mais importante da Web é o URL. É claro que para ter um sistema de informação global é preciso um identificador globalmente único. Mas o URL é mais do que isto: possibilita "endereçar" um recurso. Antes da Web, tinha ftp, um protocolo de transferência de arquivos. Para "endereçar" um arquivo dizia-se algo como "se loga como anônimo no servidor ftp.exemplo.com, vai para o diretório pub/exemplo/foo e inicia a transferência do arquivo bar". Ou seja, embora que o arquivo "bar" tinha, de certo modo, um endereço globalmente único, não tinha como dar facilmente instruções a uma máquina ou programa de buscar o arquivo. 

É isto a idéia fundamental do Tim Berners Lee: dar nomes (globalmente únicos) a recursos e construir sistemas usando estes recursos. Um dos sistemas era o "protocolo" de links entre documento do HTML: <a href="URL">link</a>. E é em cima deste protocolo que Google fez a sua fortuna, usando a estrutura do grafo dos documentos na Web para ranquear resultados de buscas e usando este superioridade para vender audiência a anunciantes de propagandas.

[Note bem: os nomes não indicam necessariamente um determinado "representação" do recurso. Não é como um nome de um arquivo, bar.doc por exemplo, que é o nome de uma determinada sequência de bytes que necessariamente tem que ser interpretado usando Microsoft Word. Não, o URL é o nome de um recurso, que pode ainda ter várias representações. ]

É irônico que Google virou um industria multi-bilionária vendendo uma aplicação da idéia do URL à indústria de propaganda e marqueting e este mesma indústria é o última que se está dando conta da importância do URL. Quem vai dizer aos marqueteiros que estão dando tiro no próprio pé?

Palavras-chave: tiro no pé, URL, web

Esta mensagem está sob a licença CreativeCommons Atribuição.

Postado por Ewout ter Haar | 0 comentário

Agosto 28, 2008

default user icon
Postado por Ewout ter Haar

É interessante ver os efeitos da internet na sociedade de uma maneira abstrata, mas conhecimento não vale nada se não pode colocar na prática as idéias. Segue então, em forma de receita, como registrar o seu domínio e começar a oferecer um serviço na Web.

Resumindo: 1. verficar disponibilidade 2. contratar serviço de hospedagem e 3. registrar o nome.

Verifcar disponibilidade

A primeira coisa a fazer é ter uma idéia (mesmo que seja vaga) para que vai usar o seu serviço Web e ver se o seu nome do domínio pretendido ainda está disponível. Para domínios .com.br, verifique a disponibilidade no Registo.br. Para outros domínios, verifique em qualquer um dos registrantes internacionais. Recomendo fazer via Google, por ser simples e em português (clique em  "Desejo comprar um nome de domínio"). Verificado a disponibilidade, vamos primeiro conseguir hospedagem e depois voltamos no registrante para terminar a compra do domínio.

Contratar hospedagem

Para "estar na Web" é preciso ter acesso a um computador conectado à internet. Mas o seu computador de casa não serve, por razões de confiabilidade e por que o seu proveder de acesso à internet não vai coloborar (o seu micro de casa deve ter IP dinâmica e largura de banda para upload pequena). Precisamos então contratar um serviço de hospedagem. Para começar, pode usar um serviço grátis. Se falar inglês, recomendo (mas aviso: conheço pouco temp) o serviço http://www.000webhost.com/ . Neste serviço, criar um conta e crie um "site" é muito simples e imediato. Para qualquer serviço de hospedagem, é necessário tomar nota dos nomes dos servidores DNS (servidor de nome. Neste caso, é ns01.000webhost.com e ns02.000webhost.co. Procure para o seu hospedagem quais os servidor de nomes deles, que vai precisar no próximo passo.

Registar o domínio

Finalmente, vamos registrar o domínio. No caso de um domínio .com.br faremos isto no registro.br. O primeiro passo é se cadastrar e se logar no site. Use uma senha boa!  O seu cadastro no registro.br é um dos mais importantes porque aqui vai poder controlar o seu domínio. Uma vez logado, escolhe a opção "Novos domínios" / Pessoa Física. Após aceitar o contrato, preenche o formulário. Use os dois nomes dos servidores de nome que pegou no passo anterior. Se tudo deu certo, requisições para oseudominio.com.br vão ser servidos pelo seu serviço de hospedagem do passo 2 dentro de uma hora.

Esta mensagem está sob a licença CreativeCommons Atribuição.

Postado por Ewout ter Haar | 0 comentário

Agosto 26, 2008

default user icon
Postado por Ewout ter Haar

Na aula de hoje investigamos como fazer o cadastro de um domínio na Internet e como ligar o domínio a um serviço de hospedagem. Mas a lição vai além dos detalhes técnicos de servidores Web e o sistema DNS.  A questão é: quem  determina o que você pode e não pode falar.

Acho que pode distinguir razoavelmente três camadas que governam as restrições de comunicação. As leis do país proíbem calúnia e outros crimes. Instituições como editoras de jornais, donos de rede de televisão, reitores de universidades, etc. tem grande poder sobre o que os seus empregados falam usando a infra-estrutura deles. E por fim tem as regras sociais de boa educação que impedem xingar o outro. 

O fato que podemos comprar (na verdade alugar) e  controlar o nosso próprio domínio é significativo na camada intermediária de instituições. Acesso ao serviço stoa.usp.br ou ao espaço web no servidor socrates.if.usp.br ainda implica, em princípio, a submissão às regras da USP e o Instituto da Física respectivamente. Tendo o seu próprio domínio é você que determina o conteúdo "a baixo do"  seu domínio. 

[Atualizado 28/8: na aula do noturno um aluno levou a questão de pedofelia e outros cirmes na rede, Bem lembrado: a internet tem grandes efeitos na camada de legislação também. O sociedade vai ter que lidar com avanços tecnologicas e adequar as Leis do pais às novas realidades. A polícia também tem que se adaptar às novas maneiras de infringir a Lei. Mas para os fins desta aula me concentrei na camada institucional, onde escolas e universidades se encontram]

É um exemplo de como escolhas tecnológicas influenciam diretamente nas estruturas da sociedade. O sistema DNS e os serviços feito em cima deste como email e a Web tem uma arquitetura distribuida e federada, em que a rede é organizado em forma de "servidores" com clientes. Os clientes são subordinados aos servidores que se comunicam entre si. Não tem controle centralizado sobre quem pode criar um servidor. Este é a organização de email, a Web e Mensagens Instantâneas (pelo menos os sistemas que falam XMPP). Creio que vai ser a arquitetura de redes sociais também. É uma maneira de organização intermediária entre estruturas hierárquicas e centralizados por um lado e estruturas completamente distribuidas como redes "peer to peer".

Na aula do diurno sorteiamos, das cinco propostas, experimentosdefisica.com.br para cadastrar. Ligamos o domínio a um serviço de hospedagem grátis (sugestão de Henrique). Agora precisamos decidir que serviços e informação disponibilizar lá...

Atualizado 28/8: No noturno uma sugestão era fisicaparatodos.com.br, mas este domínio já está registrado (por uma editora, aparentemente). Aí, surgiu a idéia de registrar fisicaforro.com.br, mas na última hora turma mudou de idéia e preferiu ensinodefisica.com.br. Liguei este domínio também ao serviço de hospedagem 000webhost.com: agora temos páginas "default" (veja http://ensinodefisica.com e http://experimentosdefisica.com.br) lá e precisamos colocar alguma coisa. 

Palavras-chave: arquitetura federada, DNS, fap0459, meios de comunicação, web

Postado por Ewout ter Haar | 1 usuário votou. 1 voto | 0 comentário

Março 06, 2008

default user icon
Postado por Ewout ter Haar

Ontem o John Wilbanks do  visitou o CCE e apresentou os objetivos e motivação do projeto sciencecommons, que visa a construção de infra-estrutura técnica, legal e social para fazer ciência do século 21.

O problema

Ciência de uma maneira geral está ficando cada vez mais massificada. Físicos de altas energias já estão acostumados desde a segunda guerra de trabalhar em grande escala e com grandes quantidades de dados. Um processo parecido está acontecendo com por exemplo as ciências biológicas. John contrastou alguns dos velhos métodos de colaboração com os novos: o conhecimento "canônico" era em forma de artigos e livros mas agora está em bases de dados. A distribuição de dados e artigos era mediado por editores humanos mas agora está função é cada vez mais de algoritmos e máquinas.

Especialmente nas ciências biológicas e da saúde, o conhecimento está em literalmente milhares de bases de dados separados. Como integrar estes dados e como oferecer uma plataforma que aumente a produtividade dos cientistas, assim como a Web fez para produtividade cultural.

A solução proposta pelo projeto Sciencecommons é inspirado na Web, a plataforma neutra e aberta mais bem-sucedida na história recente. Mas a arquitetura Web precisa ser adaptada para ciência e complementada com infra-estrutura legal e social.

Acesso Aberto

O primeiro passo é dar acesso livre à informação para toda cientista que precisa. Na área de artigos isto pode ser feito por meio de políticas de acesso aberto e usar tecnologia Web do jeito que está. Cientistas devem usar mais hiperlinks, artigos científicos devem ser mais como páginas web porque a natureza de trabalhos científicos é integrativo. Deve ter links para métodos, outros trabalhos, etc. etc. Além desta tecnologia deve ser possível legalmente possível compartilhar os trabalhos. Isto pode ser feito por meio de licenças do tipo creative commons.

Mas deve have acesso também a dados. O problema legal atualmente é que quando alguém integra vários bases de dados o conjunto fica com a licença mais restritiva. O sciencecommons fez um protocolo de acesso de dados que permite a liberdade para outras cientistas integrar este base em conjuntos maiores.

Mercado de amostras e equipamento

O Amazon mostrou que a rede é um instrumento bem eficaz de mover objetos físicos de um lugar para outro. Cientistas deveriam poder usufruir este mesmo tipo de benefícios. É preciso contratos padrão (não pode ficar fazendo papelada legal sempre se precisar de algo), URLs para objetos (como URLs para livros do Amazon). Ou seja, o Web1.0 do final dos anos 90 finalmente para ciência. (Se este tipo de fricção é um problema para cientistas nos EUA, imagine as dificuldades de cientista brasileiros que ainda tem que enfrentar a burocracia da alfândega e receita federal...)

Integração de Base de Dados

Este é a parte mais técnico das propostas. A Web Semântica é a extensão da arquitetura Web que aplica a dados o que a Web fez para documentos. Cada proteína, gene, ferramenta, método, etc. deve ter um URL. Em vez de bases de dados isolados devíamos expor estas dados usando o modelo de dados RDF e colocar na Web via "Linked Data". Assim, é possível que outros cientistas re-usam e analisam os dados da sua maneira.

Este abordagem para integração de dados é mais aberta e padronizada do que alternativas propostas por empresas individuais. É essencial que nenhuma única entidade fica responsável sozinho para cuidar do conhecimento científico.

Resumo

A complexidade da ciência moderna exige integração e novas maneiras de colaboração. Ao desenhar infra-estrutura e plataformas para fazer ciência, tenham estas duas regras em mente:

  • Use o sistema mais simples
  • Desenhe para re-uso 

Palavras-chave: infra-estrutura, sciencecommons, web

Esta mensagem está sob a licença CreativeCommons Atribuição.

Postado por Ewout ter Haar | 3 usuários votaram. 3 votos | 0 comentário

Janeiro 08, 2008

default user icon
Postado por Ewout ter Haar

Na universidade ainda há pouco reconhecimento da importância da Web. Nos cursos de criação a ênfase é em ferramentas visuais e habilidades gráficos. Nos cursos de ciência de computação ou engenharia da computação ainda reina a velha tecnologia Java que vê aplicativos Web como meros interfaces de usuário. Na verdade a filosofia Web representa uma mudança fundamental na arquitetura de sistemas, mudanças que inevitavelmente demoram para ser incorporadas na cultura da Universidade.

Aqui, quero fazer o argumento que o domínio das tecnologias Web, de maior ou menor profundidade, hoje em dia é essencial para educadores em particular e na verdade para qualquer pessoa querendo participar das conversas e debates da nossa sociedade de hoje.

Técnicas básicas de como divulgar informação pela web ainda são muito pouco conhecidas. Saber fazer marcação simples com HTML, apresentação visual básica com CSS, algumas melhorias de interface com Javascript não deviam habilidades somente de profissionais da Web. Para participar nas conversas cada vez mais online e assim exercer a sua cidadania é necessário ser pelo menos um pouco fluente nas linguagens da Web. Com tecnologias como blogs e wikis a participação de cada vez mais indivíduos foi facilitada e isto é uma coisa boa.

Mesmo assim, um conhecimento mais profundo das tecnologias envolvidas é desejável para profissionais de informação como educadores. Este conhecimento deve incluir os aspectos mais práticos e técnicas de desenvolvimento Web. É necessário ensinar os princípios de engenharia de front-end (a parte do sistema diretamente voltado ao usuário), envolvendo webdesign, aspectos de acessibilidade, de usabilidade e de arquitetura de informação.

Mas é muito bom conhecer também as técnicas no lado do servidor. A democratização que a Web habilita não se refere exclusivamente a possibilidade de qualquer um disseminar ou consumir texto e material audiovisual na Web. Se refere também ao fato que hoje em dia qualquer um pode instalar com facilidade o seu próprio servidor, o seu próprio sistema de gerenciamento de conteúdo, o seu próprio blog, wiki ou software de colaboração via Web. Serviços que uma década atrás ainda requeriam milhões de reais de investimentos agora podem ser oferecidos via o desktop no escritório. E é nessa revolução tecnológica que os nossos educadores tem que participar.

No currículo de educadores devia constar conhecimentos básicos de tecnologias Web como os princípios de linguagens de marcação, estilos, Javascript, conceitos novos na área de informação como tags, a web semântica, o uso de tecnologias como servidores web, bases de dados, software de desenvolvimento rápido de sites de
gerenciamento de conteúdo como Drupal, Plone ou software de desenvolvimento rápido de aplicativos Web com Ruby on Rails ou Django, linguagens modernas de programação como Ruby ou Python, a combinação de serviços Web para criar novos serviços.

Um outro exemplo de conhecimentos necessários não é técnico mais legal. No mundo digital onde é muito fácil e até natural de copiar,compartilhar e re-distribuir informação são necessários acordos e regras diferenciados para fazer isto de uma maneira legal e seguro. Para produtores de conteúdo, é importante conhecer estas questões e como poderiam ser resolvidas.

Um exemplo de uma solução são as licenças Creative Commons, introduzidos aqui no Brasil pelo FGV. São licenças intermediárias entre os direitos autorais convencionais e o domínio público. São escritos para o mundo digital, permitindo a autores e produtores um leque de opções legais com que podem especificar explicitamente como querem compartilhar o seu trabalho com o mundo.

O uso de técnicas da Web aberta, pública e padronizada é a maneira apropriada de disseminar qualquer produção intelectual e material didático em particular. Ao meu ver, o jeito errado é guardar conteúdos em chamados "repositórios", quando estes repositórios são fechados em vários sentidos, seja legalmente ou tecnicamente. Devemos ensinar a futura (e atual) geração de educadores e pesquisadores a importância da divulgação e preservação digital da sua produção intelectual, de liberar e deixar acessível o seu conteúdo, usando a Web aberta.

Palavras-chave: educação, web

Postado por Ewout ter Haar | 3 usuários votaram. 3 votos | 2 comentários

Dezembro 25, 2007

default user icon
Postado por Ewout ter Haar

Uma estratégia comprovada para incentivar a criação de aplicações inovadoras é identificar entidades de interesse, dar nomes a elas e permitir fazer conexões entre elas. A internet foi feito inicialmente em cima de redes telefônicas, a Web foi feito em cima da Internet. Estamos vendo nos últimos anos a construção de uma nova plataforma que poderíamos chamar de uma Web Social. As “entidades de interesse” neste caso são pessoas, identificadas por meio perfis em sites de rede social ou outras formas de expressão da identidade digital.

Esta nova camada de identidade para a Web ainda é incipiente mas já está tomando forma com a aceitação cada vez maior de serviços como Myspace, Facebook, Orkut [Boyd 2007]. É consenso que a questão da identidade digital vai tomar uma importância cada vez maior no futuro próximo. Por muitos anos a criação de identidades com alguma ligação real com pessoas no mundo real era muito difícil e até hoje a norma e expectativa é que identidade na Internet é basicamente inventada (“on the Internet nobody knows you are a dog” segundo o famoso quadrinho de Peter Steiner no The New Yorker.

Danah Boyd explica o processo de criação de uma identidade digital por adolescentes americanos no MySpace (o Orkut dos jovens americanos) e como a possibilidade de construir perfis anônimos ou “falsos” contribuiu ao sucesso de MySpace. Ainda segunda ela, jovens americanos não se importam trocar de perfil a cada poucos meses.

Mas cada vez mais, a tecnologia permite (e pessoas um pouco mais maduros querem) a criação de identidades virtuais com uma estreita ligação entre (alguma das) identidades da pessoa no mundo real. As novas aplicações que podem ser construídos podem ser de grande valor comercial e não é a toa que o mundo corporativo está tomando nota. MySpace foi vendido por meio bilhão de dólares e Facebook tem um valor avaliado de bilhões de dólares.

Mas instituições como governos e universidade podem também prover um ambiente que permite membros da sua comunidade consolidar (uma das) suas identidades profissionais online. Está na hora de todo mundo se conscientizar que a sua identidade digital é um recurso importante na sua vida, um recurso que deve ser administrado e controlado com muito cuidado. Segundo uma pesquisa recente somente 47% de usuários da Internet fez uma busca pelo próprio nome. Mas na medida que sua persona digital pública fica mais visível é mais importante de controlar ela.

É neste sentido que é importante que instituições como Universidades oferecam acesso fácil à criação de identidades digitais e incentivam a publicação e arquivamento da produção intelectual dos seus membros. Não podemos deixar estas facilidades na mão de corporações ou terceiros com interesses não necessariamente alinhados com as de instituições públicas. Estas devem usar protocolos e formatos abertos e padronizados na medida do possível para ter interoperabilidade horizontalmente (outras instituições) e verticalmente (o futuro). 

Já falei sobre uso de OpenID na USP e o próximo passo neste espaço é investigar outras maneiras de colocar o usuário no centro das atenções e em pleno controle da sua identidade digital. Talvez uma combinação de FOAF e OpenID pode ser usado como primeiro passo neste sentido.

Palavras-chave: identidade, web

Esta mensagem está sob a licença CreativeCommons Atribuição.

Postado por Ewout ter Haar | 4 usuários votaram. 4 votos | 2 comentários

Dezembro 23, 2007

default user icon
Postado por Ewout ter Haar

Assim como a Internet faz ligações entre computadores e a Web faz conexões entre computadores, na Web moderna estão surgindo novas "entidade interessantes", com identificadores e conexões entre elas. Aqui, falo sobre as tentativas (e erros) de colocar dados estruturados, não documentos, no centro das atenções. A Web Semântica busca identificar pedaços de dados e fazer conexões entre eles para tentar repetir o sucesso da Internet e a Web como plataformas abertas de inovação. Num próximo post abordarei como indivíduos e as suas conexões sociais estão virando uma nova plataforma.

Uma Web de Dados Compartilhados

Para entender o que está em jogo precisamos falar um pouco sobre como informação digital é representada por computadores. Podemos classificar estas representações digitais pelo grau que a informação é estruturada. A Web de hoje em grande parte consiste de documentos, informação organizada de forma não ou semi-estruturado. Documentos são fáceis de interpretar e produzir por humanos, com os seus cérebros afinados por centenas de milhares de anos de evolução para estruturar informação serializada. Mas para máquinas não é nada fácil interpretar a informação contida em documento sem nenhuma ajuda a mais. Por exemplo, como um algoritmo saberia que um documento que fala sobre "Amsterdam" também está relacionado com "Holanda"?

Informação armazenada em forma estruturada facilita a vida para computadores. Geralmente tem um tipo ou categoria para cada parcela de informação, é armazenado por meio de bases de dados, tem esquemas fixos e é muito mais fácil de processar por algoritmos. Informação estruturado é fácil de achar e manipular: é assim que a pizzaria sabe associar imediatamente o seu número de telefone com o seu endereço.

Para informação em forma de documentos, a “recuperação de informação” (information retrieval) é muito mais difícil. É necessário de forma manual ou automatizado, associar meta-dados e índices de documentos para que possam ser pesquisados eficientemente. Até relativamente recente esta foi uma área exclusivamente de profissionais na área de informação como bibliotecários. É possível estruturar documentos usando linguagens de marcação como HTML, LateX ou alguma aplicação de XML. Assim, a informação contido nestes documentos pode ser re-usado em outros contextos ou melhor interpretada por software do tipo texto-para-voz por exemplo.

google master planMas é notório o fato que os a grande maioria de produtores de documentos não conseguem associar meta-dados confiáveis a eles e que a única maneira de fazer com que pessoas coloquem alguma estrutura em seus documentos é via a sua aparência (cabeçalhos, negrito para ênfase, etc.). Mas a Web, e indexadores automatizados como Google mudaram este cenário completamente. Google consegue combinar o meta-dado implícito nos links entre documentos com uma análise do texto (usando qualquer estrutura que eles porventura tem) para construir um índice extremamente útil. Hoje em dia, recuperação de informação é feito milhões de vezes por dia por milhões de usuários ao fazer qualquer busca na Web.

Apesar de funcionar muito bem (como vemos pelo sucesso multi-bilionário do Google), existe uma demanda por informação onde as relações entre dados e o significado deles é explícito. A chamada Web Semântica pretende fazer para dados e informação estruturada o que o web comum fez para documentos: tornar dados mais fácil de descobrir e re-usar em contextos talvez inesperados por meio de conexões.

semantic web logoUsando técnicas da Web Semântica, dados estruturados poderiam ser disponibilizados de uma maneira conectada e padronizado, sendo possível usar algoritmos e computadores para permitir o re-uso e recombinação destes dados. Mas as propostas para a implementação da Web Semântica até agora não tiveram o mesmo sucesso que a Web convencional. E "sucesso" é essencial para deixar valer os efeitos de rede (Lei de Metcalfe) necessários para deixar a rede de dados mais útil para todo mundo.

Existem várias tentativas de deixar mais atraente a participação da Web Semântica. Mas talvez o problema é que a visão da Web em geral e da Web Semântica em particular de abrir e compartilhar os seus dados sempre foi visto com suspeito por empresas e até governos. Uma outra abordagem, a troca de dados por meio de APIs da Web entre sites ficou mais popular no mundo não-academico, certamente porque os fluxos e usos dos dados é mais controlável.

Tags e Folksonomies

tagsMas surgiram também alternativas à tecnologia talvez complexa demais da Web Semântica. Por exemplo, uma maneira intermediária de classificar e organizar conteúdo na Web é por meio de “tags” ou palavras-chave, levando aos chamados “folksonomies” um jogo de palavras com “ontologies”, os vocabulários controlados de profissionais de informação e a Web Semântica formal [van der Wal 2006]. Folksonomies são feitos de tags, simples palavras-chave associadas a pedaços de conteúdo por qualquer um que passa.

Tags funcionam como meta-dados muito simples que ajudam a indexação de informação não-estruturado (como documentos, áudio, imagens ou vídeo). Apesar de muito simples, pelo menos Incorporam a idéia que informação não sofre os mesmos limites do mundo material em que podemos classificar informação em várias categorias ao mesmo tempo [Weinberger 2007]. Classificações hierárquicas ao modo de Aristóteles não são a única ou melhor maneira de organizar informação, embora que as nossas intuições, que vem do mundo material, custam de mudar (a metáfora dominante nos desktops de hoje ainda são árvores de diretórios).

Mas o aspecto mais interessante de folksonomies é o seu aspecto social. Usando tecnologia da Web simples é possível mostrar quais palavras-chave já foram usadas. Isto pode levar a uma dinâmica sociais interessante e uma espécie de negociação pública acerca do significado de um determinado objeto digital.

Leia Mais:

Palavras-chave: google, linked data, rdf, recuperação de informação, tags, web, web semântica

Esta mensagem está sob a licença CreativeCommons Atribuição.

Postado por Ewout ter Haar | 3 usuários votaram. 3 votos | 2 comentários

Dezembro 18, 2007

default user icon
Postado por Ewout ter Haar

Segundo Alan Kay, chamamos de “tecnologia” tudo que foi inventado depois da gente nascer. Mas na verdade livros, giz e até linguagem são "tecnologia" também, mas se tornaram tão comuns que é difícil perceber o processo em que foram incorporados no nosso dia-a-dia. Tecnologia de rede é um pouco mais recente mas mesmo assim vale a pena rever um pouco de história. Recomendo esta palestra de Van Jacobson (e este resumo) pela maneira lúcida que descreve a transição de redes do tipo telefonia para redes do tipo internet.

correntesPorque a Internet e a Web conseguiram virar verdadeiras plataformas de inovação enquanto as redes de telefonia ficaram parados no tempo? Veremos que o segredo é identificar entidades de interesse, dar nomes a elas e permitir fazer conexões entre elas. Quem constroi aplicações para a Internet não precisa pensar nos caminhos físicos entre computadores. Quem constroi aplicações para a Web não precisa pensar nos computadores em que os documentos estão hospedados. Estas abstrações facilitam muito a vida de desenvolvedores. Outras características essenciais destas redes que incentivam inovação são a natureza distribuída destas redes e o fato que qualquer um pode participar sem pedir permissão a um órgão central.

A transição para este tipo de tecnologia occoreu nos anos 60 e continua até hoje. Acredito que sempre vai ter uma dicotomia entre sistemas abertos, distribuídos e não-hierárquias por um lado e sistemas fechados, controlados, centralizados e mantido por forças políticas e por meio de monopólios. É útil ver parte da históra de redes para ajudar interpretar o presente.

Estágio 1: redes telefônicas

Até os anos 60 do século passado, redes de telefonia era o estado de arte e o foco da atenção para pesquisa em redes de comunicação. O conceito central nestas redes é o “caminho” entre dois pontos. O problema tecnológico sendo resolvido era como achar o caminho na malha de fios de cobre e fazer a conexão entre dois telefones. Originalmente, o número de telefone era uma receita para achar este caminho. Note que o conceito de caminho entre dois pontos é não-local, o que leva a uma arquitetura de gerenciamento da rede centralizada.

cabosTem vários problemas com esta maneira de fazer redes mas o maior deles é a falta de escalabilidade: deve existir um caminho entre quaisquer dois pontos mas o número de caminhos aumenta rapidamente com o número de vértices. Para garantir a confiabilidade da comunicação entre todos os vértices é preciso aumentar a confiabilidade das conexões muito. Isto torna esta arquitetura de rede não muito robusta: uma falha, mesmo localizada numa região pequena, afeta grande parte da rede. Este modelo de rede funciona usando componentes de qualidade muito altas, o que leva a uma propriedade não-desejável: somente aparelhos “autorizados” podem participar da rede. Ao contrário da rede elétrica por exemplo, redes de telefonia são altamente não- neutral [Wu 2003] e gerenciadas de uma maneira centralizada.

Estes aspectos levam a uma série problemas relacionados com a falta de incentivo de implementar inovações. Não é por acaso que telefones evoluíram muito pouco no século após invenção por Bell. Historicamente, redes de telefonia são implementadas economicamente por meio de monopólios para poder sobreviver economicamente. É claro pela maneira da minha exposição que não acredito que redes de telefonia são um bom modelo. Para obter inspiração e idéias precisamos ver um novo modelo de redes, inventado nos anos 60 do século passado.

Estágio 2: Comutação de Pacotes e a Internet

A força da Internet hoje provem do fato que qualquer um dos aproximadamente 10^9 computadores podem usar qualquer um dos recursos na Internet público sem perguntar. A questão de alocação de recursos é delegado para os próprios computadores nas vértices da rede que implementam os protocolos de transporte [Briscoe 2007].

Nos anos 60 e 70 surgiu um novo paradigma para fazer redes. As chamadas redes de comutação de pacotes foram inventadas num contexto militar com o objetivo explicito de deixa-las mais robustas em face de falhas de componentes ou sub- redes inteiras. A idéia principal é de não focar mais nos caminhos ou rotas entre dois vértices e tornar o conceito principal os vértices (ou computadores ligados à rede). Um protocolo de roteamento de pacotes discretos de dados, com cada pacote sabendo o seu destino, cuida da transmissão da informação. Note que é preciso identificar com um número ou nome o destino.

As diferenças salientes com redes de telefonia são

  1. os pacotes são discretas,
  2. os pacotes sabem o seu endereço do seu destino,
  3. o protocolo cuida que um pacote chega no seu destino, o que pode acontecer por rotas imprevisíveis,
  4. a rede é descentralizada: não há controle centralizado, cada vértice ou roteador é tão importante quanto o outro.

A maior robustez e escalabilidade deste tipo de arquitetura de rede é decorrente do fato que não existe uma única rota entre dois pontos. Uma rota pode falhar e o próximo pacote pode ainda achar um outro caminho até o seu destino. Esta robustez só aumenta quando são adicionados mais vértices: a confiabilidade da rede aumenta com o número de vértices, em vez de decrescer como no caso de rede do tipo telefonia.

Dois elementos básicos da arquitetura deste tipo de rede levaram a estas propriedades desejáveis. Primeiro, o reconhecimento que os vértices (os destinos) eram as entidades importantes e interessantes que precisavam ser identificados com números e nomes e não os caminhos. A Internet foi desenhada para que os computadores ficaram visíveis e no centro das atenções, não o cabeamento.E segundo, a “inteligência” está nas bordas da rede, nos computadores que implementam o protocolo. As ligações são meros dutos de informação “burros”.

Aplicações podem ser construídas em cima deste protocolo de transporte básico, com referência somente ao destino, não à rota entre dois pontos. Dois aspectos desta abstração são importante para fazer da Internet um plataforma de inovação muito eficiente. O primeiro é que os protocolos são abertos. Todo mundo pode conhecer e usar os protocolos para criar novas aplicações em cima deles. O segundo aspecto é que as conexões existentes podem ser usados de uma maneira não previamente aprovada ou pensada pelos seus construtores originais.

Assim assegura-se uma competição saudável entre aplicações que usam os protocolos abertos da Internet, uma competição que independe dos interesses de curto prazo dos controladores da rede. O resultado é que em cima do protocolo de transporte básico agora são construídos as mais variadas aplicações de comunicação como email, chat, IM, Voice over IP, a própria Web, etc. etc.

Estágio 3: A Web

No início dos anos 90 Tim Berners Lee inventou a Web. A Web é um espaço de informação onde as entidades de interesse são identificados com URIs (Uniform Resource Identifiers) [Jacobs 2004]. Tendo já visto as propriedades desejáveis da Internet, fica mais fácil ver como a arquitetura da Web transformou serviços de informação e assim a própria sociedade e a vida das pessoas. As entidades interessantes da Web são documentos. De novo, a possibilidade de identificar documentos e fazer ligações entre eles sem ter que fazer referência aos computadores em que residem permite o re-uso inesperado de conteúdo e uma grande variedade de aplicações serem construídas em cima dos protocolos básicos da Web.

Assim como a Internet, a Web não cobra entrada: tudo mundo pode, sem permissão prévia, colocar um documento na Web, fazendo ligações com outro documentos. Os protocolos de comunicação e formato dos documentos são simples e abertos. Isto significa que para a barreira de entrada para participação da Web é bem baixa. A arquitetura da Web levou à várias propriedades desejáveis, de maneira parecida com a Internet. A Web é escalável, um documento aumenta o valor da rede como um todo, a Web é resistente à falhas localizadas, etc. etc.

Espero mostrar em posts seguintes como podemos aplicar as lições desta história ao presente.

Palavras-chave: internet, web

Postado por Ewout ter Haar | 2 usuários votaram. 2 votos | 1 comentário

Dezembro 17, 2007

default user icon
Postado por Ewout ter Haar

De vez em quando é útil parar, sentar e pensar sobre as suas premissas. Elas são ferramentas para pensar e agir: ajudam filtrar, das milhares de pedaços de informação que absorvemos todos os dias, as informações úteis que tem interesse e ajudam planejar a nossa próxima ação. Viver sem premissas é como viver sem categorias ou classificações; estaríamos boiando sem rumo num mar amorfo sendo bombardado por sensações sem sentido.

Mas as melhores premissas são explicitas, em forma de alguma estrutura teórica ou conjunto de regras. Senão, corre o risco de não perceber que está trabalhando dentro de um mero subconjunto de possibilidades e maneiras de agir. Nos próximos posts, vou explicitar a minha visão do mundo que vai determinar o que vou fazer professionalmente nos próximos anos. (Veja também estes documentos).

As lições da Web

Acredito que a Web aberta para todos é não somente uma ferramenta extremamente útil mas também é um exemplo de arquitetura aplicável em outras esferas da vida. Acredito em sistemas de informação distribuídos, não-hierárquicos e participativos. Acredito na construção de plataformas neutros, com acesso para todos. Acredito em conteúdo aberto e modular, criado colaborativamente. Acredito no uso de formatos abertos e padronizados que incentivam re-uso, preservação digital e acessibilidade. Acredito em educação centrado no usuário, que coloca os atores do processo de aprendizagem no centro de atenções em vez de focar em poucas e forçadas conexões entre eles.

Podemos compreender muito sobre a arquitetura "web" por meio de uma abstração muito simples. Progresso é feito identificando as entidades de interesse e fazer conexões entre elas. A Internet e a Web são exemplos de redes que podem ser compreendidos nestes termos. De uma maneira mais especulativo, farei uma tentativa também de transpor as lições aprendidas no domínio de tecnologia de rede para área de educação. Pretendo nos próximos posts abordar as seguinte temas:

Estou usando o tag web para annotar objetos relacionados com este assunto. Acompanhe ao vivo as minhas refêrencias: http://del.icio.us/ewout/web . Recomendo em particular um breve resumo da arquitetura web escrito para o mundo corporativo do Tim Bray . Espero que criticam e participam.

[Atulizado 21/12/2007: mudei "preconceitos" para "premissas", veja os comentários.]

Palavras-chave: internet, premissas, web

Esta mensagem está sob a licença CreativeCommons Atribuição.

Postado por Ewout ter Haar | 1 usuário votou. 1 voto | 3 comentários

Dezembro 10, 2007

default user icon
Postado por Ewout ter Haar

Doris Lessing tem 88 anos. É impossível não pensar nisso quando fala,

What has happened to us is an amazing invention, computers and the internet and TV, a revolution. This is not the first revolution we, the human race, has dealt with. The printing revolution, which did not take place in a matter of a few decades, but took much longer, changed our minds and ways of thinking. A foolhardy lot, we accepted it all, as we always do, never asked "What is going to happen to us now, with this invention of print?" And just as we never once stopped to ask, How are we, our minds, going to change with the new internet, which has seduced a whole generation into its inanities so that even quite reasonable people will confess that once they are hooked, it is hard to cut free, and they may find a whole day has passed in blogging and blugging etc.

Fiquei sabendo deste trecho via um blog que sigo via um feed. O blogosfera está meio ignorando, (compare com por exemplo o tag facebook)o que se normalmente faz quando alguém desta idade fala. Mas a Doris Lessing merece atenção e o texto inteiro é na verdade bem interessante. O trecho acima pode ser até lido como vindicação dos "bloqueiros" (não gosto muito deste termo por colocar numa única caixa estilos de comunicação bem diversas). Veja, está comparando um fenômeno relativamente jovem, de no máximo 30 anos (internet) ou 15 anos (web) ou 5 anos (blogs) de idade com uma revoluçao incontestável como a iniciado por Gutenberg. Que mais remédio quer para a sua auto-estima baixa?

O inventor e evangelista da Internet, Vint Cerf diz melhor: mesmo admitindo que é "mera" infra-estrutura, não pode negar que em somente duas décadas já mudou profundamente as nossas sociedades. "It has fostered self-expression and freed information from the constraints of physical location, opening up the world's information to people everywhere."

Este é o ponto: acesso a informação. Doris e Vint estão em pleno acordo neste ponto:

As I sit with my friend in his room, people drop shyly in, and all, everyone begs for books. "Please send us books when you get back to London". One man said, "They taught us to read but we have no books". Everybody I met, everyone, begged for books.

Acabei de comprar 4 livros de Amazon. Não vejo nenhuma contradição entre o internet e livros. A tecnologia da Internet não vai substituir a tecnologia de livros (não enquanto o melhor que temos são iniciativos ridículos como o Kindle...).

Palavras-chave: doris lessing, internet, lessing, livros, vint cerf, web

Esta mensagem está sob a licença CreativeCommons Atribuição.

Postado por Ewout ter Haar | 4 usuários votaram. 4 votos | 6 comentários

Janeiro 06, 2007

default user icon
Postado por Ewout ter Haar

No Brasil, é janeiro que é o mês mais cruel. Conseqüentemente, ligo o meu computador para pagar as contas no meu banco, mas não consigo entrar. Não tem mensagem de erro, o interface somente diz que errei a senha. Tenho quase certeza que a minha senilidade não chegou a tal ponto que esqueci a senha que uso várias vezes por mês, então uso a tecnologia de 2 séculos atrás, usando um canal com nome ridículo, e sou informado que a senha já foi resetada.

Claro que quando entro de novo, acontece a mesma coisa. Ligo de novo, falo agora com o suporte técnico, que me informam que a culpa é minha, por ter atualizado o meu navegador, que não tem suporte para a "linguagem de internet" que usam. Firefox 2.0 certamente suporta HTML, javascript, o que será tal "linguagem de internet"?

Eis a carta que tentei enviar via o canal de reclamações indicado pelo "atendimento" técnico: (é claro que o formulário não funcionou! a validação usando javascript se recusou aceitar o número da minha agência e se recusou mandar o meu texto. Os desenvolvedores do sistema devem se estar congratulando "tá tudo perfeito, ninguém reclama")

Não consigo usar o Internet Banking com o meu navegador de preferência. Faço parte de uma minoria de pessoas que não usam Internet Explorer do Microsoft. Mas vários grupos de usuários precisam usar navegadores que não são feitos por Microsoft. Por exemplo, pessoas de baixa visão, cegos, pessoas com dificuldades de movimentação, todos eles precisam de tecnologia assistiva fazendo que não podem usar o navegador de internet que a maioria dos clientes usam.

Considero a exclusão destas pessoas da funcionalidade que o Internet Banking oferece um ato de discriminição. Um banco do porte Santander Banespa certamente pode e deve construir a sua infra-estrutura (seja digital ou não) de uma maneira acessível para todos.

Recomendo que o site principal, e especialmente o site do Internet Banking seja implementado com tecnologia padronizada, deixando o site acessível para todos os navegadores, incluindo leitores de tela (usados por pessoas de baixa visão), ao vez de excluir os vários grupos que não usam os navegadores mais comuns.

Palavras-chave: banespa, web

Esta mensagem está sob a licença CreativeCommons Atribuição.

Postado por Ewout ter Haar | 1 comentário