UPSA explora as possibilidades dos dados abertos na Internet
José Pichel Andrés/DICYT A Universidade Pontifícia de Salamanca (UPSA) investiga no campo de ‘Open Linked Data’, o termo Inglês para ‘dados abertos e ligados’. As possibilidades oferecidas hoje pela Internet poderiam multiplicar-se nos próximos anos com o desenvolvimento destas tecnologias que enriquecem a pesquisa de dados e permitem a criação da nova web semântica, que fornece informação adicional e conecta dados de maneira inteligente.
Ana Fermoso, à frente do grupo de investigação em Tecnologias e Serviços de Mobilidade Web, explica alguns pormenores sobre a web semântica. “Outorga sentido à informação através de determinadas etiquetas que permitem, por exemplo, as pesquisas serem mais inteligentes”, comenta ela a DiCYT. Os dados ligados ou ‘Linked Data’ fazem parte desta web semântica, é uma maneira de vincular dados espalhados pela web, da mesma maneira que se ligam duas páginas por ligações externas.
Aliás, uma outra tendência na Internet são os dados abertos ou ‘Open Data’. Especialmente os governos e administrações públicas ―pela crescente procura de transparência―, mas também organizações privadas estão a publicar dados livres de direitos de autor para serem utilizados por terceiros. “O objetivo é que esta informação sirva para criar serviços para os cidadãos por meio da tecnologia”, expõe a especialista. O formato em que são publicados esses dados é muito importante para possibilitar a sua reutilização: o ideal é o chamado RDF (do inglês Resource Description Framework ou modelo de descrição de recursos).
Ao combinar os conceitos de dados ligados e dados abertos surge o ‘Open Linked Data’. “A ideia de que os dados abertos possam ser ligados a outros dados existentes na web semântica tem um enorme potencial”, assegura Ana Fermoso. “É uma forma de inferir conhecimentos sem trabalho extra, apenas ligando, e para isto a única exigência é que a informação esteja publicada em formato RDF”.
Assim, por exemplo, o projeto DBPedia é a tradução da informação que existe na popular enciclopédia Wikipédia ao formato semântico. Ao estar em RDF, pode-se vincular esta informação na web semântica, enquanto outros formatos semelhantes são utilizados para outras funções, como a georreferenciação.
Na linguagem de programação HTML, que é habitualmente usada nos sítios web, “só o ser humano é capaz de filtrar e descobrir se a informação é adequada”, mas graças às etiquetas semânticas que adiciona a RDF “uma máquina pode ponderar o significado” e associar novos conteúdos valiosos.
O desenvolvimento deste campo é um grande projeto global a ser construído pouco a pouco, sem invalidar o que já existe. Investigadores da Faculdade de Informática da UPSA apresentam suas contribuições através de pequenos projetos que ajudam a ilustrar o seu potencial.
Por exemplo, a BBC, a emissora pública britânica, já oferece em formato de web semântica dados sobre música ou programas. Ao trabalhar com os seus bancos de dados, pode-se gerar automaticamente muita mais informação sobre os conteúdos que eles fornecem, por exemplo, sobre um músico particular. Nesta linha, a UPSA desenvolveu um projeto com a Telefónica relacionado com BBC Programmes.
Dados abertos para o turismo
Mais tarde, mas antes do lançamento do Portal de Dados Abertos da Junta de Castilla y León (o órgão de governo da região de Castela e Leão, Espanha), a equipe de Ana Fermoso começou a executar projetos específicos relacionados com a região e, particularmente, com o turismo. O primeiro foi uma aplicação para telemóvel e web chamada de Quédate en Castilla y León (“Fica em Castela e Leão”), que permitia pesquisar estabelecimentos de hotelaria e restauração, como hotéis, residenciais ou cafés. “Ao viajar pela comunidade e inter-relacionar este tipo de dados, a informação pode multiplicar-se", refere a investigadora. Deste modo, “se em DBPedia há informação sobre um determinado lugar, pode-se ligar automaticamente, sem necessidade de que o programador da aplicação tenha de adicioná-la”.
Nesta mesma linha nasceu outro projeto que fez parte da iniciativa da passada edição do Clube Universitário de Inovação da UPSA, que envolve os seus alunos na investigação. Foi uma aplicação para dispositivos Android chamada de Smart Tourism (“turismo inteligente”) e focada no turismo de Salamanca, bem que o mesmo modelo poderia ser útil para qualquer cidade. Do ponto de vista do usuário, a aplicação oferece um roteiro com pontos turísticos, monumentos e atrações, mostrando a sua localização em um mapa em relação ao usuário, uma ficha com as características, horários, preços e até uma galeria de imagens.
Até aí, é uma app de turismo tradicional. No entanto, do ponto de vista técnico é muito inovadora porque utiliza a tecnologia ‘Open Linked Data’ para obter esses elementos através de diversas fontes da Internet, tais como os dados publicados pelo governo regional, a DBPedia ou Flickr, além de favorecer a participação ativa do usuário, que pode adicionar novas fotografias.
“As possibilidades dos dados abertos na Internet são infinitas”, afirma Ana Fermoso, “tudo depende da imaginação, de pensar como você pode tirar proveito dos dados, e, claro, dos próprios dados que se vão publicando e de que cada vez incluam mais e mais conjuntos de dados ligados”.