Atualização: As apresentações já encontram-se disponíveis no site do Sistema de Bibliotecas da UFMG.

Em um post anterior foi anunciado o I Simpósio sobre Acesso Livre na UFMG e nesse post farei um relato sobre o evento no qual aprendi bastante.

Nota 1: em breve deve ser disponibilizado a gravação do evento no UFMGtube.

Nota 2: em breve atualizo o post com fotos do evento.

Open Acess: oportunidade para a UFMG mostara a produção científica ao mundo

O Professor Pós-Doutor Hélio Kuramoto da UFMG iniciou a primeira parte do evento com uma magnífica apresentação informando sobre o acesso aberto e sua importância.

A bibliotecária Caterina G. Pavão da UFRGS tratou mais profundamente do repositório institucional da UFRGS do Lume que é o maior dentre as universidades federais brasileiras abordando tanto a parte técnica como institucional.

E para terminar a primeira parte do evento apresentei alguns dos desafios ao acesso aberto. Minha apresentação encontra-se disponível aqui (descomprima o arquivo ZIP e abra o arquivo HTML) e espero escrever um pouco mais sobre ela em um outro post.

Repositório Institucional na UFMG; estágio atual de repositórios

A segunda parte do evento foi voltada para a questão de repositórios institucionais cuja principal plataforma utilizada é o DSpace. Foi perguntado o que seria o DuraSpace e a credito que a resposta é uma organização/fundação responsável por manter o DSpace e outros projetos relacionados (ela também oferece serviços).

Essa sessão foi iniciado pelo Professor Doutor Márcio Luiz Buante de Carvalho que apresentou o Laboratório de Computação Científica da UFMG e um dos responsáveis pela infraestrutura de acesso aberto da universidade.

A Professora Pós-Doutora Maria Aparecida Moura falou sobre os vários projetos da universidade que encontram-se sobre a marca do Colaboratório Digital UFMG.

Por último, a bibliotecária da BU da UFMG Belkiz Costa relatou o trabalho de arquivamento das dissertações e teses da universidade, os problemas enfrentados e como foram resolvidos

Editoração Científica na UFMG: experiências diversas

A última parte do evento tratou de periódicos produzidos dentro da universidade. O software mais utilizado para o gerenciamento dos periódicos no Brasil é o SEER (a versão fornecida pelo IBICT do Open Journal Systems) e em alguns casos uma “consultoria” como do GN1.

A sessão foi iniciada pela Professora Doutora Terezinha de Fátima Carvalho de Souza que apresentou a história da Perspectivas em Ciência da Informação.

Depois a bibliotecária Rosângela Maria Costa Bernardino, coordenadora da Biblioteca da Faculdade de Letra e representando o Professor Doutor Luiz Francisco Francisco Dias, falou sobre os periódicos da Faculdade de Letras da UFMG. Gostei de conhecer o projeto Viva Voz sendo que teria ficado mais feliz se o material estivesse sob uma licença aberta (CC-BY ou CC-BY-SA).

Posteriormente a Editora Executiva Maria Piedade Fernandes Ribeiro Leite apresentou as várias revistas da área da saúde mineira.

Por último, o Professor Doutor Márcio Luiz Bunte de Carvalho falou sobre os esforços para criação do portal de periódicos científicos da UFMG que envolve o mapeamento dos jornais existentes e migração ou integração dos mesmos.

Agradecimentos

Agradecimentos a todos que participaram da organização desse evento, em especial para Carla Pedrosa.

Este post é uma tradução desse outro post (CC-BY) originalmente publicado por Greg Wilson em 17/10/2013 no blog da Software Carpentry. Texto entre colchetes são notas de tradução.

Como parte do “Mozilla Summit” algumas semanas atrás, John Jensen apresentou um relatório sobre a saúde da “open web”. Os detalhes são fascinantes e foram sumarizados no gráfico abaixo mostrando as várias camadas de abertura da qual dependemos. Eu [Greg] vou reproduzí-lo na esquerda e sumarizar minha visão como está a ciência aberta nas mesmas camadas na direita:

Open Web
Escolha
e
Controle
do Usuário
Atividade
Social
Atividade
Economia
Confiança
Diversidade de serviço
Inovação
Liberdade de conteúdo
Interoperabilidade
Acesso
Ciência Aberta
Escolha
e
Controle
do Usuário
Atividade
Social
Atividade
Economica
Confiança
Diversidade de serviço
Inovação
Liberade de Conteúdo
Interoperabilidade
Acesso

Aqui encontra-se a análise de Jensen (baseada em toneladas de dados) e a minha [do Greg] (que é basicamente minha opinião) de baixo para cima:

Área Open Web   Ciência Aberta
Acesso Um terço da população mundial possui acesso regular à internet e apenas 2% vivem em países que estão quase completamente desconectados (Cuba, Iran, Coreia do Norte e Uzbequistão). Por outro lado, apenas um décimo dos norte-americanos com necessidades especias utilizam a internet. Embora a grande disponiblidade de acesso à internet em países desenvolvidos e de um crescimento em outros países, até mesmo o mais bem financiado grupo de pesquisa ainda encontra barreiras para acessar conteúdo e dados. Pessoas estão trabalhando em todos os níveis para mudar isso, mas existe muito a ser feito.
Interoperabilidade Navegadores web modernos são bastante compatíveis entre si. Serviços voltados para cientístas normalmente não falam entre si.
Liberade de Conteúdo Covernos estão tentando controlar quem pode ver o que, mas ainda temos certa grande liberdade para ler, ver e dizer o que queremos.

(Nota: quando questionado, Jensen disse que este camada talvez devesse ser amarela para refletir o aparecimento de jardins cercados e DRM.)
Até pesquisadores renomados e instituições capitalizadas [não encontrei uma boa tradução para “well-funded”] possuem dificuldade em acessar a pesquisa de seus pares devido a barreiras financeiras e outros bloqueios utilizados pelos fornecedores de conteúdo.
Inovação A maior parte ocorreu na área de aparelhos celulares e tablets nos últimos anos. Inúmeras idéias e serviços tem aparecidos nos últimos anos, e não existe sinais de que isso irá dinimuir.
Diversidade de
Serviços
Diversidade diminui quando você aproxima-se do topo da pilha. Por exemplo, a web não é controlada por uma única operadora de rede, mas utilizamos apenas três sistemas operacionais e apenas o serviço de redes sociais e ferramentas de busca são dominados por apenas uma empresa cada um dos serviços. Diversidade dinimui próximo do fim da cadeia de publicação: existem muito mais pontos para coleta de dados do que arquivos usáveis, e algumas poucas grandes empresas possuem a mesma força na área de publicação que Apple, Google, Facebook, e Amazon possuem na web.
Escolha e
Contrle
do Usuário
Várias opções para desktop, mas celulares e tablets são dominados pelo Safari e produtos relacionados com a versão móvel do Firefox possuem apenas uma pequena fatia do mercado. Mais importante, talvez, os usuários não possuem controle de suas identidades: Facebook, Google e Yahoo! possuem. Ninguém domina a ciência na web da mesma forma que Apple, Google e Facebook dominam a web de uma forma geral.
Atividade
Social
De um lado, Facebook consome 83% do tempo “social” online dos usuários. Do outro lado, legislações como SOPA e PIPA são repetidamente derrubadas. O lado social da ciência ainda é fortemente conduzida presencialmente em conferências.
Atividade
Economica
Comércio online possui a maior fatia, seguido por propaganda que constitui algo próximo de um monopólio. O mercado de coisas científicas como a revisão/publicação de artigos é hoje quase que totalmente conduzida pela internet, mas a maioria dos softwares e serviços são caixas pretas controlada por um número reduzido de empresas.
Confiança A internet e mídia social é a 25ª das 25 indústrias nas quais as pessoas confiam, depois de bancos e linhas aéreas. A grande maioria dos cientistas confiam no trabalho dos seus pares, o que é evidenciado pelo fato de que eles não requistam o compartilhamento de dados e códigos para o processo de revisão ao qual são submetidos. Isso não é necessariamente uma boa coisa…

Esta análise mostra porque tantas pessoas trabalhando em prol da ciência aberta estão focadas em mudanças institucionais para abrir o conteúdo, e mudanças técnicas para que as ferramentas hoje presente possam conversar uma com as outras. Nossa missão para os próximos anos é ajudar os cientistas a adquirirem as habilidades e ferramentas necessárias para fazerem seu trabalho.

Atualização em 04/11/2013: Os slides das apresentações encontram-se disponíveis no slideshare.

Nota 1: Este post corresponde a uma tradução do anterior que encontra-se em inglês.

Nota 2: As opiniões presentes neste post não representam o grupo de trabalho em Ciência Aberta como um todo.

Nos dias 6 e 7 de Outubro ocorreu a 4ª CONFOA (Conferência Luso-Brasileira sobre Acesso Aberto) a partir da qual eu gostaria de levantar alguns tópicos para debate.

image20131008_0003

Na conferência tivemos várias apresentações sobre acesso aberto, dados abertos, repositórios institucionais, direitos autorais, …, mas eu consigo lembrar de apenas DUAS apresentações cujos slides estava marcados com uma licença aberta:

  • Disponibilidad en acesso aberto de la produccion científica de los países de África lusófona. Martins Fernando Cuambe and Gema Bueno de la Fuente.
  • Cross-Ref, DOI (Digital Object Identifier) e serviços: Estudo comparativo luso-brasileiro. Edilson Damasio.

Então slides é um tipo de conteúdo que não deve ser aberto?

Nas recomendações de Budapest encontramos a definição abaixo para acesso aberto (tradução e destaque pelo autor deste post):

Por “acesso aberto” da literatura científica revisada por pares, nós entendemos que ela encontra-se livremente disponível ao público da internet, permitindo qualquer um lê-lo, baixá-lo, copiá-lo, distribuí-lo imprimí-lo, fazer busca nele, ou criar links para o texto completo desses artigos, utilizá-lo para produção de índices, passá-lo como informação/entrada para um programa de computador (software), ou utilizá-lo para qualquer outro propósito legal, sem barreiras financeiras, legais ou técnicas outras que não inseparáveis da obtenção do acesso da internet. A única restrição para a reprodução e distribuição, e a única regra para o direito autoral neste domínio, de ser dar ao autor o controle sobre a integridade do seu trabalho e o direito de ser adequadamente reconhecido e citado.

No Brasil, muitos chamam de documentos “abertos” aqueles que podemos apenas ler. Na minha opinião, devemos começar a chamar esse tipo de documento apenas de acesso grátis para evitar mal entendidos.

Também no Brasil, as pessoas gostam de utilizar as licenças Creative Commons com a condição de uso não comercial. Pedi ao senhor Marcos Alves de Souza do Ministério da Cultura por uma definição de uso comercial e ele disse que tal não existe. Desta forma e na minha opinição, uma vez que não consiguimos fazer uma diferença clara do que é uso comercial devemos parar de utilizar a condição de uso não comercial das licenças Creative Commons pois o uso dessa restrição apenas atrasa o processo de inovação como foi dito várias vezes na conferência.

Updated in 2013/11/04: Some of the slides are available at slideshare.

Note: The opinion in this post aren’t from the work group in Open Science as a hole.

In 6th and 7th of October happen the 4th CONFOA (Portuguese-Brazilian conference about Open Access) from it I would like to rise three topics to debate.

image20131008_0003

The conference have lots of presentations about open access, open data, institutional repository, copyright, …, but I can only remember of TWO presentations that the slides have a free license:

  • Disponibilidad en acesso aberto de la produccion científica de los países de África lusófona. Martins Fernando Cuambe and Gema Bueno de la Fuente.
  • Cross-Ref, DOI (Digital Object Identifier) e serviços: Estudo comparativo luso-brasileiro. Edilson Damasio.

So presentations are one type of content that should NOT be open?

From the Budapest recommendations we have the following definition of open access (boldface from the author of this post):

By “open access” to [peer-reviewed research literature], we mean its free availability on the public internet, permitting any users to read, download, copy, distribute, print, search, or link to the full texts of these articles, crawl them for indexing, pass them as data to software, or use them for any other lawful purpose, without financial, legal, or technical barrier other than those inseparable from gaining access to the internet itself. The only constraint on reproduction and distribution, and the only role for copyright in this domains, should be to give authors control over the integrity of their work and the right to be properly acknowledged and cited.

In Brazil, most of the called “open” documents ONLY permit the reading. In my humble opinion, we must start calling this type of document “free beer” access to avoid misunderstandings.

Here in Brazil, people like to use the Creative Commons licenses with the noncommercial clause. I asked Marcos Alves de Souza from brazilian’s ‘Ministério da Cultura” for a definition of noncommercial use and he say that it doesn’t exist. So in my humble opinion, once we can’t make clear what is noncommercial we should stop using the noncommercial clause of Creative Commons because the use of this clause only slow the innovation as say, many times, in the conference.

Nota: Este post é baseado no post “Publishing scientific software matters”, de Gaël Varoquaux, e no artigo “Publishing scientific software matters”, de Christophe Pradal, Gaël Varoquaux e Has Peter Langtangen.

Cada vez mais softwares estão desempenhando papel fundamental na produção científica, seja transformando um modelo teórico em simulações, controlando experimentos ou filtrando dados para serem analisados. Infelizmente algumas coisas precisam ser melhoradas.

O primeiro problema é que várias pesquisas e softwares são construídos em cima de ferramentas proprietárias como Matlab e Mathematica, de forma que só é possível revisar a pesquisa e o software após adquirir tais ferramentas.

Uma das vantagens de modelar um problema matematicamente é que assim fica mais fácil procurar por uma forma de resolvê-lo que já tenha sido bastante estudada. De forma semelhante, seria interessante poder utilizar um software já existente ou adaptá-lo para resolver o problema desejado devido a sua estrutura matemática. Infelizmente grande maioria dos softwares são escritos direcionados para problemas específicos de forma que reusá-lo não é uma tarefa fácil, o que é o segundo problema.

O terceiro problema é que muitos dos softwares não encontram-se disponíveis publicamente sendo necessário contactar os autores para adquirir uma cópia quando eles podem fornecê-la. Quando falamos de ciência estamos indiretamente falando de resultados reprodutíveis, então “se não é aberto e verificável por outros, então não é ciência, ou engenharia, ou qualquer que seja o nome pelo qual você chama o que fazemos” (tradução literal de citação anônima presente em “The scientific method in practice: reproducibility in the computational sciences ” de V. Stodden.)

Espero que em breve consigamos resolver estes problemas.