quarta-feira, março 21, 2007

Projecto visa disponibilizar obras portuguesas na Internet

"A paixão pela língua portuguesa e a vontade de a fazer chegar ao maior número possível de pessoas funcionam como móbil do projecto «Voluntariado Literário», que visa disponibilizar obras portuguesas na Internet a custo zero.
«O facto de a Net não ter fronteiras é excelente, quer para angariar voluntários para a iniciativa, quer para fazer chegar os livros em língua portuguesa em formato electrónico (e-books) a qualquer parte do mundo», declarou Rita Farinha à agência Lusa.
A coordenadora da vertente de língua portuguesa explicou qual o trabalho dos 171 voluntários - «entre portugueses, brasileiros e imigrantes portugueses na Holanda, Luxemburgo ou França» - que gastam horas a comparar e rever páginas e páginas de livros antigos.
«Quando um livro é digitalizado, as suas páginas ficam no formato de imagem, cabendo ao computador fazer uma leitura que converta o texto outra vez em letras - é o processo de Reconhecimento Óptico de Caracteres», explicou Rita Farinha.
Porém, «os computadores conseguem, na melhor das hipóteses, uma precisão na ordem dos 90 por cento, o que significa que ocorrem 10 por cento ou mais de erros de reconhecimento, sendo indispensável que as páginas passem por uma revisão humana», acrescentou a responsável.
«O livro completo destina-se à base de dados do Projecto Gutenberg (alojada em www.gutenberg.org), onde fica acessível gratuitamente já em formato de texto, o que permite a leitura por computadores de pessoas com deficiência visual», assinalou ainda.
Rita Farinha, que entrou para o projecto como voluntária em Setembro de 2004 e passou a coordenadora três meses depois, revelou ainda à Lusa que «o facto de os livros serem antigos dificulta ainda mais o Reconhecimento Óptico de Caracteres».
Assim, cabe aos voluntários estabelecerem a comparação entre a imagem da página e o texto resultante da conversão, «sendo cada página revista por cinco utilizadores diferentes, de modo a que não passem erros para a versão final do texto», indicou a coordenadora.
Até 2004, «existiam apenas três ou quatro obras em língua portuguesa» neste projecto de cariz internacional, mas o número actual é de 81 livros, «incluindo títulos de Eça de Queirós, Cesário Verde, Camilo Castelo Branco, Júlio Dinis, Ramalho Ortigão ou António Nobre».
Segundo Rita Farinha, «apenas obras que estejam no domínio público podem entrar para a base de dados», havendo mais de 110 livros em língua portuguesa a ser processados, «alguns há dois anos», pois a rapidez varia com o interesse que as obras despertam nos voluntários.
Neste momento, a língua portuguesa ocupa o oitavo lugar entre os 50 idiomas ou dialectos do projecto, que em inglês se designa por Distributed Proofreders e tem um sítio em www.pgdp.net.
Diário Digital / Lusa A Biblioteca Nacional é a principal entidade a facultar obras, nomeadamente através da iniciativa Biblioteca Nacional Digital, mas o projecto tem também parcerias com a Biblioteca Gálica, em França, e as bibliotecas da Universidade de Toronto, no Canadá, revelou Rita Farinha, que criou um sítio de apoio aos voluntários. O blog Página a Página, que pode ser consultado no endereço http://pagina-a-pagina.blogspot.com contém informação sobre os livros concluídos e em processamento, estatísticas mensais, acesso às regras de revisão e formatação, ou seja, funciona como "veículo de comunicação do projecto", rematou Rita Farinha. HSF."

Sem comentários: