Project

General

Profile

Wiki » History » Version 22

« Previous - Version 22/38 (diff) - Next » - Current version
Micael Pinho, 21/06/2012 15:41


Wiki

Título: Modelo de Replicação para a Preservação de Dados em Repositórios

Autor: Micael Ferreira Alves de Pinho

Orientadora: Maria Cristina de Carvalho Alves Ribeiro

Local: FEUP

Resumo (pt):

A entrada no mercado das novas tecnologias digitais, impulsionou o nosso mundo para uma era em que a criação, manipulação e o armazenamento de informação de forma digital cresceu significativamente. Por outro lado, surgiram alguns problemas relacionados com a preservação a longo prazo dessa mesma informação.
Atualmente, já existem repositórios que permitem o armazenamento e preservação de conteúdos digitais. Contudo, acontecimentos imprevisíveis, como ocorrência de catástrofes naturais, falhas de hardware, ou até mesmo erros humanos, podem provocar danos nos servidores, colocando em risco a informação existente.
Alguns conteúdos existentes nos repositórios digitais poderão ter um elevado valor e importância, e como tal, a sua perda poderá ter consequências graves. Por exemplo, no contexto de investigação, os conjuntos de dados (datasets) recolhidos possuem uma grande importância na validação de resultados obtidos em investigações e além disso constituem uma importante fonte de evidência para trabalhos futuros.
Hoje em dia já existem várias plataformas de repositórios disponíveis no mercado, sendo uma delas o DSpace. Este facilita o processo de criação de repositórios institucionais, para a recolha, partilha e preservação digital de conteúdos intelectuais, dos mais diversificados formatos digitais. O DSpace também fornece um vasto conjunto de ferramentas, para uma gestão eficaz dos conteúdos digitais, e em caso de algum formato digital se tornar obsoleto, é possível a sua migração para um dos formatos mais divulgados.
O projeto de dissertação aqui apresentado, teve por objetivo a criação de um sistema para a geração de cópias de segurança dos conteúdos existentes numa instância DSpace, para que em caso de necessidade futura, seja possível a sua restauração. Optou-se por um repositório DSpace, visto que os investigadores da Universidade do Porto já estão bastante familiarizados com esta plataforma.
Desenvolveu-se um componente de backup para a geração de cópias de segurança e outro para restauração dos conteúdos. Estes componentes foram desenvolvidos utilizando as ferramentas de backup disponíveis no DSpace. Efetuaram-se melhorias nas mesmas, através da criação de interfaces mais intuitivas e melhoria dos próprios processos com a redução do processamento e tempo requerido.
A geração das cópias de segurança, levantou questões sobre a disponibilidade e integridade das mesmas, visto que é possível que elas também sofram danos. O envio das destas para outras localizações remotas foi ponderado, tendo-se analisado a possibilidade de utilização de serviços de armazenamento cloud. De modo a tornar abstrata a ligação com diferentes serviços cloud optou-se pela utilização do software open-source jclouds. Para garantir a consistência, integridade e acessibilidade das cópias de segurança foram desenvolvidas duas componentes, uma para o envio das mesmas para a cloud e outra para a obtenção delas da cloud.

Outros: