Project

General

Profile

Wiki » History » Version 18

Version 17 (Micael Pinho, 03/06/2012 14:07) → Version 18/38 (Micael Pinho, 03/06/2012 14:08)

h1. Wiki

h2. Título: Modelo de Replicação para a Preservação de Dados em Repositórios

h3. Autor: Micael Ferreira Alves de Pinho

h3. Orientadora: Maria Cristina de Carvalho Alves Ribeiro

h3. Local: FEUP

h3. Resumo:

> A entrada no mercado, das novas tecnologias digitais impulsionou o nosso mundo para uma era, em que a criação, manipulação e o armazenamento de informação de forma digital, cresceu exponencialmente. Por outro lado, surgiram alguns problemas relacionados
com a preservação a longo prazo dessa mesma informação.
No contexto de investigação, os conjuntos de dados (datasets) recolhidos, devido à existência de uma grande diversidade de áreas de investigação, têm estruturas e informações bastantes variadas. Os datasets podem ser conteúdos textuais, imagens ou audiovisuais.
> A preservação e acessibilidade destes conjuntos de dados é de extrema importância para a validação dos resultados obtidos em investigações e constituem uma importante fonte de evidência para trabalhos futuros.
> Atualmente, já existem alguns repositórios de conteúdos digitais, que permitem o armazenamento e preservação de datasets. Contudo, acontecimentos imprevísiveis, como ocorrência de catástrofes naturais, falhas de hardware, ou até mesmo erros humanos, podem provocar danos nos servidores e colocar em risco essa mesma preservação. Tendo isto em consideração, é importante a existência de um sistema que permita a preservação em outras localizações remotas, dos conteúdos digitais armazenados nos repositórios.
> Neste momento, a Reitoria da Universidade do Porto encontra-se a desenvolver um projeto denominado UPData, que tem por objetivo, o armazenamento e preservação de
dados científicos, utilizando um repositório de conteúdos digitais open-source denominado DSpace. Em semelhança com a situação referida anteriormente, este repositório encontra-se sujeito à ocorrência de eventos imprevisíveis que podem por em questão a preservação futura dos conteúdos armazenados.
> Assim, o projeto de dissertação aqui apresentado, teve como objetivo a análise e criação de um sistema que permitisse a criação de cópias de segurança dos conteúdos digitais armazenados. Além disso, pretende-se que as cópias possam ser enviadas para outras localizações remotas, de modo a garantir a sua consistência e integridade, para que no futuro em caso de necessidade possam ser acessíveis e reutilizáveis.
> Para a realização deste sistema, foi analisado o repositório de dados DSpace, de modo a perceber-se o seu funcionamento, e assim definir qual o melhor procedimento para a realização das cópias de segurança dos conteúdos digitais armazenados. Foi também averiguado a utilização futura das cópias de segurança geradas, em caso de necessidade de reposição dos conteúdos.
> Além disso, foi analisada a possibilidade de utilização de serviços cloud, de modo a garantir a consistência e integridade das cópias de segurança criadas, tendo-se então optado pela utilização do software open-source jclouds, que permitiu tornar abstrata a ligação com diferentes serviços cloud.

Outros:
* [[dspace|DSpace]]