Project

General

Profile

Wiki » History » Version 20

Micael Pinho, 03/06/2012 14:09

1 1 Micael Pinho
h1. Wiki
2 10 Micael Pinho
3 17 Micael Pinho
h2. Título: Modelo de Replicação para a Preservação de Dados em Repositórios
4 1 Micael Pinho
5 17 Micael Pinho
h3. Autor: Micael Ferreira Alves de Pinho
6 1 Micael Pinho
7 17 Micael Pinho
h3. Orientadora: Maria Cristina de Carvalho Alves Ribeiro
8 17 Micael Pinho
9 17 Micael Pinho
h3. Local: FEUP
10 17 Micael Pinho
11 20 Micael Pinho
h3. Resumo Provisório:
12 17 Micael Pinho
13 19 Micael Pinho
> A entrada no mercado, das novas tecnologias digitais impulsionou o nosso mundo para uma era, em que a criação, manipulação e o armazenamento de informação de forma digital, cresceu exponencialmente. Por outro lado, surgiram alguns problemas relacionados com a preservação a longo prazo dessa mesma informação.
14 19 Micael Pinho
> No contexto de investigação, os conjuntos de dados (datasets) recolhidos, devido à existência de uma grande diversidade de áreas de investigação, têm estruturas e informações bastantes variadas. Os datasets podem ser conteúdos textuais, imagens ou audiovisuais.
15 18 Micael Pinho
> A preservação e acessibilidade destes conjuntos de dados é de extrema importância para a validação dos resultados obtidos em investigações e constituem uma importante fonte de evidência para trabalhos futuros.
16 18 Micael Pinho
> Atualmente, já existem alguns repositórios de conteúdos digitais, que permitem o armazenamento e preservação de datasets. Contudo, acontecimentos imprevísiveis, como ocorrência de catástrofes naturais, falhas de hardware, ou até mesmo erros humanos, podem provocar danos nos servidores e colocar em risco essa mesma preservação. Tendo isto em consideração, é importante a existência de um sistema que permita a preservação em outras localizações remotas, dos conteúdos digitais armazenados nos repositórios.
17 18 Micael Pinho
> Neste momento, a Reitoria da Universidade do Porto encontra-se a desenvolver um projeto denominado UPData, que tem por objetivo, o armazenamento e preservação de dados científicos, utilizando um repositório de conteúdos digitais open-source denominado DSpace. Em semelhança com a situação referida anteriormente, este repositório encontra-se sujeito à ocorrência de eventos imprevisíveis que podem por em questão a preservação futura dos conteúdos armazenados.
18 18 Micael Pinho
> Assim, o projeto de dissertação aqui apresentado, teve como objetivo a análise e criação de um sistema que permitisse a criação de cópias de segurança dos conteúdos digitais armazenados. Além disso, pretende-se que as cópias possam ser enviadas para outras localizações remotas, de modo a garantir a sua consistência e integridade, para que no futuro em caso de necessidade possam ser acessíveis e reutilizáveis.
19 18 Micael Pinho
> Para a realização deste sistema, foi analisado o repositório de dados DSpace, de modo a perceber-se o seu funcionamento, e assim definir qual o melhor procedimento para a realização das cópias de segurança dos conteúdos digitais armazenados. Foi também averiguado a utilização futura das cópias de segurança geradas, em caso de necessidade de reposição dos conteúdos.
20 18 Micael Pinho
> Além disso, foi analisada a possibilidade de utilização de serviços cloud, de modo a garantir a consistência e integridade das cópias de segurança criadas, tendo-se então optado pela utilização do software open-source jclouds, que permitiu tornar abstrata a ligação com diferentes serviços cloud.
21 17 Micael Pinho
22 17 Micael Pinho
23 17 Micael Pinho
24 17 Micael Pinho
Outros:
25 17 Micael Pinho
* [[dspace|DSpace]]