ARlab RESEARCH | Digital Preservation
Upcoming SlideShare
Loading in...5
×
 

ARlab RESEARCH | Digital Preservation

on

  • 638 views

Making digital preservation easy enough for individuals, companies and general institutions.

Making digital preservation easy enough for individuals, companies and general institutions.

Statistics

Views

Total Views
638
Views on SlideShare
386
Embed Views
252

Actions

Likes
0
Downloads
2
Comments
0

2 Embeds 252

http://www.scoop.it 248
https://twitter.com 4

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

ARlab RESEARCH | Digital Preservation ARlab RESEARCH | Digital Preservation Presentation Transcript

  • LOGO
  • CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES2REMARKSPROPOSAL
  • CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES3REMARKSPROPOSAL
  • INTRODUCTION The challenge in preserving valuable digital informationis real and growing at an exponential pace4 2008: 422 Exabytes new digitalinformation was createdx2 every 18 monthshttp://www.storagenewsletter.com/news/miscellaneous/idc-digital-information-created
  • OBJECTIVES The mission of this Research is: Distribute the DP efforts Make Digital Preservation easy enough forindividuals, companies and general institutions Help to reduce the cost and increase the capacity ofmemory institutions to preserve digital informationfor the long-term As a first attempt, in this paper will lay the foundations for anew object-centric DP paradigm with AGENTS5
  • CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES6REMARKSPROPOSAL
  •  We will design agents that suit the needs of DP, introducingagency properties to the DP actors 1st  Identify actors 2nd Agentification: Applying agency properties to the actorsAGENTIFICATION (I)7 Digital Objects  resilience Users  expertise Services  scalability
  • AGENTIFICATION (II) This approaches answer three questions derived fromBerman statements: WHEN (preserving a DO and whether is affordable) isnecessary to preserve HOW (the solutions of the Users) to do WHAT (the DPServices) is necessary to be done Three approaches might coexist: AOUS (Agentificationof Objects, Users and Services)8
  • Characteristic DigitalObject(SPADO)Socialnetwork(Users)ServicesAutonomousSocial Competitive Cooperative CoopetitiveProactiveMission ? ?AGENTIFICATION (III)9
  • CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES10REMARKSPROPOSAL
  • BUCKETS Buckets were designed to imbue information objects withcertain responsibilities such: The display Dissemination Protection Maintenance As SPADOs will doNelson M. 2001, Buckets: Smart Objects for DigitalLibraries, PhD thesis, Old Dominion Univ.11
  • AGENTIFICATION OF DIGITAL OBJECTS Agents might encapsulate the versions they migrated to Their mission is to stay alive as long as possible (accessible,authentic, readable) With their own budget for attracting DP know-how and services: SPADO (Self-Preservation Aware Digital Object) Preservation paradigm with three types of agents• The digital object has the role of “caring” for itself• The users “pay” for its preservation and provide know-how for “curate” it• The DP services compete to “preserve” it Object-level preservation budget• The more interest in this DO, the morebudget it will receive and the morelikely it will be preserved12SPADOFormatRedun-dancySocialMulti-componentsBudgetMission
  • PRELIMINARY RESULTS Two evolutionary computing approaches are taken, one fromswarm intelligence and another one from genetic algorithms.13Swarm Intelligence (SI)Simulationsbased onGenetic Algorithms(GA)
  • PRELIMINARY RESULTS Two evolutionary computing approaches are taken, one fromswarm intelligence and another one from genetic algorithms.14Swarm Intelligence (SI)Simulationsbased onGenetic Algorithms(GA)
  •  Split the preservation budgetfor their operations anddescendents Descendents might have asame or different format Checksum, migration orversion charge to the budgetand being accessed by usersincrease it When a descendant run outof budget, it tries to go backto its ancestors site to getfurther DP budget15PRELIMINARY RESULTS IN SWARMINTELLIGENCE
  •  Catastrophes consist in a sudden change of a ¼ or 1/3 of the sites, becauseof an update in their software that provoke massive changes and migrationsin the format of the DOs that are there stored.MEASURE Shannon Entropy: to know whether there is enough diversity of formatsthat provide the sufficient resilience to recover back to the former state aftereach catastrophe. Being resilient means the capacity of gaining back the lost entropy.∑=⋅−=niii ppxH12log)(16PRELIMINARY RESULTS IN SWARMINTELLIGENCE
  • 17AverageentropySteps simulation The red line (execution 2) shows in average 85% of resiliencePRELIMINARY RESULTS IN SWARMINTELLIGENCECATASTROPHES
  •  Two evolutionary computing approaches are taken, one fromswarm intelligence and another one from genetic algorithms.18Swarm Intelligence (SI)Simulationsbased onGenetic Algorithms(GA)PRELIMINARY RESULTS
  •  Two evolutionary computing approaches are taken, one fromswarm intelligence and another one from genetic algorithms.19Swarm Intelligence (SI)Simulationsbased onGenetic Algorithms(GA)PRELIMINARY RESULTS
  • 20PRELIMINARY RESULTS IN GENETICALGORITHMS DOs genetic code is characterized by their formats Genetic operations: Mutation (random formatting changes) Cross (encapsulation of DO into other DO)
  •  It shows resilience, but is affected by the execution 121AveragefitnessGeneration simulation Instead of entropy, a fitness function is used to measure how adapted isthe population of DOsPRELIMINARY RESULTS IN GENETICALGORITHMSCATASTROPHES
  • VALIDATION22 This is validated with a PROTOTYPE Designed in INGENIAS (methodology) Implemented in Java
  • CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES23REMARKSPROPOSALRESILIENCE
  • AGENTIFICATION OF DP SOCIALNETWORKS Most of the work that bloggers and Web sites do on the Internetis, in fact, connecting people with other resources and people. Thisis a reference function. Libraries are trying to integrate and assimilate this “socialnetworking” world. From this level comes the need to assign at least one agent toevery contributor or consumer, every user in the social network,to automate a certain amount of knowledge exchange.24
  • AGENTIFICATION OF DP SOCIALNETWORKS This is our aim in this approach, to provide tools to helppeople developing agents and let them create a networkof agents that handle DP QAs for SPADOs. Results are in PROTAGE (PReservation Organizations usingTools in AGent Environments) project With this approach we obtain the (DP) EXPERTISE25
  • CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES26REMARKSPROPOSALRESILIENCEEXPERTISE
  • AGENTIFICATION OF DP SERVICES According to the W3C Web Services Architecture note, a WebService is an abstract notion that can be implementedby a concrete agent Our approach named "Shout and Act", a type of swarmintelligence for communication and coordination of agents isinspired by rescue robots: the files, all DOs, that needpreservation are called the “victims”. They COMPETE: to be the first at finding a DO with DPneeds They COOPERATE: when they see they cannot handle it.27
  • AGENTIFICATION OF DP SERVICES The result is a number of agents that search a users filesystem, a site for DOs28Low Medium High11Heterogeneous (varying skills)Homogeneous (combined super-skilled)HighMediumLowPerformance of homogeneous vs. heterogeneous agents vs. an exponentialgrowth of the number of digital objects. Y-axis is the qualitative averageprocessing effort per agent and x-axis is a qualitative order magnitude of thenumber of digital objects (high = 10 times medium = 100 times low)
  • CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES29REMARKSPROPOSALRESILIENCEEXPERTISESCALABILITY
  • CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES30REMARKSPROPOSAL
  • REMARKS31Comparison ofthe AOUS appr. Objects Users ServicesScalabilityExpectedto be goodImprove thesocial networksGood (ifheterogeneousagents)Resilience Good ?Expectedto be GoodOptimizationof the DP budget Proved ? ?Openness Very Good Good Still a challengeImproves DigitalPreservation Awareness Good Very Good ?Synergy with ? Web 3.0Antivirus andbackup services The proofs of concept show that resilience under tight DPbudgets and scalability are achievable DP should be taken seriously as a “killer application” of agents
  • CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES32REMARKSPROPOSAL
  • RESEARCH PROPOSAL Make Digital Objects more intelligent Make the environment where theywork more intelligent too. Previous work: Buckets33SPADOSocial networksServicesNelson M. 2001, Buckets: Smart Objects for DigitalLibraries, PhD thesis, Old Dominion Univ.
  • LOGO
  • PRELIMINARY RESULTS IN SWARMINTELLIGENCECATASTROPHEVideo format: 3 4Image format: 1 23512345The UsersDigitalObjectsand differentformatsUsers affectedby catastrophes
  • INTRODUCTION (III) In 2011, looking at what is hot on the Web and in IT development,many scientists wonder Where are all agents? And we wonder how can they be applied to Digital Preservation? We will show three approaches to an answer to thosequestions: Agentification of digital objects and the architecture of theSPADO (self-preservation aware digital objects) Agentification of the DP social networks Agentification of the preservation web services36
  • AGENTIFICATION OF DP SOCIALNETWORKS Most of the work that bloggers and Web sites do on theInternet is, in fact, connecting people with other resourcesand people. This is a reference function. Libraries are trying to integrate and assimilate this “socialnetworking” world. The changing reference world will produce new informationagents which is also a very promising and enriching trend,especially from our approach if agents were doing the job.37
  • AGENTIFICATION OF DP SOCIALNETWORKS DP questions and answers (QA) provide ways to describehow needs are defined, how people understand them, andhow questions are answered Our aim is to expand social networks through the use ofagents that reduce the burden of answering repetitivequestions Agents should link data, agents, and people to find answers. Agents should encapsulate such linking information as wellas content, and they should avoid spamming38
  • AGENTIFICATION OF DP SERVICES The teams of preservation agents comprise agents of type: A, whose main goal is to detect files as potential victims that needmigration actions B , that are fewer and slower in detecting victim than the type Aagents, though they have superior abilities to appraise and rescuevictims. They follow the shouts that type A agents emit. The shouts are of a magnitude that could be proportional tothe severity of the digital injuries of the victim. Shoutsdisappear time after being emitted, and disperse with distancein a metric created from file systems39
  • SIMULACIÓ BASADA ENALGORISMES GENÈTICS (IV)RESULTATS S’han fet també cinc execucions sobre dues configuracionsdiferents: Els resultats són avaluats segons la mitjana del fitness detots els individusFormats demodaMidapoblacióGeneracionslímitConfiguració 1 5;4;3;2 20 100Configuració 2 3;5;1;4 50 5001 2 3 4 5Valor aleatori101 2 3 4 5Valor aleatori101 2 3 4 5Valor aleatori101 2 3 4 5101 2 3 4 5Valoraleatori1040Format de moda  5Format de moda  4Format de moda  3Format de moda  2Format de moda  1
  • PRESERVACIÓ DIGITAL (II)41
  • SIMULACIÓ BASADA ENALGORISMES GENÈTICS (III) Només es tenen en compte els canvis de format i, per tant, lescatàstrofes en aquest model seran els canvis del format de moda Els cromosomes, que representaran els objectes digitals, tenenla següent estructura: La llibreria emprada per dur a terme la simulació ha estat JENES42
  • REMARKS (I) DP should be taken seriously as a killer application ofagents. If all the three agentification approaches were combined,there will result the smart DP environment necessary tosupport the SPADOs activities43
  • LOGO
  • CONTINGUTSDisseny i implementació del prototipusde preservació digitalAnàlisi del sistemaIntroduccióValidació i resultatsConclusions i treballs futurs45
  • CONTINGUTSDisseny i implementació del prototipusde preservació digitalAnàlisi del sistemaIntroduccióValidació i resultatsConclusions i treballs futurs46
  • MOTIVACIONS Està emmarcat en el projecte PRESERVA TIN-2010-17903 (Comparative approaches to the implementationof intelligent agents in digital preservation from aperspective of the automation of social networks) L’objectiu és implementar aproximacions depreservació digital mitjançant agents que treballensobre una xarxa social47
  • PRESERVACIÓ DIGITAL (I)48 La preservació digital combina les polítiques, estratègies iaccions que garanteixin laccés als continguts digitals al llargdel temps Els fitxers poden ser fàcilment destruïts o emmagatzematsen un format o suport que es torna obsolet
  • PRESERVACIÓ DIGITAL (II)49
  • OBJECTIU L’objectiu principal és desenvolupar un prototipus depreservació digital que: Permeti emular la preservació digital d’agents que representenfitxers del nostre ordinador Els agents interactuïn amb un entorn simulat que representauna xarxa social on succeeixen catàstrofes50
  • ABAST Una anàlisi del sistema basat en algorismes dintel·ligènciadeixam i algorismes genètics Un prototipus en mode emulació Una proposta de transferència tecnològica La memòria daquest projecte Els resultats que es pretenen obtenir són:51
  • CONTINGUTSDisseny i implementació del prototipusde preservació digitalAnàlisi del sistemaIntroduccióValidació i resultatsConclusions i treballs futurs52
  • ANÀLISI DEL SISTEMA Les estratègies de preservació es classifiquen en duesaproximacions: La preservació de l’entorn tecnològic (emulació) La superació de l’obsolescència dels formats de fitxers(migració) El projecte PRESERVA necessita la implementaciód’algorismes de computació evolutiva Simularem les migracions de format amb tècniques dintel·ligènciad’eixam i algorismes genètics per la seva aplicació en lapreservació digitalMuñoz, A. M., Lopez, J. A. & Caicedo, E. F., Inteligencia de enjambres:sociedades para la solución de problemas (una revisión). Ingeniería eInvestigación, 2008. 28: p. 119-130.53
  • SIMULACIONS REALITZADESIntel·ligència d’eixam(Swarm Intelligence)Simulacionsbasades enAlgorismes genètics(Genetic Algorithms)54
  • SIMULACIONS REALITZADESIntel·ligència d’eixam(Swarm Intelligence)Simulacionsbasades enAlgorismes genètics(Genetic Algorithms)55
  • SIMULACIÓ BASADA ENINTEL·LIGÈNCIA D’EIXAM (I) L’analogia emprada és la següent: Objectes digitals (vídeo o imatge) ≡ formigues Usuaris xarxa (servei de preservació)≡ aliment Ordinadors xarxa ≡ hàbitats El programa emprat ha estat Repast-Simphony56
  • SIMULACIÓ BASADA ENINTEL·LIGÈNCIA D’EIXAM (II)format={ }CATÀSTROFEFormat vídeo: 3 4Format imatge: 1 2571 2 3 4 512345Agents usuariObjectesDigitalsi els seuspossiblesformatsUsuaris afectatsper catàstrofe
  • SIMULACIÓ BASADA ENINTEL·LIGÈNCIA D’EIXAM (III)RESULTATS Entropia de Shannon: Com més alt és el valor d’entropiapreveiem millor preservabilitat  major resistència i recuperaciódavant catàstrofes∑=⋅−=niii ppxH12log)(∑ ∑= =⋅−=ni jjiji ppxH151,2, log)(∑== 51,,,kkijijiffpOn: n és el total dobjectes digitals originals j són els diferents formats que hi ha, que són 5 pi,j és el percentatge que suposen les còpies de format j respecte el total decòpies que té un objecte digital original i k són els diferents formats que hi haAdaptat alsmodels simulats58
  • RESULTATS Durada:15 anys on succeeix una catàstrofe cada 5 anys Suposant que 3 steps ≡ 1mes, hi haurà una catàstrofe cada 180steps i la simulació tindrà una duració de 540 steps S’ha executat un total de 5 vegades (estabilitat estadística)SIMULACIÓ BASADA ENINTEL·LIGÈNCIA D’EIXAM (IV)Paràmetres Model 1 Model 2Canvis de format 0,5,4;1,4,3;0,3,2 1,4,3;0,5,3;1,3,1OD associats a un usuari inicialment entre 1 i 5 entre 1 i 5Cost moure’s per la xarxa 2 2Cost quedar-se quiet 1 1Límit superior pressupost 60 60Límit inferior pressupost 20 20Cost allotjament en un usuari entre 1 i 10 entre 1 i 10Servei de preservació d’un usuari 100 100Percentatge esborrat d’usuaris 25% i 33% 25% i 33%59
  • SIMULACIÓ BASADA ENINTEL·LIGÈNCIA D’EIXAM (V)RESULTATS Model 1Esborrat del 25% d’usuaris Execució 2 mostraresilenceEsborrat del 33% d’usuaris Execució 4, després dela primera catàstrofemostra resilence60MitjanaentropiaMitjanaentropiaSteps simulacióSteps simulació
  • SIMULACIÓ BASADA ENINTEL·LIGÈNCIA D’EIXAM (VI)RESULTATS Model 2Esborrat del 25% d’usuaris Resilence interessantdesprés de la segonacatàstrofeEsborrat del 33% d’usuaris No es mostra gaireresilence61MitjanaentropiaSteps simulacióMitjanaentropiaSteps simulació
  • SIMULACIONS REALITZADESIntel·ligència d’eixam(Swarm Intelligence)Simulacionsbasades enAlgorismes genètics(Genetic Algorithms)62
  • SIMULACIONS REALITZADESIntel·ligència d’eixam(Swarm Intelligence)Simulacionsbasades enAlgorismes genètics(Genetic Algorithms)63
  • SIMULACIÓ BASADA ENALGORISMES GENÈTICS (I) La població serà de mida fixa i cada individu és unobjecte digital (format imatge, vídeo, Word, PowerPoint) Operacions genètiques: Mutacions (modificacions aleatòries de format) Creuament (encapsular objectes digitals dins d’altres)64
  • SIMULACIÓ BASADA ENALGORISMES GENÈTICS (II) La població serà de mida fixa i cada individu és unobjecte digital (format imatge, vídeo, Word, PowerPoint) Operacions genètiques: Mutacions (modificacions aleatòries de format) Creuament (encapsular objectes digitals dins d’altres)65
  • SIMULACIÓ BASADA ENALGORISMES GENÈTICS (II) La població serà de mida fixa i cada individu és unobjecte digital (format imatge, vídeo, Word, PowerPoint) Operacions genètiques: Mutacions (modificacions aleatòries de format) Creuament (encapsular objectes digitals dins d’altres)66
  • SIMULACIÓ BASADA ENALGORISMES GENÈTICS (II)SeleccióCreuamentMutacióInserció La població serà de mida fixa i cada individu és unobjecte digital (format imatge, vídeo, Word, PowerPoint) Operacions genètiques: Mutacions (modificacions aleatòries de format) Creuament (encapsular objectes digitals dins d’altres)67
  • SIMULACIÓ BASADA ENALGORISMES GENÈTICS (III) Només es tenen en compte els canvis de format i, per tant, lescatàstrofes en aquest model seran els canvis del format de moda Els cromosomes, que representaran els objectes digitals, tenenla següent estructura: La llibreria emprada per dur a terme la simulació ha estat JENES68
  • SIMULACIÓ BASADA ENALGORISMES GENÈTICS (IV)RESULTATS S’han fet també cinc execucions sobre dues configuracionsdiferents: Els resultats són avaluats segons la mitjana del fitness detots els individusFormats demodaMidapoblacióGeneracionslímitConfiguració 1 5;4;3;2 20 100Configuració 2 3;5;1;4 50 5001 2 3 4 5Valor aleatori101 2 3 4 5Valor aleatori101 2 3 4 5Valor aleatori101 2 3 4 5101 2 3 4 5Valoraleatori1069Format de moda  5Format de moda  4Format de moda  3Format de moda  2Format de moda  1
  • SIMULACIÓ BASADA ENALGORISMES GENÈTICS (V)RESULTATS Configuració 1: Mostra resilence Afectat per l’execució 170MitjanafitnessGeneracions simulació
  • SIMULACIÓ BASADA ENALGORISMES GENÈTICS (VI)RESULTATS Configuració 2: Millor resilence Mitjançant levolució, els objectes digitalssadapten als canvis de format71MitjanafitnessGeneracions simulació
  • CONCLUSIONS ANÀLISIDEL SISTEMA A aquests models evolutius implementats hem trobat uns primersindicis que corroboren la bondat per la preservació digital de: La còpia i la migració de format Lintercanvi entre amics El pressupost digital Lencapsulament dobjectes El model que hem estudiat de genètics és poc realitzable : Població fixa L’estructura rígida del cromosoma L’encapsulament limitat La mutació té força similitud a la còpia i migració en swarm descartem implementar-ho al prototipus72
  • CONTINGUTSDisseny i implementació del prototipusde preservació digitalAnàlisi del sistemaIntroduccióValidació i resultatsConclusions i treballs futurs73
  • METODOLOGIA (I) S’ha seguit la metodologia INGENIAS S’ha integrat amb la metodologia RUP (Rational UnifiedProcess) en les fases d’anàlisi i disseny L’eina emprada ha sigut INGENIAS Development Kit (IDK)74
  • METODOLOGIA (II)1234567 8975J. J. Gómez-Sanz. Modelado de Sistemas Multi-Agente. PhD thesis, Departamentode Sistemas Informáticos y Programación, Universidad Complutense Madrid, 2002.
  •  El sistema desenvolupat es divideix en dues parts bendiferenciades: La interfície d’usuari, que s’ha dissenyat orientada aobjectes El sistema d’emulació de preservació digital, que es concepcom un Sistema Multiagent que es basa en gestionar unecosistema dSPADO (Self Preservation Aware DigitalObjects)76DISSENY (I)
  • 77DISSENY (II)
  •  Les pantalles principals del prototipus són: Selecció de fitxers78IMPLEMENTACIÓ (I)
  •  Les pantalles principals del prototipus són: Configuració de la xarxa social79IMPLEMENTACIÓ (II)
  •  Les pantalles principals del prototipus són: Configuració de paràmetres80IMPLEMENTACIÓ (III)
  •  Les pantalles principals del prototipus són: Inicialització de lemulació81IMPLEMENTACIÓ (IV)
  • CONTINGUTSDisseny i implementació del prototipusde preservació digitalAnàlisi del sistemaIntroduccióValidació i resultatsConclusions i treballs futurs82
  • VALIDACIÓ (I) Es comparen els resultats obtinguts amb la simulació basada en laintel·ligència deixam S’han executat els mateixos models emprats en la simulació basada enintel·ligència deixamParàmetres Model 1 Model 2Canvis de format 0,5,4;1,4,3;0,3,21,4,3;0,5,3;1,3,1OD associats a un usuari inicialment entre 1 i 5 entre 1 i 5Cost moure’s per la xarxa 2 2Cost quedar-se quiet 1 1Límit superior pressupost 60 60Límit inferior pressupost 20 20Cost allotjament en un usuari entre 1 i 10 entre 1 i 10Servei de preservació d’un usuari 100 100Percentatge esborrat d’usuaris 25% i 33% 25% i 33%83
  • VALIDACIÓ (II) Model 1Esborrat del 33% d’usuaris El prototipus es torna acomportar molt millor que lasimulació dintel·ligènciadeixam. Resilence del prototipus ambmés “força”(16 punts mésforta)Esborrat del 25% d’usuaris Amb el prototip: méscòpies i amb mes diversitatde formats del previst en lesprimeres simulacions Resilence en les duesprimeres catàstrofes (4,9punts més intensa)84MitjanaentropiaSteps simulacióMitjanaentropiaSteps simulació
  • VALIDACIÓ (III) Model 2Esborrat del 25% d’usuaris El prototip es comportamillor, però no mostragaire resilence Catàstrofes afecten mésal prototipEsborrat del 33% d’usuaris El prototip es comportamillor, però no mostra gaireresilence85MitjanaentropiaSteps simulacióMitjanaentropiaSteps simulació
  • Requeriments ValidacióCòpia i migració de formatIntercanvi entre amicsPressupost digitalOD amb tipus (imatge, vídeo, Word, PowerPoint)OD amb tipus concret (ex: Word 2003, 2007, etc)Xarxa social basada en amicsOD amb referència al site “propietari”Succeeixen catàstrofesValoració resultats amb entropiaValidació amb•25% d’esborrats•33% d’esborratsDISCUSSIÓ SOBRE EL GRAUD’ASSOLIMENT DEL PROTOTIPUS86
  • Requeriments Validació BonusCòpia i migració de formatIntercanvi entre amicsPressupost digitalOD amb tipus (imatge, vídeo, Word, PowerPoint)OD amb tipus concret (ex: Word 2003, 2007, etc)Xarxa social basada en amicsOD amb referència al site “propietari”Succeeixen catàstrofesValoració resultats amb entropiaValidació amb•25% d’esborrats•33% d’esborratsCàlcul entropia a cada stepRecompte del número d’objectes a cada stepCàlcul de nous percentatges per fer experimentacióDISCUSSIÓ SOBRE EL GRAUD’ASSOLIMENT DEL PROTOTIPUS87
  • VÍDEO DEMO PROTOTIPUS88
  • NOUS EXPERIMENTS AMB ELPROTOTIPUS (I)ESTADÍSTICS Percentatge d’objectes digitals salvats. Entre el 81.91% i el96.79% d’objectes salvats89
  • NOUS EXPERIMENTS AMB ELPROTOTIPUS (II)ESTADÍSTICS Percentatge d’objectes digitals que tenen una còpia compatibleal site que corresponen. Entre el 63.59% i el 77.35%90
  • CONTINGUTSDisseny i implementació del prototipusde preservació digitalAnàlisi del sistemaIntroduccióValidació i resultatsConclusions i treballs futurs91
  • CONCLUSIONS (I) Sha estudiat i realitzat un prototipus de preservació digitalbasat en agents que treballen sobre una xarxa social En lanàlisi s’ha fet una incursió en el món de la recercaimplementant algorismes dintel·ligència deixam i algorismesgenètics aplicats a la preservació digital Amb els coneixements adquirits en lanàlisi i de la metodologiaINGENIAS s’ha fet el disseny del sistema S’ha implementat el prototipus, un software multithread, queredueix lobsolescència i la desaparició dels objectes que tenimen lordinador, i dóna feedback a lusuari via interfície gràfica Sha validat el prototipus i podem dir que la nostra solucióproporciona noves i interessants prestacions de preservaciómostrades amb lentropia i comprovades per lalt percentatgedobjectes salvats en les emulacions realitzades9250%15%35%
  • CONCLUSIONS (II) Del treball desenvolupat en lanàlisi sha enviat a: Olvera, J. A.(2011). An Outline of The Application of Agents to DigitalPreservation and an Introduction to Self Preservation Aware DigitalObjects (acceptat). 13th European Agent Systems Summer School(EASSS 2011) Olvera, J. A. , and de la Rosa, J. L. (2011). Preliminary Study on SwarmIntelligence and Genetic Algorithms Applied to Digital Preservation(enviat). 14è Congrés Internacional de lAssociació CatalanadIntel·ligència Artificial (CCIA 2011) S’ha realitzat una proposta de transferència delsalgorismes desenvolupats en el prototipus (conclusions itreballs futurs memòria)93
  • TREBALL FUTUR Transferència a Pyramid Fer més experiments i comprovacions addicionals delprototipus Desenvolupar els algorismes, millorant-los en robustesa iescalabilitat Implementar dos versions alfa i una beta, i proves ambusuaris beta-testers Validació del software S’ha obert una línia de recerca on hi ha nombrosesmillores en la modelització i l’experimentació Simulació basada en la intel·ligència d’eixam Simulació basada en algorismes genètics94
  • LOGO