Your SlideShare is downloading. ×
0
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
ARlab RESEARCH | Digital Preservation
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

ARlab RESEARCH | Digital Preservation

553

Published on

Making digital preservation easy enough for individuals, companies and general institutions.

Making digital preservation easy enough for individuals, companies and general institutions.

Published in: Technology, Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
553
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. LOGO
  • 2. CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES2REMARKSPROPOSAL
  • 3. CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES3REMARKSPROPOSAL
  • 4. INTRODUCTION The challenge in preserving valuable digital informationis real and growing at an exponential pace4 2008: 422 Exabytes new digitalinformation was createdx2 every 18 monthshttp://www.storagenewsletter.com/news/miscellaneous/idc-digital-information-created
  • 5. OBJECTIVES The mission of this Research is: Distribute the DP efforts Make Digital Preservation easy enough forindividuals, companies and general institutions Help to reduce the cost and increase the capacity ofmemory institutions to preserve digital informationfor the long-term As a first attempt, in this paper will lay the foundations for anew object-centric DP paradigm with AGENTS5
  • 6. CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES6REMARKSPROPOSAL
  • 7.  We will design agents that suit the needs of DP, introducingagency properties to the DP actors 1st  Identify actors 2nd Agentification: Applying agency properties to the actorsAGENTIFICATION (I)7 Digital Objects  resilience Users  expertise Services  scalability
  • 8. AGENTIFICATION (II) This approaches answer three questions derived fromBerman statements: WHEN (preserving a DO and whether is affordable) isnecessary to preserve HOW (the solutions of the Users) to do WHAT (the DPServices) is necessary to be done Three approaches might coexist: AOUS (Agentificationof Objects, Users and Services)8
  • 9. Characteristic DigitalObject(SPADO)Socialnetwork(Users)ServicesAutonomousSocial Competitive Cooperative CoopetitiveProactiveMission ? ?AGENTIFICATION (III)9
  • 10. CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES10REMARKSPROPOSAL
  • 11. BUCKETS Buckets were designed to imbue information objects withcertain responsibilities such: The display Dissemination Protection Maintenance As SPADOs will doNelson M. 2001, Buckets: Smart Objects for DigitalLibraries, PhD thesis, Old Dominion Univ.11
  • 12. AGENTIFICATION OF DIGITAL OBJECTS Agents might encapsulate the versions they migrated to Their mission is to stay alive as long as possible (accessible,authentic, readable) With their own budget for attracting DP know-how and services: SPADO (Self-Preservation Aware Digital Object) Preservation paradigm with three types of agents• The digital object has the role of “caring” for itself• The users “pay” for its preservation and provide know-how for “curate” it• The DP services compete to “preserve” it Object-level preservation budget• The more interest in this DO, the morebudget it will receive and the morelikely it will be preserved12SPADOFormatRedun-dancySocialMulti-componentsBudgetMission
  • 13. PRELIMINARY RESULTS Two evolutionary computing approaches are taken, one fromswarm intelligence and another one from genetic algorithms.13Swarm Intelligence (SI)Simulationsbased onGenetic Algorithms(GA)
  • 14. PRELIMINARY RESULTS Two evolutionary computing approaches are taken, one fromswarm intelligence and another one from genetic algorithms.14Swarm Intelligence (SI)Simulationsbased onGenetic Algorithms(GA)
  • 15.  Split the preservation budgetfor their operations anddescendents Descendents might have asame or different format Checksum, migration orversion charge to the budgetand being accessed by usersincrease it When a descendant run outof budget, it tries to go backto its ancestors site to getfurther DP budget15PRELIMINARY RESULTS IN SWARMINTELLIGENCE
  • 16.  Catastrophes consist in a sudden change of a ¼ or 1/3 of the sites, becauseof an update in their software that provoke massive changes and migrationsin the format of the DOs that are there stored.MEASURE Shannon Entropy: to know whether there is enough diversity of formatsthat provide the sufficient resilience to recover back to the former state aftereach catastrophe. Being resilient means the capacity of gaining back the lost entropy.∑=⋅−=niii ppxH12log)(16PRELIMINARY RESULTS IN SWARMINTELLIGENCE
  • 17. 17AverageentropySteps simulation The red line (execution 2) shows in average 85% of resiliencePRELIMINARY RESULTS IN SWARMINTELLIGENCECATASTROPHES
  • 18.  Two evolutionary computing approaches are taken, one fromswarm intelligence and another one from genetic algorithms.18Swarm Intelligence (SI)Simulationsbased onGenetic Algorithms(GA)PRELIMINARY RESULTS
  • 19.  Two evolutionary computing approaches are taken, one fromswarm intelligence and another one from genetic algorithms.19Swarm Intelligence (SI)Simulationsbased onGenetic Algorithms(GA)PRELIMINARY RESULTS
  • 20. 20PRELIMINARY RESULTS IN GENETICALGORITHMS DOs genetic code is characterized by their formats Genetic operations: Mutation (random formatting changes) Cross (encapsulation of DO into other DO)
  • 21.  It shows resilience, but is affected by the execution 121AveragefitnessGeneration simulation Instead of entropy, a fitness function is used to measure how adapted isthe population of DOsPRELIMINARY RESULTS IN GENETICALGORITHMSCATASTROPHES
  • 22. VALIDATION22 This is validated with a PROTOTYPE Designed in INGENIAS (methodology) Implemented in Java
  • 23. CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES23REMARKSPROPOSALRESILIENCE
  • 24. AGENTIFICATION OF DP SOCIALNETWORKS Most of the work that bloggers and Web sites do on the Internetis, in fact, connecting people with other resources and people. Thisis a reference function. Libraries are trying to integrate and assimilate this “socialnetworking” world. From this level comes the need to assign at least one agent toevery contributor or consumer, every user in the social network,to automate a certain amount of knowledge exchange.24
  • 25. AGENTIFICATION OF DP SOCIALNETWORKS This is our aim in this approach, to provide tools to helppeople developing agents and let them create a networkof agents that handle DP QAs for SPADOs. Results are in PROTAGE (PReservation Organizations usingTools in AGent Environments) project With this approach we obtain the (DP) EXPERTISE25
  • 26. CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES26REMARKSPROPOSALRESILIENCEEXPERTISE
  • 27. AGENTIFICATION OF DP SERVICES According to the W3C Web Services Architecture note, a WebService is an abstract notion that can be implementedby a concrete agent Our approach named "Shout and Act", a type of swarmintelligence for communication and coordination of agents isinspired by rescue robots: the files, all DOs, that needpreservation are called the “victims”. They COMPETE: to be the first at finding a DO with DPneeds They COOPERATE: when they see they cannot handle it.27
  • 28. AGENTIFICATION OF DP SERVICES The result is a number of agents that search a users filesystem, a site for DOs28Low Medium High11Heterogeneous (varying skills)Homogeneous (combined super-skilled)HighMediumLowPerformance of homogeneous vs. heterogeneous agents vs. an exponentialgrowth of the number of digital objects. Y-axis is the qualitative averageprocessing effort per agent and x-axis is a qualitative order magnitude of thenumber of digital objects (high = 10 times medium = 100 times low)
  • 29. CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES29REMARKSPROPOSALRESILIENCEEXPERTISESCALABILITY
  • 30. CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES30REMARKSPROPOSAL
  • 31. REMARKS31Comparison ofthe AOUS appr. Objects Users ServicesScalabilityExpectedto be goodImprove thesocial networksGood (ifheterogeneousagents)Resilience Good ?Expectedto be GoodOptimizationof the DP budget Proved ? ?Openness Very Good Good Still a challengeImproves DigitalPreservation Awareness Good Very Good ?Synergy with ? Web 3.0Antivirus andbackup services The proofs of concept show that resilience under tight DPbudgets and scalability are achievable DP should be taken seriously as a “killer application” of agents
  • 32. CONTENTSAGENTIFICATION OF DIGITAL OBJECTSAGENTIFICATIONINTRODUCTIONAGENTIFICATION OF DP SOCIAL NETWORKSAGENTIFICATION OF DP SERVICES32REMARKSPROPOSAL
  • 33. RESEARCH PROPOSAL Make Digital Objects more intelligent Make the environment where theywork more intelligent too. Previous work: Buckets33SPADOSocial networksServicesNelson M. 2001, Buckets: Smart Objects for DigitalLibraries, PhD thesis, Old Dominion Univ.
  • 34. LOGO
  • 35. PRELIMINARY RESULTS IN SWARMINTELLIGENCECATASTROPHEVideo format: 3 4Image format: 1 23512345The UsersDigitalObjectsand differentformatsUsers affectedby catastrophes
  • 36. INTRODUCTION (III) In 2011, looking at what is hot on the Web and in IT development,many scientists wonder Where are all agents? And we wonder how can they be applied to Digital Preservation? We will show three approaches to an answer to thosequestions: Agentification of digital objects and the architecture of theSPADO (self-preservation aware digital objects) Agentification of the DP social networks Agentification of the preservation web services36
  • 37. AGENTIFICATION OF DP SOCIALNETWORKS Most of the work that bloggers and Web sites do on theInternet is, in fact, connecting people with other resourcesand people. This is a reference function. Libraries are trying to integrate and assimilate this “socialnetworking” world. The changing reference world will produce new informationagents which is also a very promising and enriching trend,especially from our approach if agents were doing the job.37
  • 38. AGENTIFICATION OF DP SOCIALNETWORKS DP questions and answers (QA) provide ways to describehow needs are defined, how people understand them, andhow questions are answered Our aim is to expand social networks through the use ofagents that reduce the burden of answering repetitivequestions Agents should link data, agents, and people to find answers. Agents should encapsulate such linking information as wellas content, and they should avoid spamming38
  • 39. AGENTIFICATION OF DP SERVICES The teams of preservation agents comprise agents of type: A, whose main goal is to detect files as potential victims that needmigration actions B , that are fewer and slower in detecting victim than the type Aagents, though they have superior abilities to appraise and rescuevictims. They follow the shouts that type A agents emit. The shouts are of a magnitude that could be proportional tothe severity of the digital injuries of the victim. Shoutsdisappear time after being emitted, and disperse with distancein a metric created from file systems39
  • 40. SIMULACIÓ BASADA ENALGORISMES GENÈTICS (IV)RESULTATS S’han fet també cinc execucions sobre dues configuracionsdiferents: Els resultats són avaluats segons la mitjana del fitness detots els individusFormats demodaMidapoblacióGeneracionslímitConfiguració 1 5;4;3;2 20 100Configuració 2 3;5;1;4 50 5001 2 3 4 5Valor aleatori101 2 3 4 5Valor aleatori101 2 3 4 5Valor aleatori101 2 3 4 5101 2 3 4 5Valoraleatori1040Format de moda  5Format de moda  4Format de moda  3Format de moda  2Format de moda  1
  • 41. PRESERVACIÓ DIGITAL (II)41
  • 42. SIMULACIÓ BASADA ENALGORISMES GENÈTICS (III) Només es tenen en compte els canvis de format i, per tant, lescatàstrofes en aquest model seran els canvis del format de moda Els cromosomes, que representaran els objectes digitals, tenenla següent estructura: La llibreria emprada per dur a terme la simulació ha estat JENES42
  • 43. REMARKS (I) DP should be taken seriously as a killer application ofagents. If all the three agentification approaches were combined,there will result the smart DP environment necessary tosupport the SPADOs activities43
  • 44. LOGO
  • 45. CONTINGUTSDisseny i implementació del prototipusde preservació digitalAnàlisi del sistemaIntroduccióValidació i resultatsConclusions i treballs futurs45
  • 46. CONTINGUTSDisseny i implementació del prototipusde preservació digitalAnàlisi del sistemaIntroduccióValidació i resultatsConclusions i treballs futurs46
  • 47. MOTIVACIONS Està emmarcat en el projecte PRESERVA TIN-2010-17903 (Comparative approaches to the implementationof intelligent agents in digital preservation from aperspective of the automation of social networks) L’objectiu és implementar aproximacions depreservació digital mitjançant agents que treballensobre una xarxa social47
  • 48. PRESERVACIÓ DIGITAL (I)48 La preservació digital combina les polítiques, estratègies iaccions que garanteixin laccés als continguts digitals al llargdel temps Els fitxers poden ser fàcilment destruïts o emmagatzematsen un format o suport que es torna obsolet
  • 49. PRESERVACIÓ DIGITAL (II)49
  • 50. OBJECTIU L’objectiu principal és desenvolupar un prototipus depreservació digital que: Permeti emular la preservació digital d’agents que representenfitxers del nostre ordinador Els agents interactuïn amb un entorn simulat que representauna xarxa social on succeeixen catàstrofes50
  • 51. ABAST Una anàlisi del sistema basat en algorismes dintel·ligènciadeixam i algorismes genètics Un prototipus en mode emulació Una proposta de transferència tecnològica La memòria daquest projecte Els resultats que es pretenen obtenir són:51
  • 52. CONTINGUTSDisseny i implementació del prototipusde preservació digitalAnàlisi del sistemaIntroduccióValidació i resultatsConclusions i treballs futurs52
  • 53. ANÀLISI DEL SISTEMA Les estratègies de preservació es classifiquen en duesaproximacions: La preservació de l’entorn tecnològic (emulació) La superació de l’obsolescència dels formats de fitxers(migració) El projecte PRESERVA necessita la implementaciód’algorismes de computació evolutiva Simularem les migracions de format amb tècniques dintel·ligènciad’eixam i algorismes genètics per la seva aplicació en lapreservació digitalMuñoz, A. M., Lopez, J. A. & Caicedo, E. F., Inteligencia de enjambres:sociedades para la solución de problemas (una revisión). Ingeniería eInvestigación, 2008. 28: p. 119-130.53
  • 54. SIMULACIONS REALITZADESIntel·ligència d’eixam(Swarm Intelligence)Simulacionsbasades enAlgorismes genètics(Genetic Algorithms)54
  • 55. SIMULACIONS REALITZADESIntel·ligència d’eixam(Swarm Intelligence)Simulacionsbasades enAlgorismes genètics(Genetic Algorithms)55
  • 56. SIMULACIÓ BASADA ENINTEL·LIGÈNCIA D’EIXAM (I) L’analogia emprada és la següent: Objectes digitals (vídeo o imatge) ≡ formigues Usuaris xarxa (servei de preservació)≡ aliment Ordinadors xarxa ≡ hàbitats El programa emprat ha estat Repast-Simphony56
  • 57. SIMULACIÓ BASADA ENINTEL·LIGÈNCIA D’EIXAM (II)format={ }CATÀSTROFEFormat vídeo: 3 4Format imatge: 1 2571 2 3 4 512345Agents usuariObjectesDigitalsi els seuspossiblesformatsUsuaris afectatsper catàstrofe
  • 58. SIMULACIÓ BASADA ENINTEL·LIGÈNCIA D’EIXAM (III)RESULTATS Entropia de Shannon: Com més alt és el valor d’entropiapreveiem millor preservabilitat  major resistència i recuperaciódavant catàstrofes∑=⋅−=niii ppxH12log)(∑ ∑= =⋅−=ni jjiji ppxH151,2, log)(∑== 51,,,kkijijiffpOn: n és el total dobjectes digitals originals j són els diferents formats que hi ha, que són 5 pi,j és el percentatge que suposen les còpies de format j respecte el total decòpies que té un objecte digital original i k són els diferents formats que hi haAdaptat alsmodels simulats58
  • 59. RESULTATS Durada:15 anys on succeeix una catàstrofe cada 5 anys Suposant que 3 steps ≡ 1mes, hi haurà una catàstrofe cada 180steps i la simulació tindrà una duració de 540 steps S’ha executat un total de 5 vegades (estabilitat estadística)SIMULACIÓ BASADA ENINTEL·LIGÈNCIA D’EIXAM (IV)Paràmetres Model 1 Model 2Canvis de format 0,5,4;1,4,3;0,3,2 1,4,3;0,5,3;1,3,1OD associats a un usuari inicialment entre 1 i 5 entre 1 i 5Cost moure’s per la xarxa 2 2Cost quedar-se quiet 1 1Límit superior pressupost 60 60Límit inferior pressupost 20 20Cost allotjament en un usuari entre 1 i 10 entre 1 i 10Servei de preservació d’un usuari 100 100Percentatge esborrat d’usuaris 25% i 33% 25% i 33%59
  • 60. SIMULACIÓ BASADA ENINTEL·LIGÈNCIA D’EIXAM (V)RESULTATS Model 1Esborrat del 25% d’usuaris Execució 2 mostraresilenceEsborrat del 33% d’usuaris Execució 4, després dela primera catàstrofemostra resilence60MitjanaentropiaMitjanaentropiaSteps simulacióSteps simulació
  • 61. SIMULACIÓ BASADA ENINTEL·LIGÈNCIA D’EIXAM (VI)RESULTATS Model 2Esborrat del 25% d’usuaris Resilence interessantdesprés de la segonacatàstrofeEsborrat del 33% d’usuaris No es mostra gaireresilence61MitjanaentropiaSteps simulacióMitjanaentropiaSteps simulació
  • 62. SIMULACIONS REALITZADESIntel·ligència d’eixam(Swarm Intelligence)Simulacionsbasades enAlgorismes genètics(Genetic Algorithms)62
  • 63. SIMULACIONS REALITZADESIntel·ligència d’eixam(Swarm Intelligence)Simulacionsbasades enAlgorismes genètics(Genetic Algorithms)63
  • 64. SIMULACIÓ BASADA ENALGORISMES GENÈTICS (I) La població serà de mida fixa i cada individu és unobjecte digital (format imatge, vídeo, Word, PowerPoint) Operacions genètiques: Mutacions (modificacions aleatòries de format) Creuament (encapsular objectes digitals dins d’altres)64
  • 65. SIMULACIÓ BASADA ENALGORISMES GENÈTICS (II) La població serà de mida fixa i cada individu és unobjecte digital (format imatge, vídeo, Word, PowerPoint) Operacions genètiques: Mutacions (modificacions aleatòries de format) Creuament (encapsular objectes digitals dins d’altres)65
  • 66. SIMULACIÓ BASADA ENALGORISMES GENÈTICS (II) La població serà de mida fixa i cada individu és unobjecte digital (format imatge, vídeo, Word, PowerPoint) Operacions genètiques: Mutacions (modificacions aleatòries de format) Creuament (encapsular objectes digitals dins d’altres)66
  • 67. SIMULACIÓ BASADA ENALGORISMES GENÈTICS (II)SeleccióCreuamentMutacióInserció La població serà de mida fixa i cada individu és unobjecte digital (format imatge, vídeo, Word, PowerPoint) Operacions genètiques: Mutacions (modificacions aleatòries de format) Creuament (encapsular objectes digitals dins d’altres)67
  • 68. SIMULACIÓ BASADA ENALGORISMES GENÈTICS (III) Només es tenen en compte els canvis de format i, per tant, lescatàstrofes en aquest model seran els canvis del format de moda Els cromosomes, que representaran els objectes digitals, tenenla següent estructura: La llibreria emprada per dur a terme la simulació ha estat JENES68
  • 69. SIMULACIÓ BASADA ENALGORISMES GENÈTICS (IV)RESULTATS S’han fet també cinc execucions sobre dues configuracionsdiferents: Els resultats són avaluats segons la mitjana del fitness detots els individusFormats demodaMidapoblacióGeneracionslímitConfiguració 1 5;4;3;2 20 100Configuració 2 3;5;1;4 50 5001 2 3 4 5Valor aleatori101 2 3 4 5Valor aleatori101 2 3 4 5Valor aleatori101 2 3 4 5101 2 3 4 5Valoraleatori1069Format de moda  5Format de moda  4Format de moda  3Format de moda  2Format de moda  1
  • 70. SIMULACIÓ BASADA ENALGORISMES GENÈTICS (V)RESULTATS Configuració 1: Mostra resilence Afectat per l’execució 170MitjanafitnessGeneracions simulació
  • 71. SIMULACIÓ BASADA ENALGORISMES GENÈTICS (VI)RESULTATS Configuració 2: Millor resilence Mitjançant levolució, els objectes digitalssadapten als canvis de format71MitjanafitnessGeneracions simulació
  • 72. CONCLUSIONS ANÀLISIDEL SISTEMA A aquests models evolutius implementats hem trobat uns primersindicis que corroboren la bondat per la preservació digital de: La còpia i la migració de format Lintercanvi entre amics El pressupost digital Lencapsulament dobjectes El model que hem estudiat de genètics és poc realitzable : Població fixa L’estructura rígida del cromosoma L’encapsulament limitat La mutació té força similitud a la còpia i migració en swarm descartem implementar-ho al prototipus72
  • 73. CONTINGUTSDisseny i implementació del prototipusde preservació digitalAnàlisi del sistemaIntroduccióValidació i resultatsConclusions i treballs futurs73
  • 74. METODOLOGIA (I) S’ha seguit la metodologia INGENIAS S’ha integrat amb la metodologia RUP (Rational UnifiedProcess) en les fases d’anàlisi i disseny L’eina emprada ha sigut INGENIAS Development Kit (IDK)74
  • 75. METODOLOGIA (II)1234567 8975J. J. Gómez-Sanz. Modelado de Sistemas Multi-Agente. PhD thesis, Departamentode Sistemas Informáticos y Programación, Universidad Complutense Madrid, 2002.
  • 76.  El sistema desenvolupat es divideix en dues parts bendiferenciades: La interfície d’usuari, que s’ha dissenyat orientada aobjectes El sistema d’emulació de preservació digital, que es concepcom un Sistema Multiagent que es basa en gestionar unecosistema dSPADO (Self Preservation Aware DigitalObjects)76DISSENY (I)
  • 77. 77DISSENY (II)
  • 78.  Les pantalles principals del prototipus són: Selecció de fitxers78IMPLEMENTACIÓ (I)
  • 79.  Les pantalles principals del prototipus són: Configuració de la xarxa social79IMPLEMENTACIÓ (II)
  • 80.  Les pantalles principals del prototipus són: Configuració de paràmetres80IMPLEMENTACIÓ (III)
  • 81.  Les pantalles principals del prototipus són: Inicialització de lemulació81IMPLEMENTACIÓ (IV)
  • 82. CONTINGUTSDisseny i implementació del prototipusde preservació digitalAnàlisi del sistemaIntroduccióValidació i resultatsConclusions i treballs futurs82
  • 83. VALIDACIÓ (I) Es comparen els resultats obtinguts amb la simulació basada en laintel·ligència deixam S’han executat els mateixos models emprats en la simulació basada enintel·ligència deixamParàmetres Model 1 Model 2Canvis de format 0,5,4;1,4,3;0,3,21,4,3;0,5,3;1,3,1OD associats a un usuari inicialment entre 1 i 5 entre 1 i 5Cost moure’s per la xarxa 2 2Cost quedar-se quiet 1 1Límit superior pressupost 60 60Límit inferior pressupost 20 20Cost allotjament en un usuari entre 1 i 10 entre 1 i 10Servei de preservació d’un usuari 100 100Percentatge esborrat d’usuaris 25% i 33% 25% i 33%83
  • 84. VALIDACIÓ (II) Model 1Esborrat del 33% d’usuaris El prototipus es torna acomportar molt millor que lasimulació dintel·ligènciadeixam. Resilence del prototipus ambmés “força”(16 punts mésforta)Esborrat del 25% d’usuaris Amb el prototip: méscòpies i amb mes diversitatde formats del previst en lesprimeres simulacions Resilence en les duesprimeres catàstrofes (4,9punts més intensa)84MitjanaentropiaSteps simulacióMitjanaentropiaSteps simulació
  • 85. VALIDACIÓ (III) Model 2Esborrat del 25% d’usuaris El prototip es comportamillor, però no mostragaire resilence Catàstrofes afecten mésal prototipEsborrat del 33% d’usuaris El prototip es comportamillor, però no mostra gaireresilence85MitjanaentropiaSteps simulacióMitjanaentropiaSteps simulació
  • 86. Requeriments ValidacióCòpia i migració de formatIntercanvi entre amicsPressupost digitalOD amb tipus (imatge, vídeo, Word, PowerPoint)OD amb tipus concret (ex: Word 2003, 2007, etc)Xarxa social basada en amicsOD amb referència al site “propietari”Succeeixen catàstrofesValoració resultats amb entropiaValidació amb•25% d’esborrats•33% d’esborratsDISCUSSIÓ SOBRE EL GRAUD’ASSOLIMENT DEL PROTOTIPUS86
  • 87. Requeriments Validació BonusCòpia i migració de formatIntercanvi entre amicsPressupost digitalOD amb tipus (imatge, vídeo, Word, PowerPoint)OD amb tipus concret (ex: Word 2003, 2007, etc)Xarxa social basada en amicsOD amb referència al site “propietari”Succeeixen catàstrofesValoració resultats amb entropiaValidació amb•25% d’esborrats•33% d’esborratsCàlcul entropia a cada stepRecompte del número d’objectes a cada stepCàlcul de nous percentatges per fer experimentacióDISCUSSIÓ SOBRE EL GRAUD’ASSOLIMENT DEL PROTOTIPUS87
  • 88. VÍDEO DEMO PROTOTIPUS88
  • 89. NOUS EXPERIMENTS AMB ELPROTOTIPUS (I)ESTADÍSTICS Percentatge d’objectes digitals salvats. Entre el 81.91% i el96.79% d’objectes salvats89
  • 90. NOUS EXPERIMENTS AMB ELPROTOTIPUS (II)ESTADÍSTICS Percentatge d’objectes digitals que tenen una còpia compatibleal site que corresponen. Entre el 63.59% i el 77.35%90
  • 91. CONTINGUTSDisseny i implementació del prototipusde preservació digitalAnàlisi del sistemaIntroduccióValidació i resultatsConclusions i treballs futurs91
  • 92. CONCLUSIONS (I) Sha estudiat i realitzat un prototipus de preservació digitalbasat en agents que treballen sobre una xarxa social En lanàlisi s’ha fet una incursió en el món de la recercaimplementant algorismes dintel·ligència deixam i algorismesgenètics aplicats a la preservació digital Amb els coneixements adquirits en lanàlisi i de la metodologiaINGENIAS s’ha fet el disseny del sistema S’ha implementat el prototipus, un software multithread, queredueix lobsolescència i la desaparició dels objectes que tenimen lordinador, i dóna feedback a lusuari via interfície gràfica Sha validat el prototipus i podem dir que la nostra solucióproporciona noves i interessants prestacions de preservaciómostrades amb lentropia i comprovades per lalt percentatgedobjectes salvats en les emulacions realitzades9250%15%35%
  • 93. CONCLUSIONS (II) Del treball desenvolupat en lanàlisi sha enviat a: Olvera, J. A.(2011). An Outline of The Application of Agents to DigitalPreservation and an Introduction to Self Preservation Aware DigitalObjects (acceptat). 13th European Agent Systems Summer School(EASSS 2011) Olvera, J. A. , and de la Rosa, J. L. (2011). Preliminary Study on SwarmIntelligence and Genetic Algorithms Applied to Digital Preservation(enviat). 14è Congrés Internacional de lAssociació CatalanadIntel·ligència Artificial (CCIA 2011) S’ha realitzat una proposta de transferència delsalgorismes desenvolupats en el prototipus (conclusions itreballs futurs memòria)93
  • 94. TREBALL FUTUR Transferència a Pyramid Fer més experiments i comprovacions addicionals delprototipus Desenvolupar els algorismes, millorant-los en robustesa iescalabilitat Implementar dos versions alfa i una beta, i proves ambusuaris beta-testers Validació del software S’ha obert una línia de recerca on hi ha nombrosesmillores en la modelització i l’experimentació Simulació basada en la intel·ligència d’eixam Simulació basada en algorismes genètics94
  • 95. LOGO

×