Creating an Open Archival Information System compliant archive for CERNISSEL
Nowadays, we constantly produce data in an unprecedented scale at various do mains. In the context of research data, large organizations, like CERN, produce information which is of significant importance and which cannot be reproduced in the future. It is therefore our responsibility to make sure that this information is preserved in a way that it will be available to the future generations.
This challenge, which is broadly referred to as digital preservation, has drawn the attention of several researchers and led to the design of a standard for long-term dig ital data storage, known as the Open Archival Information System (OAIS) standard. Several systems have been developed towards this direction, however these solu tions were either not fully-compliant with the OAIS standard, some were short term projects that have been decommissioned or they were not open-source and available to the research community. In this context, CERN proposed the Digital Memory project, a digital archiving initiative that should allow researchers to archive their data in a way that it will be accessible in the future.
In this thesis, which is part of the Digital Memory project, we confront the afore mentioned challenges by proposing an architecture that is fully OAIS-compliant, is integrated with CERN repositories and supports transparency, as the user can easily manage and monitor the actions performed on archival packages. Initially, we implement a tool that can be used to harvest data from various CERN sources like CDS, Indico, CERN Open Data, Gitlab and CodiMD in an OAIS-compliant format called Submission Information Package (SIP). This package can be supplied to the platform in order to create the actual archival packages that can be stored for long term preservation. These packages contain additional metadata and normalization of content that will guarantee long term survival of the information content. Additionally, we show how easy it is for a user to create, monitor and group their archives by using the User Interface. The platform can be easily deployed by anyone on Open shift with the use of Helm charts. Concerning our evaluation we discuss how the the performance of the platform can be improved and we show that the resulting packages as well as the platform as a whole is fully OAIS-compliant.
Δημιουργία ενός Ανοιχτού Αρχειακού Πληροφοριακού Συστήματος για το CERNISSEL
Στις μέρες μας, ο ρυθμός παραγωγής πληροφοριών είναι άνευ προηγουμένου. Από την ίδρυσή του, το CERN παράγει πληροφορίες που είναι σημαντικές για την επιστημονική κοινότητα και δεν μπορούν να αναπαραχθούν στο μέλλον. Είναι ευθύνη ενός οργανισμού σαν το CERN να διασφαλίσει ότι αυτές οι πληροφορίες διατηρούνται με τρόπο που θα τις κάνει διαθέσιμες στις μελλοντικές γενιές.
Το Digital Memory Project δημιουργήθηκε για να λύσει αυτό το πρόβλημα αναπτύσσοντας ένα ψηφιακό αρχείο για το CERN, συμβατό με το πρωτόκολλο Open Archival Information System (OAIS). Με τη χρήση αυτού του συστήματος, οι ερευνητές θα μπορούν να αρχειοθετούν τα δεδομένα τους τα οποία θα επεξεργάζονται και θα αποθηκεύονται με τρόπο που να μεγιστοποιεί τις πιθανότητες ότι αυτά τα δεδομένα θα είναι προσβάσιμα στο μέλλον. Σε αντίθεση με άλλα υλοποιημένα συστήματα, η προτεινόμενη λύση είναι πλήρως συμβατή με το OAIS, είναι ενσωματωμένη με υπάρχοντα αποθετήρια του CERN ενώ ο χρήστης μπορεί εύκολα να διαχειρίζεται και να παρακολουθεί τις ενέργειες που εκτελούνται σε ένα αρχειακό πακέτο. Οι διαθέσιμες λύσεις είτε δεν συμμορφώνονται πλήρως με το πρότυπο, είτε αποτελούσαν βραχυπρόθεσμα έργα που δεν συντηρούνται ή δεν είναι ανοιχτού κώδικα και διαθέσιμα με αυτό τον τρόπο στην ερευνητική κοινότητα.
Σε αυτή την εργασία, θα παρουσιάσουμε μια υλοποίηση ενός αρχείου συμβατό με το πρότυπο OAIS για το CERN. Αρχικά, υλοποιούμε ένα εργαλείο που μπορεί να χρησιμοποιηθεί για τη συλλογή δεδομένων από διάφορες πηγές του CERN όπως τα CDS, Indico, CERN Open Data, Gitlab και CodiMD σε μορφή συμβατή με το OAIS που ονομάζεται Submission Information Package (SIP). Αυτό το πακέτο μπορεί να χρησιμοποιηθεί από την πλατφόρμα προκειμένου να δημιουργηθούν τα πακέτα αρχειοθέτησης που μπορούν να αποθηκευτούν για μακροχρόνια διατήρηση. Αυτά τα πακέτα περιέχουν πρόσθετα μεταδεδομένα και κανονικοποίηση του περιεχομένου που θα εγγυηθούν τη μακροπρόθεσμη επιβίωση του περιεχομένου πληροφοριών. Επιπλέον, δείχνουμε πόσο εύκολο είναι για έναν χρήστη να δημιουργήσει, να παρακολουθεί και να ομαδοποιήσει τα αρχεία του χρησιμοποιώντας τη διεπαφή χρήστη που αναπτύχθηκε. Η πλατφόρμα μπορεί εύκολα να αναπτυχθεί και να χρησιμοποιηθεί από οποιονδήποτε μέσω του Openshift. Τέλος, συζητάμε πώς μπορεί να βελτιωθεί η απόδοση της πλατφόρμας και δείχνουμε ότι τα πακέτα που προκύπτουν καθώς και η πλατφόρμα στο σύνολό της είναι πλήρως συμβατή με το OAIS.
Nowadays, the concept of software has prevailed in all aspects of human daily life, offering
significant solutions to a wide variety of issues. The need for producing reliable and functional
software within short timeframes that can adapt to possible changes is constantly increasing.
In recent years, there has been significant research activity in the field of software
development process optimization, while the vast availability of open-source software projects
in repositories such as GitHub makes accessing large volumes of code data easy. Leveraging
this information can serve as a catalyst for creating useful tools that can greatly accelerate the
software development process while improving communication and collaboration among
development teams.
This thesis presents an integrated system for automated source code formatting using
machine learning techniques. The primary goal of the system is to detect and correct
formatting errors that deviate from the standards set by the development team, ensuring its
readability and thus facilitating easier maintenance. The system utilizes LSTM deep neural
network models in combination with N-gram statistical language models for detecting
formatting errors, while a specific mechanism for correcting these errors is proposed.
Additionally, an evaluation mechanism for code formatting is proposed, aiming to quantify this
abstract concept.
The system designed within the scope of this thesis is evaluated on 8000 Java code files
obtained from the CodRep 2019 competition. Through the observation of the final results, we
conclude that the system performs effectively in both detecting and correcting formatting
errors.
Μιχάλης Σφακάκης (Εθνικό Κέντρο Τεκμηρίωσης): "Συλλογικοί Κατάλογοι & Διαδίκτυο"
Στο πλαίσιο της υλοποίησης του έργου "Συλλογικός Κατάλογος Δημοσίων Βιβλιοθηκών" πραγματοποιήθηκε η ημερίδα με θέμα:
¨Συνεργασίες λαϊκών βιβλιοθηκών
Εργαλεία, πρότυπα και συλλογικοί κατάλογοι"
Λιβαδειά, Συνεδριακό Κέντρο Κρύας - 24 Νοεμβρίου 2006
Το 7ο κεφάλαιο στο μάθημα Τεχνολογία Δικτύων Επικοινωνιών του τομέα Ηλεκτρονικής και ειδικότητας Ηλεκτρονικών Υπολογιστικών Συστημάτων και Δικτύων, Γ’ τάξη ΕΠΑΛ.
Η παρουσίαση αυτή (PTT in PDF) είναι ενεργή, συνοδεύεται από κάποια αρχεία τα οποία συνδέονται με υπερσυνδέσεις. Περισσότερες πληροφορίες στην σελίδα http://www.ilektronikoi.gr/index.php?act=viewCat&catId=19
Creating an Open Archival Information System compliant archive for CERNISSEL
Nowadays, we constantly produce data in an unprecedented scale at various do mains. In the context of research data, large organizations, like CERN, produce information which is of significant importance and which cannot be reproduced in the future. It is therefore our responsibility to make sure that this information is preserved in a way that it will be available to the future generations.
This challenge, which is broadly referred to as digital preservation, has drawn the attention of several researchers and led to the design of a standard for long-term dig ital data storage, known as the Open Archival Information System (OAIS) standard. Several systems have been developed towards this direction, however these solu tions were either not fully-compliant with the OAIS standard, some were short term projects that have been decommissioned or they were not open-source and available to the research community. In this context, CERN proposed the Digital Memory project, a digital archiving initiative that should allow researchers to archive their data in a way that it will be accessible in the future.
In this thesis, which is part of the Digital Memory project, we confront the afore mentioned challenges by proposing an architecture that is fully OAIS-compliant, is integrated with CERN repositories and supports transparency, as the user can easily manage and monitor the actions performed on archival packages. Initially, we implement a tool that can be used to harvest data from various CERN sources like CDS, Indico, CERN Open Data, Gitlab and CodiMD in an OAIS-compliant format called Submission Information Package (SIP). This package can be supplied to the platform in order to create the actual archival packages that can be stored for long term preservation. These packages contain additional metadata and normalization of content that will guarantee long term survival of the information content. Additionally, we show how easy it is for a user to create, monitor and group their archives by using the User Interface. The platform can be easily deployed by anyone on Open shift with the use of Helm charts. Concerning our evaluation we discuss how the the performance of the platform can be improved and we show that the resulting packages as well as the platform as a whole is fully OAIS-compliant.
Δημιουργία ενός Ανοιχτού Αρχειακού Πληροφοριακού Συστήματος για το CERNISSEL
Στις μέρες μας, ο ρυθμός παραγωγής πληροφοριών είναι άνευ προηγουμένου. Από την ίδρυσή του, το CERN παράγει πληροφορίες που είναι σημαντικές για την επιστημονική κοινότητα και δεν μπορούν να αναπαραχθούν στο μέλλον. Είναι ευθύνη ενός οργανισμού σαν το CERN να διασφαλίσει ότι αυτές οι πληροφορίες διατηρούνται με τρόπο που θα τις κάνει διαθέσιμες στις μελλοντικές γενιές.
Το Digital Memory Project δημιουργήθηκε για να λύσει αυτό το πρόβλημα αναπτύσσοντας ένα ψηφιακό αρχείο για το CERN, συμβατό με το πρωτόκολλο Open Archival Information System (OAIS). Με τη χρήση αυτού του συστήματος, οι ερευνητές θα μπορούν να αρχειοθετούν τα δεδομένα τους τα οποία θα επεξεργάζονται και θα αποθηκεύονται με τρόπο που να μεγιστοποιεί τις πιθανότητες ότι αυτά τα δεδομένα θα είναι προσβάσιμα στο μέλλον. Σε αντίθεση με άλλα υλοποιημένα συστήματα, η προτεινόμενη λύση είναι πλήρως συμβατή με το OAIS, είναι ενσωματωμένη με υπάρχοντα αποθετήρια του CERN ενώ ο χρήστης μπορεί εύκολα να διαχειρίζεται και να παρακολουθεί τις ενέργειες που εκτελούνται σε ένα αρχειακό πακέτο. Οι διαθέσιμες λύσεις είτε δεν συμμορφώνονται πλήρως με το πρότυπο, είτε αποτελούσαν βραχυπρόθεσμα έργα που δεν συντηρούνται ή δεν είναι ανοιχτού κώδικα και διαθέσιμα με αυτό τον τρόπο στην ερευνητική κοινότητα.
Σε αυτή την εργασία, θα παρουσιάσουμε μια υλοποίηση ενός αρχείου συμβατό με το πρότυπο OAIS για το CERN. Αρχικά, υλοποιούμε ένα εργαλείο που μπορεί να χρησιμοποιηθεί για τη συλλογή δεδομένων από διάφορες πηγές του CERN όπως τα CDS, Indico, CERN Open Data, Gitlab και CodiMD σε μορφή συμβατή με το OAIS που ονομάζεται Submission Information Package (SIP). Αυτό το πακέτο μπορεί να χρησιμοποιηθεί από την πλατφόρμα προκειμένου να δημιουργηθούν τα πακέτα αρχειοθέτησης που μπορούν να αποθηκευτούν για μακροχρόνια διατήρηση. Αυτά τα πακέτα περιέχουν πρόσθετα μεταδεδομένα και κανονικοποίηση του περιεχομένου που θα εγγυηθούν τη μακροπρόθεσμη επιβίωση του περιεχομένου πληροφοριών. Επιπλέον, δείχνουμε πόσο εύκολο είναι για έναν χρήστη να δημιουργήσει, να παρακολουθεί και να ομαδοποιήσει τα αρχεία του χρησιμοποιώντας τη διεπαφή χρήστη που αναπτύχθηκε. Η πλατφόρμα μπορεί εύκολα να αναπτυχθεί και να χρησιμοποιηθεί από οποιονδήποτε μέσω του Openshift. Τέλος, συζητάμε πώς μπορεί να βελτιωθεί η απόδοση της πλατφόρμας και δείχνουμε ότι τα πακέτα που προκύπτουν καθώς και η πλατφόρμα στο σύνολό της είναι πλήρως συμβατή με το OAIS.
Nowadays, the concept of software has prevailed in all aspects of human daily life, offering
significant solutions to a wide variety of issues. The need for producing reliable and functional
software within short timeframes that can adapt to possible changes is constantly increasing.
In recent years, there has been significant research activity in the field of software
development process optimization, while the vast availability of open-source software projects
in repositories such as GitHub makes accessing large volumes of code data easy. Leveraging
this information can serve as a catalyst for creating useful tools that can greatly accelerate the
software development process while improving communication and collaboration among
development teams.
This thesis presents an integrated system for automated source code formatting using
machine learning techniques. The primary goal of the system is to detect and correct
formatting errors that deviate from the standards set by the development team, ensuring its
readability and thus facilitating easier maintenance. The system utilizes LSTM deep neural
network models in combination with N-gram statistical language models for detecting
formatting errors, while a specific mechanism for correcting these errors is proposed.
Additionally, an evaluation mechanism for code formatting is proposed, aiming to quantify this
abstract concept.
The system designed within the scope of this thesis is evaluated on 8000 Java code files
obtained from the CodRep 2019 competition. Through the observation of the final results, we
conclude that the system performs effectively in both detecting and correcting formatting
errors.
Μιχάλης Σφακάκης (Εθνικό Κέντρο Τεκμηρίωσης): "Συλλογικοί Κατάλογοι & Διαδίκτυο"
Στο πλαίσιο της υλοποίησης του έργου "Συλλογικός Κατάλογος Δημοσίων Βιβλιοθηκών" πραγματοποιήθηκε η ημερίδα με θέμα:
¨Συνεργασίες λαϊκών βιβλιοθηκών
Εργαλεία, πρότυπα και συλλογικοί κατάλογοι"
Λιβαδειά, Συνεδριακό Κέντρο Κρύας - 24 Νοεμβρίου 2006
Το 7ο κεφάλαιο στο μάθημα Τεχνολογία Δικτύων Επικοινωνιών του τομέα Ηλεκτρονικής και ειδικότητας Ηλεκτρονικών Υπολογιστικών Συστημάτων και Δικτύων, Γ’ τάξη ΕΠΑΛ.
Η παρουσίαση αυτή (PTT in PDF) είναι ενεργή, συνοδεύεται από κάποια αρχεία τα οποία συνδέονται με υπερσυνδέσεις. Περισσότερες πληροφορίες στην σελίδα http://www.ilektronikoi.gr/index.php?act=viewCat&catId=19
Η παρουσίαση που ετοίμασε η Ε ομάδα για το πρόγραμμα Υιοθεσία Βυζαντινού "Άγιος Γεώργιος Ομορφοκκλησιάς". Συνεντεύξεις για τη συντήρηση και τη λειτουργία του ιερού Ναού.
Αρχές Οικονομικής Θεωρίας - Το γραπτό των πανελλαδικών εξετάσεωνPanagiotis Prentzas
Αρχές Οικονομικής Θεωρίας (ΑΟΘ): Τι πρέπει να προσέξουν οι υποψήφιοι κατά τη διάρκεια των πανελλαδικών εξετάσεων στη δομή των απαντήσεών τους, αλλά και στην εμφάνιση του γραπτού τους.
Μπορείτε να δείτε και τη διαδραστική παρουσίαση στο www.study4economy.edu.gr.
2. Video
Η μεγαλύτερη τάξη του κόσμου
Cisco Networking Academy
The World's Largest Classroom
3. H ακαδημία δικτύων Cisco είναι ένα παγκόσμιο
εκπαιδευτικό πρόγραμμα που διδάσκει στους
μαθητές πώς να σχεδιάσουν, να εγκαταστήσουν και
να συντηρήσουν δίκτυα ηλεκτρονικών υπολογιστών.
Το πρόγραμμα διδάσκεται σε περισσότερες από
10.000 ακαδημίες σε 170 χώρες. Οι μαθητές της
ακαδημίας δικτύων Cisco ξεπερνούν τους 1.000.000
μαθητές-σπουδαστές ετησίως.
4. Γενική περιγραφή
Σκοπός του μαθήματος
Στο τέλος του μαθήματος οι μαθητές/τριες θα είναι
ικανοί/ές να:
σχεδιάζουν
οργανώνουν
εγκαθιστούν
λειτουργούν
αξιολογούν
συντηρούν
δίκτυα μικρών και μεσαίων επιχειρήσεων καθώς και
δίκτυα μεγάλων εταιριών ή εταιριών παροχής υπηρεσιών
με τη χρήση νέων τεχνολογιών.
5. Το μάθημα γίνεται στην ελληνική γλώσσα με
ταυτόχρονη χρήση της αντίστοιχης αγγλικής
ορολογίας. Η ύλη και οι εξετάσεις είναι στα
αγγλικά, υπό μορφή ερωτήσεων/πολλαπλής
επιλογής και αντιστοίχισης, με χρήση τεχνικών
που προάγουν την κριτική σκέψη κι όχι την κενή
αποστήθιση.
6. Το μάθημα/πρόγραμμα διδάσκεται με τη χρήση
ηλεκτρονικών βιβλίων http://www.netacad.com
που περιλαμβάνουν τόσο το θεωρητικό υπόβαθρο
όσο και την πρακτική εξάσκηση μέσω
παραδειγμάτων, διαδραστικών εφαρμογών,
ασκήσεων και εργαστηριακών δραστηριοτήτων.
7. Να σημειωθεί ότι, χρησιμοποιείται ένα
υπερσύγχρονο σύστημα διαχείρισης μάθησης
(learning management system LMS), το οποίο
είναι ιδανικό για τη διαχείριση, την τεκμηρίωση,
την παρακολούθηση, την υποβολή εκθέσεων και
την παροχή υψηλής ποιότητας ηλεκτρονικής
εκπαιδευτικής τεχνολογίας (e-learning).
8. Προσφέρει εκπαίδευση βασισμένη στο Διαδίκτυο
που συνδυάζεται με εκτενή πρακτική εξάσκηση
σε εργαστήρια εφοδιασμένα με τελευταίας
τεχνολογίας δικτυακό εξοπλισμό
Ανανεώνεται και προσαρμόζεται σε κάθε αλλαγή
και εξέλιξη που προκύπτει στον τομέα των
δικτύων
Περιγραφή μαθήματος
9. Ένα μικρό δείγμα από τις ενότητες που καλύπτονται
είναι:
• Εξερεύνηση του Δικτύου (Explore the Network)
Βασικές αρχές και συστατικά για δικτύωση Η/Υ
• Ρύθμιση ενός Λειτουργικού Συστήματος Δικτύου
(Configure a Network Operating System)
Τυπικός προγραμματισμός Router και Switch
• Πρόσβαση στο Δίκτυο (Network Access)
Τρόποι σύνδεσης στο διαδίκτυο. Δημιουργία
καλωδίων δικτύου. Είδη δικτύων
Δείγμα ενοτήτων που καλύπτονται
10. Ένα μικρό δείγμα από τις ενότητες που καλύπτονται
είναι:
• IP Addressing
Διευθύνσεις δικτύου IP.
• Wireless Technologies
Ασύρματα Δίκτυα. Δημιουργία ασύρματου δικτύου
και ασφάλεια
• Basic Security
Ασφάλεια στους Η/Υ. Απειλές, μέθοδοι επίθεσης
(hacking)
Δείγμα ενοτήτων που καλύπτονται
11. Οι μαθητές που παρακολουθούν το πρόγραμμα και έχουν περάσει
με επιτυχία την τελική εξέταση της Cisco Networking Academy
έχουν τη δυνατότητα να:
• Μεταφέρουν μονάδες (credits) σε πανεπιστήμια που
αναγνωρίζουν και διδάσκουν το πρόγραμμα.
• Συνεχίσουν τις σπουδές τους σε συναφείς κλάδους, όπως
Πληροφορική, Επιστήμη Η/Υ, Μηχανική Η/Υ, τηλεπικοινωνίες
κ.λπ.
• Παρακαθίσουν σε εξωτερικές εξετάσεις που οδηγούν στην
πιστοποίηση Cisco Certified Network Associate- CCNA
(Πιστοποιημένος Συνεργάτης Δικτυακών Εφαρμογών).
• Εργοδοτηθούν άμεσα με υψηλές απολαβές στο τομέα των
δικτύων ηλεκτρονικών υπολογιστών.
Προοπτικές
12. Video που κέρδισε τη δεύτερη
θέση σε παγκόσμιο διαγωνισμό
που οργανώθηκε από τη CISCO
Cisco Classroom is simply C.I.S.C.O.wmv