Pavlos Avgoustinakis: Video retrieval based on audio content from large scale...Manos Tsardoulias
The main goal of the thesis is to develop a video retrieval system based on the audio content, using deep learning techniques.
The method developed within the context of the thesis, constitutes the adjustment on the audio content of the state of the art method ViSiL. ViSiL establishes a video similarity learning architecture and captures the spatio-temporal relations between videos. The proposed method is called ViSiLaudio. In order to extract representative video descriptors, transfer learning from a convolutional neural network trained on a large scale dataset of audio events is employed. A similarity matrix is produced by compairing the descriptors of two videos, that contains the similarity scores between each time frame of the one video with each time frame of the other. This matrix is further provided to a convolutional neural network, in order to capture temporal structures in the similarity matrix between the videos. The output of the above network is summarized using Chamfer Similarity to a final similarity score between the compared videos. The proposed network is trained using the triplet loss function, that increases the similarity score between two relevant videos and decreases the similarity between videos that are irrelevant.
Ιn order to test the efficiency of ViSiLaudio on the problem of video retrieval based on audio content, annotation of the audio relations between videos on dataset FIVR-200K was carried out. Also, in terms of evaluating the proposed method, two state of the art methods are re-implemented. Regarding the new dataset that occured, method ViSiLaudio outperforms competition by 14% and 34% respectively. Also, the proposed method was evaluated on three visual based video retrieval datasets. In two of the three datasets, ViSiLaudio outperforms the competition, while on the third dataset, one of the compared methods outperforms marginally ViSiLaudio. Finally, the hypothesis audio methods in combination with visual ones can enhance the results, is investigated. This combination improves the results, but the improvement is marginal.
Το 6ο τεύχος του τεχνολογικού περιοδικού των σπουδαστών του ΙΕΚ ΔΕΛΤΑ Αθήνας. Σε αυτό το τεύχος: PFSense, Firewalls, Give me a Solution for my Laptop, Windows 10 και Office 10, Ιδιωτικότητα και Διαδίκτυο.
Back up your documents, photos, emails, music, movies, applications, and your entire system — quickly and easily!
Schedule backups to run automatically with step-by-step wizards (for Full, Incremental & Differential backups).
Disaster Recovery for complete system restores.
Local and online storage all in one.
H εικονική επιχείρηση EDUcatering είναι ένα εκπαιδευτικό πρόγραμμα που απευθύνεται κυρίως στους τελειόφοιτους μαθητές του εργαστηρίου, στο πλαίσιο της πρακτικής τους άσκησης, με στόχο την απόκτηση κοινωνικών και προ επαγγελματικών δεξιοτήτων και τη σύνδεσή τους με την εργασιακή και κοινωνική πραγματικότητα.
Το αντικείμενο της επιχείρησης ήταν η παρασκευή εδεσμάτων καλύπτοντας όλα τα γεωγραφικά διαμερίσματα της Ελλάδας, η σύνδεσή τους με στοιχεία του κάθε τόπου (κουζίνα, ιστορία, λαογραφία κλ.π.) αξιοποιώντας την έξυπνη τους συσκευασία, η διοργάνωση εκδηλώσεων μαζικής εστίασης και το σερβίρισμα των εδεσμάτων.
H εικονική επιχείρηση EDUcatering είναι ένα εκπαιδευτικό πρόγραμμα που απευθύνεται κυρίως στους τελειόφοιτους μαθητές του εργαστηρίου, στο πλαίσιο της πρακτικής τους άσκησης, με στόχο την απόκτηση κοινωνικών και προ επαγγελματικών δεξιοτήτων και τη σύνδεσή τους με την εργασιακή και κοινωνική πραγματικότητα.
Το αντικείμενο της επιχείρησης ήταν η παρασκευή εδεσμάτων καλύπτοντας όλα τα γεωγραφικά διαμερίσματα της Ελλάδας, η σύνδεσή τους με στοιχεία του κάθε τόπου (κουζίνα, ιστορία, λαογραφία κλ.π.) αξιοποιώντας την έξυπνη τους συσκευασία, η διοργάνωση εκδηλώσεων μαζικής εστίασης και το σερβίρισμα των εδεσμάτων.
Weatherman 1-hour Speed Course for Web [2024]Andreas Batsis
Εκλαϊκευμένη Διδασκαλία Μετεωρολογίας. Η συγκεκριμένη παρουσίαση παρέχει συνοπτικά το 20% της πληροφορίας σχετικά με το πως λειτουργεί ο καιρός, η οποία πληροφορία θα παρέχει στον αναγνώστη τη δυνατότητα να ερμηνεύει το 80% των καιρικών περιπτώσεων με τη χρήση ιντερνετικών εργαλείων. Η λογική της παρουσίασης βασίζεται κατά κύριο λόγο στην εφαρμογή και δευτερευόντως στην επιστημονική ερμηνεία η οποία περιορίζεται στα απολύτως απαραίτητα.
5. Ψηφιακό video Δημιουργείται : -Με ψηφιοποίηση αναλογικού video μέσω της κάρτας σύλληψης -Με χρήση τεχνολογίας DV Είσοδος Y/C ή S-Video (S-VHS, Hi8) Είσοδος Composite (VHS, 8mm) Είσοδος ήχου Είσοδος – Έξοδος ψηφιακού βίντεο-ήχου (IEEE 1394 ή FireWire)