Σχετικά με την Εφαρμογή
Περιγραφή Εργασίας
Η εφαρμογή αυτή αποτελεί το τελικό project για το μάθημα ΗΥ-472 – Υπολογιστική Όραση. Στόχος ήταν η δημιουργία μιας ολοκληρωμένης εργαλειοθήκης που συνδυάζει κλασικούς αλγορίθμους όρασης με σύγχρονες τεχνικές Τεχνητής Νοημοσύνης.
Πιο συγκεκριμένα, η εφαρμογή καλύπτει τους εξής τομείς:
- Αναγνώριση Αντικειμένων (Object Detection): Εντοπισμός με χρήση χαρακτηριστικών (SIFT/ORB) αλλά και με χρήση Deep Learning μοντέλων (YOLOv8).
- Συν-Τμηματοποίηση (Co-Segmentation): Αυτόματη εύρεση κοινών αντικειμένων μεταξύ δύο διαφορετικών εικόνων χωρίς προηγούμενη εκπαίδευση.
- Ανίχνευση Αλλαγών (Change Detection): Έξυπνη σύγκριση εικόνων που αγνοεί τις αλλαγές φωτισμού και διορθώνει τη θέση της κάμερας.
- Δομική Ανάλυση (Graph Representation): Πειραματική προσέγγιση που αντιμετωπίζει την εικόνα ως Γράφο Γειτνίασης (RAG) βασισμένο σε Superpixels.
Τεχνική Υλοποίηση
Για την ανάπτυξη χρησιμοποιήθηκαν σύγχρονα εργαλεία λογισμικού:
- Frontend: Next.js & React (για γρήγορο και φιλικό περιβάλλον χρήσης).
- Backend: Python & FastAPI (για την εκτέλεση των αλγορίθμων).
- Computer Vision: OpenCV, scikit-image & Ultralytics YOLO.
- Deployment: Η εφαρμογή είναι σχεδιασμένη να τρέχει σε Docker containers.
Στοιχεία Φοιτητή
- Ονοματεπώνυμο: Μιχαήλ Γαλλιάκης
- Αριθμός Μητρώου: csdp1413
- Πρόγραμμα: ΔΠΜΣ – Επιστήμη και Μηχανική Υπολογιστών (2ο εξάμηνο)
Υπεύθυνος Μαθήματος
- Καθηγητής: Αντώνης Αργυρός
Τι μάθαμε (HY-472)
Μέσα από το μάθημα και την υλοποίηση της εργασίας, εξερευνήσαμε βασικές και προχωρημένες έννοιες της μηχανικής όρασης:
- Εξαγωγή & Ταίριασμα Χαρακτηριστικών
- Υπολογισμός Ομογραφίας & RANSAC
- Τμηματοποίηση (Segmentation)
- Θεωρία Γράφων στην Εικόνα
- Βαθιά Μάθηση (Deep Learning)
- Γεωμετρικοί Μετασχηματισμοί