Σχετικά με την Εφαρμογή

Περιγραφή Εργασίας

Η εφαρμογή αυτή αποτελεί το τελικό project για το μάθημα ΗΥ-472 – Υπολογιστική Όραση. Στόχος ήταν η δημιουργία μιας ολοκληρωμένης εργαλειοθήκης που συνδυάζει κλασικούς αλγορίθμους όρασης με σύγχρονες τεχνικές Τεχνητής Νοημοσύνης.

Πιο συγκεκριμένα, η εφαρμογή καλύπτει τους εξής τομείς:

  • Αναγνώριση Αντικειμένων (Object Detection): Εντοπισμός με χρήση χαρακτηριστικών (SIFT/ORB) αλλά και με χρήση Deep Learning μοντέλων (YOLOv8).
  • Συν-Τμηματοποίηση (Co-Segmentation): Αυτόματη εύρεση κοινών αντικειμένων μεταξύ δύο διαφορετικών εικόνων χωρίς προηγούμενη εκπαίδευση.
  • Ανίχνευση Αλλαγών (Change Detection): Έξυπνη σύγκριση εικόνων που αγνοεί τις αλλαγές φωτισμού και διορθώνει τη θέση της κάμερας.
  • Δομική Ανάλυση (Graph Representation): Πειραματική προσέγγιση που αντιμετωπίζει την εικόνα ως Γράφο Γειτνίασης (RAG) βασισμένο σε Superpixels.

Τεχνική Υλοποίηση

Για την ανάπτυξη χρησιμοποιήθηκαν σύγχρονα εργαλεία λογισμικού:

  • Frontend: Next.js & React (για γρήγορο και φιλικό περιβάλλον χρήσης).
  • Backend: Python & FastAPI (για την εκτέλεση των αλγορίθμων).
  • Computer Vision: OpenCV, scikit-image & Ultralytics YOLO.
  • Deployment: Η εφαρμογή είναι σχεδιασμένη να τρέχει σε Docker containers.

Στοιχεία Φοιτητή

  • Ονοματεπώνυμο: Μιχαήλ Γαλλιάκης
  • Αριθμός Μητρώου: csdp1413
  • Πρόγραμμα: ΔΠΜΣ – Επιστήμη και Μηχανική Υπολογιστών (2ο εξάμηνο)

Υπεύθυνος Μαθήματος

  • Καθηγητής: Αντώνης Αργυρός

Τι μάθαμε (HY-472)

Μέσα από το μάθημα και την υλοποίηση της εργασίας, εξερευνήσαμε βασικές και προχωρημένες έννοιες της μηχανικής όρασης:

  • Εξαγωγή & Ταίριασμα Χαρακτηριστικών
  • Υπολογισμός Ομογραφίας & RANSAC
  • Τμηματοποίηση (Segmentation)
  • Θεωρία Γράφων στην Εικόνα
  • Βαθιά Μάθηση (Deep Learning)
  • Γεωμετρικοί Μετασχηματισμοί