Η νοηματική γλώσσα (ΝΓ) αποτελεί τη βασική γλώσσα επικοινωνίας για άτομα με προβλήματα ακοής. Η πρόσβαση στην επικοινωνία μέσω της γλώσσας είναι ουσιώδης για την εκπλήρωση βασικών ανθρώπινων αναγκών, ωστόσο στην περίπτωση της ΝΓ υπάρχει σημαντικό κενό στην προσφορά διερμηνέων, που συχνά επιφυλάσσει μέχρι και κινδύνους για τους χρήστες της σε περίπτωση έκτακτων και σοβαρών περιστατικών υγείας.
To HealthSign προτείνει την υλοποίηση μιας εφαρμογής αυτόματης διερμηνείας της Ελληνικής Νοηματικής Γλώσσας (ΕΝΓ) μέσω διαδικτύου με έμφαση στις υπηρεσίες υγείας. Οι υπηρεσίες υγείας είναι οι συνηθέστερες περιπτώσεις για τις οποίες οι κωφοί αναζητούν διερμηνείς και πολλές φορές η ζήτηση παραμένει ανικανοποίητη ή απαιτεί μεγάλη αναμονή. Tαυτόχρονα η δυνατότητα κάποιος κωφός να έχει άμεση πρόσβαση σε ιατρικό/νοσηλευτικό προσωπικό με ταυτόχρονη διερμηνεία αναμένεται να έχει σημαντικά οφέλη στην ασφάλεια και στην κοινωνική ενσωμάτωση των κωφών.
Η οπτική πληροφορία είναι ίσως η μόνη που μπορεί να έχει πρακτική εφαρμογή στο συγκεκριμένο πρόβλημα διότι (α) μόνο αυτή μπορεί να απεικονίσει τις σωματικές κινήσεις που παρέχουν σημαντικές πληροφορίες για τη νοηματική γλώσσα, (β) οι φορητές συσκευές που περιλαμβάνουν οπτικούς αισθητήρες είναι ευρύτατα διαθέσιμες και εύχρηστες και (γ) οι τελευταίες εξελίξεις στο επιστημονικό πεδίο της τεχνητής όρασης και της μηχανικής μάθησης καθιστούν πλέον την αναγνώριση ρεαλιστική (δ) υπάρχει δυνατότητα επεξεργασίας οπτικών δεδομένων σε φορητές συσκευές που έχουν πλέον αποκτήσει υπολογίσιμη ισχύ.
Σ1: Δημιουργία βάσης δεδομένων βίντεο της ΕΝΓ από πραγματικούς χρήστες (κωφούς) με έμφαση σε περιεχόμενο που σχετίζεται με προβλήματα υγείας.
Σ2: Υλοποίηση διαδικτυακής πλατφόρμας για επικοινωνία με φορητές συσκευές, που θα επιτρέπει την σύγχρονη επικοινωνία κωφών με ιατρικό/νοσηλευτικό προσωπικό για έκτακτα ή μη περιστατικά και επεξεργασία σε διακομιστή.
Σ3: Παράλληλη υλοποίηση μιας πιο «ελαφριάς» έκδοσης αναγνώρισης ΕΝΓ σε ενσωματωμένη πλατφόρμα ώστε σημαντικό μέρος της επεξεργασίας να εκτελείται στην κινητή συσκευή με στόχο την μείωση των καθυστερήσεων λόγω μεταφοράς πάνω από αργά δίκτυα.
Σ4: Υλοποίηση λογισμικού για την αναγνώριση φράσεων της ΕΝΓ βασισμένο σε τεχνικές μηχανικής μάθησης και τεχνητής όρασης. Θα λαμβάνονται υπόψη οι σχηματισμοί των χεριών, αλλά και οι εκφράσεις του προσώπου συνδυάζοντας μοντέλα του ανθρώπινου σώματος με μοντέλα βαθειάς μάθησης για βέλτιστη εκπαίδευση και λειτουργία σε πραγματικό χρόνο.
Σ5: Μεταφορά του μοντέλου διερμηνείας ΕΝΓ πάνω σε φορητές συσκευές με χρήση της τεχνολογίας FPGA, έπειτα από κατάλληλες τροποποιήσεις.
Σ6: Βασικός στόχος είναι η οικονομική βιωσιμότητα της παρεχόμενης υπηρεσίας. Ο στόχος θα επιτευχθεί μέσω (α) χρήσης ελάχιστου εξοπλισμού από την πλευρά των χρηστών (προσωπικό υγείας/κωφών) (β) αποδοτικής υλοποίησης αλγορίθμων ώστε να είναι εφικτή η επεξεργασία χωρίς υπέρογκο υπολογιστικό κόστος (γ) απλοποίησης στο ελάχιστο κόστος της διαδικασίας εγκατάστασης της εφαρμογής στο χρήστη και (δ) ανάπτυξης ανταγωνιστικού επιχειρηματικού μοντέλου χρέωσης των παρεχόμενων υπηρεσιών.
E. - V. Pikoulis, Bifis, A., Trigka, M., Constantinopoulos, C., and Kosmopoulos, D., "Context-Aware Automatic Sign Language Video Transcription in Psychiatric Interviews", Sensors, vol. 22, no. 7, p. 2656, 2022 DOI: https://doi.org/10.3390/s22072656
Bifis, A., Trigka, M., Dedegkika, S., Goula, P., Constantinopoulos, C. and Kosmopoulos, D., "A Hierarchical Ontology for Dialogue Acts in Psychiatric Interviews", The 14th PErvasive Technologies Related to Assistive Environments Conference, PETRA 2021, June 29-2 July, Corfu, Greece 2021. DOI: https://doi.org/10.1145/3453892.3461349
E. Sartinas, Psarakis, E., Antzakas, K., and Kosmopoulos, D., "A 2-D Wrist Motion Based Sign Language Video Summarization", British Machine Vision Conference - ORAL PRESENTATION. 2021
D. Kosmopoulos, Oikonomidis, I., Konstantinopoulos, K., Arvanitis, N., Antzakas, K., Bifis, A., Lydakis, G., Roussos, A., and Argyros, A., "Towards a visual Sign Language dataset for home care services", The 15th IEEE International Conference on Face and Gesture Recognition, vol. 1. pp. 622-626, 2020. DOI: https://doi.org/10.1109/FG47880.2020.00099
C. Constantinopoulos, D. Kosmopoulos, A. Argyros, I. Oikonomidis, V. Lampropoulou, K. Antzakas, C. Panagopoulos, A. Menychtas, and C. Theoharatos, "The HealthSign project, current state and future activities", The 10th International Conference on Information, Intelligence, Systems and Applications ”, IISA 2019, Patras, Greece, 15-17 July 2019.
D. Kastaniotis, D. Tsourounis, A. Koureleas, B. Peev, C. Theoharatos, and S. Fotopoulos, “Lip reading in Greek words at unconstrained driving scenario”, The 10th International Conference on Information, Intelligence, Systems and Applications ”, IISA 2019, Patras, Greece, 15-17 July 2019.
N. Arvanitis, C. Constantinopoulos, D. Kosmopoulos, "Translation of Sign Language Glosses to Text Using Sequence-to-Sequence Attention Models", The 15th International Conference on Signal Image Technology & Internet based Systems, SITIS 2019.
V. Nicodemou, I. Oikonomidis, A. Argyros, “Single-shot 3D hand pose estimation using radial basis function networks trained on synthetic data”, Pattern Anal Applic, 1-14, 2019, https://doi.org/10.1007/s10044-019-00801-7
F. Gouidis, P. Panteleris, I. Oikonomidis, A. Argyros, “Accurate Hand Keypoint Localization on Mobile Devices”, Machine Vision Applications (MVA 2019), Tokyo, Japan, May, 2019.
D. Kosmopoulos, "A Prototype Towards Modeling Visual Data Using Decentralized Generative Adversarial Networks," 2018 25th IEEE International Conference on Image Processing (ICIP), Athens, 2018, pp. 4163-4167. doi: 10.1109/ICIP.2018.8451471
D. Kosmopoulos, A. Argyros, C. Theoharatos, V. Lambropoulou, C. Panagopoulos, and I. Maglogiannis. 2018. "The HealthSign Project: Vision and Objectives", In Proceedings of the 11th PErvasive Technologies Related to Assistive Environments Conference (PETRA '18). ACM, New York, NY, USA, 502-506. DOI: https://doi.org/10.1145/3197768.3201547
Το εργαστήριο Επεξεργασίας Σημάτων και Τηλεπικοινωνιών (ΕΕΣΤ) είναι ένα εργαστήριο του τμήματος Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής (ΤΜΗΥΠ), του Πανεπιστημίου Πατρών. Το εργαστήριο παρουσιάζει ερευνητική δραστηριότητα σε διάφορους τομείς, όπως η Επεξεργασία σημάτων για Τηλεπικοινωνίες, τα Δίκτυα Αισθητήρων, η Αναγνώριση Συστημάτων κ.ο.κ.
Το Ινστιτούτο Πληροφορικής (ΙΠ), ένα από τα έξι ερευνητικά Ινστιτούτα του Ιδρύματος Τεχνολογίας και Έρευνας (ΙΤΕ), διεξάγει βασική και εφαρμοσμένη έρευνα στην ευρύτερη περιοχή της Επιστήμης και Μηχανικής των Υπολογιστών, και διαδραματίζει πρωταγωνιστικό ρόλο στην ανάπτυξη της Κοινωνίας της Πληροφορίας σε εθνικό και διεθνές επίπεδο.
Η IRIDA Labs γεφυρώνει το κενό μεταξύ κάμερας και ανθρώπινου ματιού, φέρνοντας οπτική αντίληψη σε κάθε συσκευή. Αναπτύσουν λογισμικό Υπολογιστικής Όρασης, χρησιμοποιώντας Επεξεργασία Εικόνας και Μηχανική Μάθηση, για κάθε CPU/GPU ή DSP/ASP πλατφόρμα, μέσω τεχνικών Ετερογενούς προγραμματισμού.
Η Bιοαρωγή ιδρύθηκε το 2013 και είναι ελληνική εταιρεία υπηρεσιών ICT που απευθύνεται σε ηλικιωμένους, χρόνιους ασθενείς και γενικότερα άτομα που χρήζουν βοήθειας. Σκοπός της εταιρείας είναι η έρευνα, ο σχεδιασμός και η μελέτη για συστήματα απομακρυσμένης παρακολούθησης και υποστήριξη της υγείας κι ευεξίας.
Η Μονάδα Αγωγής Κωφών του Πανεπιστημίου Πατρών ανήκει στο Εργαστήριο Παιδαγωγικής Έρευνας του Παιδαγωγικού Τμήματος Δημοτικής Εκπαίδευσης. Άρχισε να λειτουργεί το 1994 και είναι η μοναδική στην Ελλάδα ερευνητική μονάδα σε ΑΕΙ που παρέχει έρευνα στο αντικείμενο της γλωσσολογίας της νοηματικής γλώσσας, καθώς και της εκπαίδευσης και αποκατάστασης κωφών και βαρηκόων ατόμων.