Για την υλοποίηση της νέας υπηρεσίας θα σχεδιαστούν και θα αναπτυχθούν μια σειρά από ψηφίδες λογισμικού που
- θα αναλύουν το πολυγλωσσικό περιεχόμενο που αναρτάται σε site ειδήσεων, στα κοινωνικά δίκτυα αλλά κ σε ανοικτά δεδομένα,
- θα εξάγουν γνώση και πληροφορίες για προϊόντα/εταιρίες και τα επιμέρους χαρακτηριστικά τους που σχολιάζονται,
- θα αναλύουν τις πηγές, την επιρροή τους και τις τάσεις που διαμορφώνουν και
- θα βοηθoύν τους συνδρομητές των υπηρεσιών να αξιολογούν την εικόνα της επιχείρησης και των προιόντων της σε διαφορετικές αγορές με διαφορετικές συνήθειες και κουλτούρες ώστε να προσαρμόζουν ανάλογα τις στρατηγικές μάρκετινγκ και επικοινωνίας.
Νευρωνικά Δίκτυα
Για τον ενιαίο χειρισμό πολυγλωσσικού περιεχομένου θα χρησιμοποιηθούν βαθιά νευρωνικά δίκτυα με διαμοιρασμένα κρυφά επίπεδα τα οποία έχουν χρησιμοποιηθεί με επιτυχία σε πολυγλωσσικά μοντέλα μεταφοράς γνώσης για SpeechToText εφαρμογές αλλά και πρόσφατες υλοποιήσεις deep learning για εξαγωγή συναισθήματος για πολλαπλά χαρακτηριστικά προϊόντων από πολυγλωσσικά κείμενα.
Language Agnostic
Θα χρησιμοποιηθεί η Αγγλική ως ενιαία γλώσσα αναφοράς για όλες τις επιμέρους γλώσσες και θα ερευνηθεί η δυνατότητα παράλληλης αυτόματης μετάφρασης σε πολλαπλές γλώσσες με χρήση μηχανικής μάθησης (Firat et al. 2016). Λόγω της απουσίας παράλληλων σωμάτων κειμένων που να καλύπτουν όλες τις περιπτώσεις πηγών που θα καλύπτει η νέα πλατφόρμα, η ανάπτυξη τεχνικών εξόρυξης γνώσης από πολυγλωσσικά σώματα κειμένων δεν είναι άμεσα εφικτή. Οι language agnostic τεχνικές δεν επαρκούν για να αντιμετωπίσουν το πρόβλημα και για τις ανάγκες του έργου θα μελετηθεί η ενσωμάτωση ενός μηχανισμού αυτόματης μετάφρασης σε διάφορα στάδια της διαδικασίας εξόρυξης γνώσης από κείμενα.
Επιχειρηματικά Δεδομένα
Τέλος, για την ανάλυση των επιχειρηματικών δεδομένων και αναφορών θα σχεδιαστούν αλγόριθμοι για την αυτόματη εξαγωγή συσχετίσεων (relations) που αποτυπώνονται μεταξύ των επιχειρήσεων .
Όσο αφορά στην ανάλυση της επιρροής των επιχειρήσεων στα κοινωνικά δίκτυα και στη διαμόρφωση της κοινής γνώμης, η οποία είναι άμεσα σχετιζόμενη με τη στρατηγική τοποθέτηση των επιχειρήσεων, θα χρησιμοποιηθούν μοντέλα ανάλυσης της δυναμικής της γνώμης στα social media και θα επεκταθούν ώστε να ενσωματώνουν την πολικότητα της γνώμης και τις ακμές εμπιστοσύνης που διαμορφώνονται στα κοινωνικά δίκτυα.
Αποτύπωση Εξαγόμενης Γνώσης
Τέλος, όσο αφορά την αποτύπωση της εξαγόμενης γνώσης και τη σύνδεσή της με πηγές ανοικτών δεδομένων θα χρησιμοποιηθούν τεχνικές όπως τα Association Link Networks που επιτρέπουν την εξαγωγή σημασιολογικών συνδέσμων μεταξύ οντοτήτων που εξάγονται από ειδησεογραφικά και άλλα κείμενα, ενώ για το χειρισμό του τεράστιου όγκου των δεδομένων που συγκεντρώνεται, η όλη λύση θα ενσωματώσει κατανεμημένες αρχιτεκτονικές και πλατφόρμες (Apache Spark, ELK stack, κλπ.) που θα επιτρέψουν την αντιμετώπιση των θεμάτων κλιμάκωσης της λύσης.
Full Development Stack
Θα αναπτυχθεί με τον τρόπο αυτό μια πλήρης στοίβα ανάπτυξης υπηρεσιών (full development stack) που θα βασίζεται σε πολυγλωσσικό περιεχόμενο από τα ειδησεογραφικά sites, τις ανοικτές πηγές δεδομένων και τα social media. Οι υπηρεσίες αυτής της στοίβας αναμένεται να προσελκύσουν τρίτες επιχειρήσεις, νεοφυείς εταιρείες, δημόσιους φορείς και ερευνητές οι οποίοι θα αναπτύξουν νέους τρόπους διαχείρισης επιχειρηματικών δεδομένων από τις πηγές που ενσωματώνει η ΠΑΛΟ, θα στήσουν νέα επιχειρηματικά μοντέλα πάνω σε αυτές, πολλαπλασιάζοντας τα οφέλη για την εταιρεία και ταυτόχρονα μεγιστοποιώντας την επιρροή των προτεινόμενων λύσεων στην επιστημονική και επιχειρηματική κοινότητα.