Η ανάλυση συναισθημάτων αναφορών – Sentiment Analysis – θεωρείται ως η «ναυαρχίδα» υπηρεσία του web και social media monitoring, καθώς στην ακρίβειά της βασίζεται μια σειρά από σημαντικές λειτουργίες ενημέρωσης / ειδοποίησης για αναφορές που δημοσιεύονται, σε πραγματικό χρόνο.
Έχουμε καταφέρει να πετύχουμε μέχρι και 90% ακρίβεια στο sentiment analysis, υποστηριζόμενοι από εξειδικευμένους και έμπειρους Data Scientists και Data Analysts, και έχοντας αναπτύσσοντας στην ελληνική γλώσσα ξεχωριστά μοντέλα πρόβλεψης συναισθήματος ανά πελάτη.
Η ανάλυση του συναισθήματος εφαρμόζεται σε οντότητες (εταιρείες, οργανισμούς, προϊόντα, πρόσωπα) που αναφέρονται στα κείμενα με θετικό, αρνητικό ή ουδέτερο χαρακτηρισμό. Οι αλγόριθμοι μας είναι σε θέση να προσδιορίσουν τις διαφορετικές οντότητες που αναφέρονται σε ένα κείμενο, να διακρίνουν τα διαφορετικούς τρόπους γραφής μιας οντότητας (π.χ. πλήρες όνομα μιας εταιρείας ή τα αρχικά της) και συναισθηματικά φορτισμένες λέξεις που εκφράζουν θετική ή αρνητική γνώμη σε αυτές. Χρησιμοποιώντας τη συντακτική ανάλυση, είμαστε επίσης σε θέση να αποφασίσουμε για τη συναισθηματική δύναμη του κειμένου και κατά συνέπεια να συγκεντρώσουμε τις απόψεις και να καθορίσουμε τις συναισθηματικές επιπτώσεις ενός οργανισμού / μάρκας / προϊόντος.
Η διαδικασία που ακολουθούμε ολοκληρώνεται σε 4 διακριτά βήματα, τα οποία παρουσιάζονται στη συνέχεια:
Βήμα 1ο . Ανάκτηση των δεδομένων. Επεξεργαζόμενοι εκατομμύρια αναφορών από Web και Social Media, συγκεντρώνουμε τα δεδομένα που απαιτούνται, σύμφωνα με τις ανάγκες του εκάστοτε πελάτη
Βήμα 2ο . Δημιουργία data set πελάτη – εκπαίδευση μοντέλων. Η ομάδα των αναλυτών μας διαβάζει, χαρακτηρίζει και ταξινομεί σε αρνητικές, θετικές ή ουδέτερες κάποιες αναφορές για κάθε πελάτη κάνει δηλαδή την αρχική εκπαίδευση των μοντέλων. Η διαδικασία επαναλαμβάνεται σε μηνιαία ή/και καθημερινή βάση, ανάλογα με τις ανάγκες και τις ιδιαιτερότητες του κάθε έργου. Σε κάθε περίπτωση, το εκάστοτε στατιστικό δείγμα των αναφορών που χαρακτηρίζονται χειροκίνητα από τους αναλυτές μας δεν ξεπερνά το 20% του συνόλου των αναφορών.
Βήμα 3ο . Δημιουργία και δοκιμές πολλαπλών μοντέλων. Οι Data Scientists μας δημιουργούν και δοκιμάζουν πολλαπλά μοντέλα πρόβλεψης συναισθήματος. Ενδεικτικά, οι δοκιμές που κάνουμε αφορούν
- 7000 μοντέλα κλασικού machine learning. 3 βασικοί αλγόριθμοι, περίπου 50 παράμετροι ανά αλγόριθμο και 48 παραλλαγές στα δεδομένα εισόδου
- 600 μοντέλα deep learning. 3 βασικές αρχιτεκτονικές, σε τέσσερις παραλλαγές η καθεμιά τους, και 48 παραλλαγές στα δεδομένα εισόδου
- 90 γενικά μοντέλα sentiment analysis αλλά και αυτόματη προσαρμογή τους στα δεδομένα του εκάστοτε πελάτη
Βήμα 4ο . Συνδυασμός των μοντέλων. Από αυτά τα περίπου 7.690 μοντέλα, δεν επιλέγουμε απλώς το καλύτερο: Τα συνδυάζουμε μεταξύ τους, δημιουργώντας Ensemble Model για την καλύτερη απόδοση ανά κανάλι δημοσίευσης (Twitter, Facebook, Instagram, YouTube, News, Blogs, Forums)