Επιχειρήσεις και δεδομένα : Data driven ναι… αλλά να ξέρουμε τι διαβάζουμε!

Ας δούμε μερικά πολύ συνηθισμένα σημεία παρανόησης.

Συσχέτιση δεν σημαίνει αιτιότητα. Το γεγονός ότι δύο χαρακτηριστικά έχουν κάποια σχέση μεταξύ τους, δεν σημαίνει ότι η σχέση αυτή είναι σχέση αιτίας-αιτιατού. Σπεύδουμε να το υποθέσουμε επειδή οι αιτιώδεις σχέσεις είναι πολύ χρήσιμες και μας δίνουν έλεγχο. Είναι, όμως, και σπάνιες. Επειδή η κατανάλωση παγωτών συσχετίζεται θετικά με τον αριθμό εγκλημάτων σε μια περιοχή δεν σημαίνει
ότι αν απαγορευτούν τα παγωτά, θα μειωθούν τα εγκλήματα. Όχι επειδή τα δύο (κατανάλωση παγωτών-αριθμός εγκλημάτων) δεν σχετίζονται, αλλά επειδή η σχέση τους δεν είναι σχέση αιτίας αιτιατού. Είναι και τα δύο αιτιατά, αποτελέσματα του ίδιου αιτίου, δηλαδή της θερμοκρασίας. Το καλοκαίρι αυξάνονται και τα δύο.Στατιστικά σημαντικό δεν σημαίνει αξιοσημείωτο. Το πρώτο είναι ένας όρος της στατιστικής που σημαίνει ότι το εύρημα που εντοπίστηκε στο δείγμα είναι ασφαλές (ποτέ σίγουρο) να υποθέσουμε ότι ισχύει και στο σύνολο του πληθυσμού που μας ενδιαφέρει. Αυτό μόνον. Ακόμα κι αν έχουμε μια σχέση αιτίας-αιτιατού, δεν σημαίνει ότι η έντασή της είναι τέτοια που να μας επιτρέπει να την αξιοποιήσουμε ή γενικότερα να αξίζει να ασχοληθούμε μαζί της. Για παράδειγμα η κατανάλωση καψαϊκίνης βοηθάει στην απώλεια λίπους. Ξέρετε κανέναν γιατρό να συστήνει στους παχύσαρκους ασθενείς του να τρώνε καυτερά; Όχι. Επειδή η σχέση είναι μεν στατιστικά σημαντική, αλλά όχι αρκετά έντονη.Ποια είναι τα όρια της σχέσης; Το εύρημα ότι δύο μεταβλητές συνδέονται με συγκεκριμένο τρόπο σε ένα δεδομένο πλαίσιο, δεν σημαίνει ότι η σχέση ισχύει σε οποιοδήποτε πλαίσιο. Έστω ότι βρέθηκε σε έρευνα ότι τα θηλυκού γένους brand names προσελκύουν περισσότερο την προσοχή των γυναικών. Αν η έρευνα έχει γίνει σε καλλυντικά, δεν σημαίνει ότι ισχύει και για τα αυτοκίνητα. Η σχέση πρέπει να διερευνηθεί εκ νέου. Με την ευκαιρία, δεν είναι όλες οι σχέσεις γραμμικές!Μια εικόνα χίλιες λέξεις, αλλά τι λέξεις; Τα γραφήματα είναι ο πιο εύκολος τρόπος να παραπλανηθεί κανείς. Για παράδειγμα, μια διαφορά 1.000 ευρώ στις πωλήσεις δύο προϊόντων μπορεί οπτικά να παρουσιαστεί από ασήμαντη έως εξαιρετικά μεγάλη. Το μόνο που χρειάζεται να κάνει κάποιος είναι να διαφοροποιήσει το εύρος των τιμών στον άξονα που την απεικονίζει. Αν οι τιμές κυμαίνονται από 50 έως 1.050, τότε η διαφορά εκτείνεται σε όλο το γράφημα και φαίνεται τεράστια. Αν οι τιμές κυμαίνονται από 0 έως 1.000.000 τότε η διαφορά δεν είναι καν διακριτή. Α, και προσοχή στα γραφήματα που δεν εμφανίζουν καν τιμές στους άξονες.Define! Το σημαντικότερο στην επικοινωνία και στην έρευνα είναι όλοι οι εμπλεκόμενοι να εννοούν το ίδιο πράγμα με την ίδια λέξη. Ειδικά στην έρευνα, είναι το στοιχείο που κάνει ένα εύρημα αξιοποιήσιμο ή μη. Τι εννοούμε για παράδειγμα «ανάμειξη (engagement) καταναλωτή»; Στη σχετική βιβλιογραφία, οι ορισμοί είναι πολλοί και πολύ διαφορετικοί μεταξύ τους. Για πολυδιάστατες έννοιες, όπως αυτή, οι ορισμοί είναι πάντα πολλοί. Για να αξιοποιήσουμε, επομένως, ευρήματα που σχετίζονται με την επιθυμητή αύξηση στην ανάμειξη, πρέπει να βεβαιωθούμε ότι οι ερευνητές μέτρησαν τη διάσταση ή τις διαστάσεις που μας ενδιαφέρουν και όχι κάτι παρεμφερές.

*Η Μαρίνα Ψιλούτσικου είναι επιστημονική υπεύθυνη του Προγράμματος «Μεθοδολογία Έρευνας σε κοινωνικές και διοικητικές επιστήμες» του Οικονομικού Πανεπιστημίου Αθηνών. Μόλις κυκλοφόρησε το βιβλίο της «Μεθοδολογία Έρευνας σε Διοικητικές Επιστήμες», το οποίο είναι διαθέσιμο στο αποθετήριο Κάλλιπος του Εθνικού Μετσόβιου Πολυτεχνείου.

Keywords
Τυχαία Θέματα
Επιχειρήσεις, Data,epicheiriseis, Data