Ανάλυση χαρακτηριστικών προϊόντων και ομαδοποίηση πελατών με μεθόδους αναλυτικής δεδομένων: μελέτη περίπτωσης μιας ηλεκτρονικής κάβας

Είναι ευρέως αποδεκτό ότι οι εταιρίες λιανικής πρέπει να είναι σε θέση να στοχεύουν με ακρίβεια και να προβλέπουν τις ανάγκες των πελατών προκειμένου να προσφέρουν τα σωστά προϊόντα, στη σωστή τιμή, τη σωστή στιγμή. Στην επίτευξη του στόχου αυτού σημαντικό ρόλο κατέχει η χρήση της αναλυτικής δεδομέν...

Full description

Saved in:
Bibliographic Details
Main Author: Φραγκουδάκη, Μαρία Καλλιόπη
Other Authors: Βασιλείου, Ευάγγελος
Language:el_GR
Published: 2024
Subjects:
Online Access:http://hdl.handle.net/11610/26046
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Είναι ευρέως αποδεκτό ότι οι εταιρίες λιανικής πρέπει να είναι σε θέση να στοχεύουν με ακρίβεια και να προβλέπουν τις ανάγκες των πελατών προκειμένου να προσφέρουν τα σωστά προϊόντα, στη σωστή τιμή, τη σωστή στιγμή. Στην επίτευξη του στόχου αυτού σημαντικό ρόλο κατέχει η χρήση της αναλυτικής δεδομένων. Η αναλυτική δεδομένων στο λιανεμπόριο είναι η διαδικασία συλλογής, επεξεργασίας και μελέτης των σχετικών δεδομένων (για παράδειγμα, πωλήσεις, χαρακτηριστικά προϊόντων, χαρακτηριστικά πελατών, αποθέματα, τιμολόγηση, κλπ.) για την ανακάλυψη τάσεων, την πρόβλεψη οικονομικών αποτελεσμάτων, την ανάλυση προσδιοριστικών παραγόντων και την αναγνώριση καταναλωτικών συνηθειών και μοτίβων. Η παραπάνω διαδικασία συνεισφέρει σημαντικά στη λήψη αποφάσεων marketing, στη βελτίωση των επιχειρηματικών διαδικασιών και στην παροχή συνολικά υψηλότερου επιπέδου εμπειρίας στον πελάτη, αποκαλύπτοντας τομείς για περαιτέρω βελτίωση και βελτιστοποίηση. Το προτεινόμενο θέμα Διπλωματικής Εργασίας ασχολείται με τη μελέτη μεθόδων μηχανικής μάθησης και την εφαρμογή τους στην ανάλυση και στη μοντελοποίηση πραγματικών δεδομένων από τον κλάδο του ηλεκτρονικού εμπορίου. Τα δεδομένα αντλούνται δευτερογενώς από τη βάση δεδομένων μίας ηλεκτρονικής κάβας με σκοπό τη διερεύνηση λύσεων και την παροχή προτάσεων σε πραγματικά προβλήματα που απασχολούν την επιχείρηση. Συγκεκριμένα, εξετάζονται δύο κύρια προβλήματα. Πρώτον, το πρόβλημα της ανάλυσης των χαρακτηριστικών των προϊόντων (attribute analysis) της κάβας και της αποδόμησης του συνολικού όγκου των πωλήσεων ενός προϊόντος σε επιμέρους κομμάτια, σύμφωνα με τη συνεισφορά κάθε χαρακτηριστικού. Εδώ βασική επιδίωξη είναι η αναγνώριση εκείνων των χαρακτηριστικών των προϊόντων που οδηγούν τις πωλήσεις, με αποτέλεσμα να μπορεί να καθοριστεί και στη συνέχεια να διαμορφωθεί ένα ανταγωνιστικό χαρτοφυλάκιο προϊόντων για την εταιρία. Δεύτερον, το πρόβλημα της αναγνώρισης του αποτυπώματος του κάθε πελάτη στο χρόνο και της ομαδοποίησης της βάσης των πελατών του καταστήματος με κριτήρια τις καταναλωτικές τους συνήθειες, την αξία των συναλλαγών τους, τα δημογραφικά τους χαρακτηριστικά, την πίστη (loyalty) τους στην εταιρία και τη θητεία (tenure) τους με αυτή. Για την υλοποίηση της διπλωματικής εργασίας χρησιμοποιούνται συστήματα διαχείρισης βάσεων δεδομένων και εφαρμόζονται τεχνικές χειρισμού δεδομένων για τη δημιουργία όψεων στο επίπεδο που απαιτείται και με την πληροφορία που είναι αναγκαία στην αντιμετώπιση του κάθε υπό μελέτη προβλήματος. Για τη διερεύνηση των ερωτημάτων της εργασίας, ανάλογα με την υποκείμενη φύση του προβλήματος ενδιαφέροντος, μελετώνται εναλλακτικές μέθοδοι με επίβλεψη (lasso regression, ridge regression) ή χωρίς επίβλεψη (k-means clustering, hierarchical clustering) για την αναγνώριση των πιο σημαντικών προσδιοριστικών παραγόντων του υπό μελέτη φαινομένου και αναπτύσσεται κατάλληλη μεθοδολογία για την εκπαίδευση των αντίστοιχων υποδειγμάτων. Συμπληρωματικά, συζητούνται τεχνικές επικύρωσης της απόδοσης των εκπαιδευμένων υποδειγμάτων, περιγράφονται εναλλακτικά τα μέτρα αξιολόγησής τους και υλοποιούνται διαδικασίες για την αναγνώριση της κατάλληλης περιοχής τιμών των παραμέτρων του κάθε υποδείγματος και τη ρύθμιση αυτών. Τέλος, επιχειρείται μια σύγκριση των υπό μελέτη μεθόδων όσον αφορά στα ιδιαίτερα χαρακτηριστικά τους και στην απόδοσή τους στο συγκεκριμένο σύνολο δεδομένων. Η ανάπτυξη όλων των παραπάνω διαδικασιών γίνεται με τη στατιστική γλώσσα προγραμματισμού R.