Successfully reported this slideshow.
Your SlideShare is downloading. ×

Sales forecasting using a hybrid ARIMA-LSTM model

Sales forecasting using a hybrid ARIMA-LSTM model

Download to read offline

Predicting demand of a product or service can be crucial for the well-being of most companies. Inventory planning, production scheduling, cash flow planning, decisions concerning staffing levels and other kinds of decisions can all depend on the precision of forecasts. Making these predictions as precise as possible leads to better customer service and higher satisfaction levels making the customers more likely to buy again. In addition, some kinds of costs get lower due to the prevention of unplanned emergency restocking and there is a lower possibility of excessive stock levels and unsold products. However, despite the importance of accurate demand forecasts, surveys have shown that the most used method for demand forecasting (48%) between companies in the USA depends on spreadsheets, while at the same time only 11% of the companies use specialized software. Available forecasting software uses a big variety of methods that suit the nature and category of the product and accuracy metrics are used as a way to compare different methods. The purpose of this undergraduate thesis is to develop and explore the appropriateness of an improved hybrid model, which was initially proposed to solve the problem of univariate timeseries predictions, in the case of predicting number of sales. The proposed model uses a modern neural network which has shown promising results in the lasts years compared to a classic feedforward neural network. In addition, an extra feature is used with the hope to further improve the predictions produced by the neural network.

Predicting demand of a product or service can be crucial for the well-being of most companies. Inventory planning, production scheduling, cash flow planning, decisions concerning staffing levels and other kinds of decisions can all depend on the precision of forecasts. Making these predictions as precise as possible leads to better customer service and higher satisfaction levels making the customers more likely to buy again. In addition, some kinds of costs get lower due to the prevention of unplanned emergency restocking and there is a lower possibility of excessive stock levels and unsold products. However, despite the importance of accurate demand forecasts, surveys have shown that the most used method for demand forecasting (48%) between companies in the USA depends on spreadsheets, while at the same time only 11% of the companies use specialized software. Available forecasting software uses a big variety of methods that suit the nature and category of the product and accuracy metrics are used as a way to compare different methods. The purpose of this undergraduate thesis is to develop and explore the appropriateness of an improved hybrid model, which was initially proposed to solve the problem of univariate timeseries predictions, in the case of predicting number of sales. The proposed model uses a modern neural network which has shown promising results in the lasts years compared to a classic feedforward neural network. In addition, an extra feature is used with the hope to further improve the predictions produced by the neural network.

More Related Content

More from ISSEL

Related Books

Free with a 30 day trial from Scribd

See all

Sales forecasting using a hybrid ARIMA-LSTM model

  1. 1. Πρόβλεψη πωλήσεων με την χρήση υβριδικού μοντέλου ARIMA-LSTM ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΠΛΗΡΟΦΟΡΙΩΝ ΚΑΙ ΥΠΟΛΟΓΙΣΜΩΝ Ανδρέας Σιαηλής ΑΕΜ: 8969 Επιβλέποντες: Αναπληρωτής Καθηγητής κ. Συμεωνίδης Ανδρέας Μεταδιδακτορικός ερευνητής κ. Βαβλιάκης Κωνσταντίνος
  2. 2. Εισαγωγή Ανάγκη για ακριβείς προβλέψεις του μελλοντικού αριθμού πωλήσεων: • Διαχείριση και αποθήκευση των αποθεμάτων • Χρονοδιάγραμμα της παραγωγής • Επίπεδα προσωπικού • Διαχείριση της ροής χρήματος Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού́ μοντέλου ARIMA-LSTM 2
  3. 3. Σκοπός της διπλωματικής εργασίας 1. Ανάπτυξη μιας μεθοδολογίας για την επίλυση του προβλήματος της πρόβλεψης πωλήσεων 2. Εξέταση της ακρίβειας του προτεινόμενου μοντέλου σε πραγματικά δεδομένα ηλεκτρονικού καταστήματος Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού́ μοντέλου ARIMA-LSTM 3
  4. 4. Γνώσεις που αποκτήθηκαν Γνώσεις που αποκτήθηκαν: 1. Αλγόριθμοι και μοντέλα πρόβλεψης. 2. Τεχνικές προεπεξεργασίας δεδομένων. 3. Κατανόηση του τρόπου λειτουργίας των νευρωνικών δικτύων και άλλων μοντέλων μηχανικής μάθησης. 4. Γνώσεις προγραμματισμού σε Python. Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού́ μοντέλου ARIMA-LSTM 4
  5. 5. State of the art • Τεχνικές μονοδιάστατων χρονοσειρών (Univariate) • ARIMA • Exponential smoothing • Τεχνικές πολλών μεταβλητών (Multivariate) • Ανάλυση συναισθήματος (Sentiment analysis) • Αναδρομικά νευρωνικά δίκτυα (RNN) Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού́ μοντέλου ARIMA-LSTM 5
  6. 6. Αρχιτεκτονική προτεινόμενου μοντέλου Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού́ μοντέλου ARIMA-LSTM 6 Μοντέλο ARIMA Χρονοσειρά αριθμού πωλήσεων LSTM Residuals Μέση τιμή πώλησης Πρόβλεψη Προεπεξεργασία δεδομένων Μετεπεξεργασία δεδομένων Τελική Πρόβλεψη -
  7. 7. Προεπεξεργασία δεδομένων • Συμπλήρωση ημερομηνιών με μηδενικό αριθμό πωλήσεων • Δειγματοληψία δεδομένων ανάλογα με την επιθυμητή συχνότητα • Συμπλήρωση εγγραφών με μηδενική μέση τιμή πώλησης Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού́ μοντέλου ARIMA-LSTM 7
  8. 8. Μοντέλο ARIMA Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού μοντέλου ARIMA-LSTM 8 Παράμετροι: • p : O αριθμός των όρων αυτοσησχέτισης (AR) • d : O αριθμός επαναλήψεων της διαδικασίας διαφορών • q : O αριθμός των όρων κινούμενο μέσου (MA) 𝑦𝑡 = 𝜇 + 𝜑1𝑦𝑡−1 + ⋯ + 𝜑𝑝𝑦𝑡−𝑝 + 𝜃1𝑒𝑡−1 + ⋯ + 𝜃𝑞𝑒𝑡−𝑞
  9. 9. Δίκτυο LSTM Κατάλοιπα ARIMA: 𝑒𝑡 = 𝑦𝑡 − 𝐿𝑡 Μέση τιμή πώλησης: 𝑝𝑡 Κανονικοποίηση δεδομένων στο διάστημα [0,1] 𝑥′ = 𝑥−𝑥𝑚𝑖𝑛 𝑥𝑚𝑎𝑥−𝑥𝑚𝑖𝑛 𝑒𝑡 = 𝑓 𝑒𝑡−1, 𝑒𝑡−2, … , 𝑒𝑡−𝑛, 𝑝𝑡−1,𝑝𝑡−2, … , 𝑝𝑡−𝑛 Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού μοντέλου ARIMA-LSTM 9
  10. 10. Εκπαίδευση LSTM Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού́ μοντέλου ARIMA-LSTM 10 Παράμετροι νευρωνικού Αλγόριθμος εκπαίδευσης ADAM Ρυθμός εκπαίδευσης α 0.001 𝛽1 0.9 𝛽2 0.999 Batch_size 1 Αριθμός κρυφών επιπέδων 1 Αριθμός κόμβων στο κρυφό επίπεδο 2-5 Συνάρτηση ενεργοποίησης ReLU Συνάρτηση σφάλματος Mean Absolute Error (MAE)
  11. 11. Τελική πρόβλεψη • Αποκανονικοποίηση πρόβλεψης καταλοίπων • 𝐹𝑖𝑛𝑎𝑙 𝑃𝑟𝑒𝑑𝑖𝑐𝑡𝑖𝑜𝑛𝑡 = 𝑃𝑟𝑒𝑑𝑖𝑐𝑡𝑖𝑜𝑛𝐴𝑅𝐼𝑀𝐴𝑡 − 𝑃𝑟𝑒𝑑𝑖𝑐𝑡𝑖𝑜𝑛𝐿𝑆𝑇𝑀𝑡 • Αντικατάσταση αρνητικών τιμών με μηδενικά Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού μοντέλου ARIMA-LSTM 11 Χρονική περίοδος Προβλεπόμενος αριθμός πωλήσεων 1 22.445829 2 24.904806 3 29.838589 4 31.967988 5 21.767731 6 19.095800 7 22.587238 8 18.851209 9 16.199667 10 19.368603 11 18.487763 12 20.036756
  12. 12. Πείραμα σε ηλεκτρονικό κατάστημα Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού́ μοντέλου ARIMA-LSTM 12 • Δεδομένα από την βάση δεδομένων του www.pharm24.gr • Μηνιαίος αριθμός πωλήσεων για μια χρονική περίοδο 6 ετών • 1ο - 5ο έτος δεδομένα εκπαίδευσης • 6ο έτος δεδομένα ελέγχου • Μέση τιμή πώλησης ανά μήνα
  13. 13. Αποτελέσματα (1/4) Νοέμβριος 2020 1 3 5 7 9 11 Πρόβλεψη πωλήσεων με την χρήση υβριδικού́ μοντέλου ARIMA-LSTM 13 Σύγκριση πραγματικού αριθμού πωλήσεων και προβλέψεων που προκύπτουν από διάφορες μεθοδολογίες που εξετάστηκαν για το μηνιαίο αριθμό πωλήσεων κατά το 6o έτος
  14. 14. Αποτελέσματα(2/4) Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού μοντέλου ARIMA-LSTM 14 18 2.97322794 19 0.30638699 20 -1.152747326 21 8.37058733 22 -16.14425309 23 -2.868554829 24 1.5404025 25 3.05095333 26 7.4144878 27 4.80647025 28 0.60655013 29 5.37839824 30 -54.77867641 31 10.0611442 32 -4.850205678 33 -12.31466227 34 -0.220804711 1 12.8539198 2 3.17460317 3 12.7937802 4 13.6283186 5 7.30951649 6 -5.186592736 7 -4.174460963 8 8.87916348 9 3.61948617 10 -28.55392157 11 6.0824068 12 16.1051743 13 9.31406425 14 -6.578225069 15 8.8037695 16 -2.844163539 17 1.75107528 35 9.17073171 36 -9.770744751 37 12.3340389 38 11.9222236 39 -5.235430192 40 -12.28754243 41 10.9382748 42 2.09096087 43 -2.888538576 44 -0.461174124 45 5.52445022 46 6.57364586 47 3.72371125 48 2.85176769 49 11.9209206 50 11.8340611 Ποσοστιαία βελτίωση/επιδείνωση της ακρίβειας των προβλέψεων (MSE) από το προτεινόμενο μοντέλο σε σχέση με αυτό του Zhang για τα 50 προϊόντα που εξετάστηκαν
  15. 15. Αποτελέσματα(3/4) Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού μοντέλου ARIMA-LSTM 15 MSE RMSE MAE LSTM 540.76758 13.2629 9.6883 ARIMA 466.05542 12.234 9.21864 ZHANG 438.51756 11.73782 8.76454 ARIMA-LSTM 415.44138 11.6794 8.88266 ARIMA-LSTMcp 412.74034 11.52224 8.73078 Μέση τιμή των μετρικών σφάλματος που προέκυψαν από τις διάφορες μεθοδολογίες για το σύνολο των 50 προϊόντων MSE 5.88% RMSE 1.84% MAE 0.39% Ποσοστιαία βελτίωση προτεινόμενου μοντέλου σε σχέση με το μοντέλο του Zhang
  16. 16. Αποτελέσματα(4/4) Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού μοντέλου ARIMA-LSTM 16 Ποσοστιαία βελτίωση της ακρίβειας προβλέψεων από το προτεινόμενο μοντέλο σε σχέση με το μοντέλο του Zhang για τα 10 best sellers και 10 μη δημοφιλή προϊόντα Ποσοστιαία βελτίωση της ακρίβειας προβλέψεων από το προτεινόμενο μοντέλο σε σχέση με το μοντέλο του Zhang για 10 εποχιακά προϊόντα Βest sellers Προϊόντα με χαμηλό αριθμό πωλήσεων MSE 5.81% MSE 0.27% RMSE 2.22% RMSE 0.15% MAE 1.71% MAE 0.3% MSE 4.11% RMSE 1.76% MAE 0.92%
  17. 17. Συμπεράσματα • Μεγαλύτερη ακρίβεια προτεινόμενου μοντέλου σε σχέση με τα επιμέρους μοντέλα και το μοντέλο του Zhang • Συγκριτικά μεγαλύτερη ακρίβεια πρόβλεψης στην περίπτωση των best seller προϊόντων • Εξίσου καλή ακρίβεια πρόβλεψης στα εποχιακά προϊόντα • Μεγαλύτερος χρόνος εκτέλεσης του προτεινόμενου μοντέλου σε σχέση με το μοντέλο του Zhang Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού́ μοντέλου ARIMA-LSTM 17
  18. 18. Μελλοντική Εργασία • Χρήση μεγαλύτερου αριθμού χαρακτηριστικών στην είσοδο του δικτύου LSTM • Σύγκριση ακρίβειας με εναλλακτικές μεθοδολογίες πρόβλεψης πωλήσεων Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού́ μοντέλου ARIMA-LSTM 18
  19. 19. Ευχαριστίες Ευχαριστώ θερμά: • Τον Αναπληρωτή Καθηγητή Ανδρέα Συμεωνίδη • Τον Μεταδιδακτορικό Ερευνητή Κωνσταντίνο Βαβλιάκη Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού́ μοντέλου ARIMA-LSTM 19
  20. 20. Ευχαριστώ για την προσοχή σας! Ερωτήσεις; Νοέμβριος 2020 Πρόβλεψη πωλήσεων με την χρήση υβριδικού μοντέλου ARIMA-LSTM 20

×