Please use this identifier to cite or link to this item:
https://olympias.lib.uoi.gr/jspui/handle/123456789/38906
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.author | Πατσέα, Περσεφόνη | el |
dc.date.accessioned | 2025-03-31T09:37:27Z | - |
dc.date.available | 2025-03-31T09:37:27Z | - |
dc.identifier.uri | https://olympias.lib.uoi.gr/jspui/handle/123456789/38906 | - |
dc.rights | Attribution 3.0 United States | * |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/us/ | * |
dc.subject | Μηχανική Μάθηση | el |
dc.subject | Πρόβλεψη Απόδοσης Μαθητών | |
dc.subject | Ανάλυση Δεδομένων | |
dc.subject | Ταξινόμηση | |
dc.title | Ανάλυση Δεδομένων Προόδου Μαθητών για Προβλέψεις Απόδοσης | el |
dc.type | masterThesis | en |
heal.type | masterThesis | el |
heal.type.en | Master thesis | en |
heal.type.el | Μεταπτυχιακή εργασία | el |
heal.dateAvailable | 2025-03-31T09:38:27Z | - |
heal.language | el | el |
heal.access | free | el |
heal.recordProvider | Πανεπιστήμιο Ιωαννίνων. Σχολή Πληροφορικής και Τηλεπικοινωνιών. Τμήμα Πληροφορικής και Τηλεπικοινωνιών. | el |
heal.publicationDate | 2025-03 | - |
heal.abstract | Η παρούσα διπλωματική εργασία εστιάζει στη χρήση αλγορίθμων Μηχανικής Μάθησης για την πρόβλεψη της ακαδημαϊκής απόδοσης μαθητών, βασισμένη σε δύο σύνολα δεδομένων (student-mat.csv και student-por.csv). Η πρόβλεψη της μαθητικής απόδοσης αποτελεί σημαντικό ερευνητικό πεδίο, καθώς επιτρέπει την εφαρμογή εξατομικευμένων στρατηγικών μάθησης και έγκαιρων παρεμβάσεων για την ενίσχυση των μαθητών. Στη βιβλιογραφία, έχουν προταθεί διάφορες μέθοδοι πρόβλεψης, όπως Γραμμική Παλινδρόμηση, Decision Trees, Random Forest και Neural Networks, με έμφαση στη σημασία χαρακτηριστικών όπως οι βαθμολογίες, η συμμετοχή σε δραστηριότητες και οι κοινωνικοοικονομικοί παράγοντες. Αρχικά, πραγματώθηκε προεπεξεργασία δεδομένων, όπου εφαρμόστηκαν τεχνικές διαχείρισης ελλιπών τιμών, κανονικοποίησης και μετατροπής κατηγορικών χαρακτηριστικών. Στη συνέχεια, αναπτύχθηκαν και αξιολογήθηκαν τα εξής δώδεκα μοντέλα ταξινόμησης: Random Forest, Decision Tree, Logistic Regression, K-Nearest Neighbors, Support Vector Machines (SVM - SVC), Naïve Bayes, MLP, Gradient Boosting, AdaBoost, XGBoost, Bagging Classifier και Extra Trees. Για την αξιολόγηση των μοντέλων, χρησιμοποιήθηκαν μετρικές απόδοσης όπως Accuracy, Precision, Recall, F1-score, ενώ πραγματοποιήθηκε και σύγκριση Confusion Matrices, Heatmaps, Learning Curves και Bar Charts. Τα αποτελέσματα έδειξαν ότι τα Gradient Boosting, XGBoost και Random Forest υπερτερούν σε ακρίβεια και γενίκευση, με ακρίβεια κοντά στο 90%. Αντίθετα, το Naïve Bayes είχε τη χαμηλότερη απόδοση (~58%), υποδεικνύοντας περιορισμένη καταλληλότητα για την ανάλυση των συγκεκριμένων δεδομένων. Επιπροσθέτως, τα αποτελέσματα κατέδειξαν ότι το dataset student-por.csv παρείχε ελαφρώς καλύτερη απόδοση των μοντέλων σε σχέση με το student-mat.csv, γεγονός που ενδέχεται να σχετίζεται με τη διαφορετική κατανομή των χαρακτηριστικών των μαθητών. Τέλος, γίνεται νύξη προτάσεις για βελτίωση, όπως η βελτιστοποίηση υπερπαραμέτρων (Grid Search, Bayesian Optimization), η ενσωμάτωση επιπλέον χαρακτηριστικών και η διερεύνηση εναλλακτικών μεθόδων Μηχανικής Μάθησης, όπως Νευρωνικά Δίκτυα. | el |
heal.abstract | This thesis focuses on the use of Machine Learning algorithms to predict students' academic performance, based on two datasets (student-mat.csv and student-por.csv). The prediction of student performance is an important research area, as it allows the implementation of personalized learning strategies and early interventions to support students. In the literature, several prediction methods have been proposed, such as Linear Regression, Decision Trees, Random Forest and Neural Networks, with a focus on the importance of characteristics such as grades, activity participation and socioeconomic factors. Initially, data preprocessing was carried out, where techniques of missing value management, normalization and categorical attribute transformation were applied. Then, twelve classification models were developed and evaluated: random forest, decision tree, decision tree, logistic regression, K-Nearest Neighbors, Support Vector Machines (SVM - SVC), Naïve Bayes, MLP, Gradient Boosting, AdaBoost, XGBoost, Bagging Classifier and Extra Trees. To evaluate the models, performance metrics such as Accuracy, Precision, Recall, F1-score were used, and Confusion Matrices, Heatmaps, Learning Curves and Bar Charts were also compared. The results showed that Gradient Boosting, XGBoost and Random Forest outperformed in terms of accuracy and generalization, with an accuracy close to 90%. In contrast, Naïve Bayes had the lowest performance (~58%), indicating limited suitability for the analysis of this data. Additionally, the results showed that the student-por.csv dataset provided slightly better model performance than student-mat.csv, which may be related to the different distribution of student characteristics. Finally, suggestions for improvement are hinted at, such as hyperparameter optimization (Grid Search, Bayesian Optimization), incorporating additional features and exploring alternative Machine Learning methods such as Neural Networks. | en |
heal.advisorName | Γιαννακέας, Νικόλαος | el |
heal.committeeMemberName | Γκόγκος, Χρήστος | el |
heal.committeeMemberName | Τσούλος, Ιωάννης | el |
heal.academicPublisher | Πανεπιστήμιο Ιωαννίνων. Σχολή Πληροφορικής και Τηλεπικοινωνιών. Τμήμα Πληροφορικής και Τηλεπικοινωνιών | el |
heal.academicPublisherID | uoi | el |
heal.numberOfPages | 180 | el |
heal.fullTextAvailability | true | - |
Appears in Collections: | Διατριβές Μεταπτυχιακής Έρευνας (Masters) - ΠΤΠ |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Μ.Ε. Πατσέα Περσεφόνη (2025).pdf | 3.53 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License