Please use this identifier to cite or link to this item:
https://olympias.lib.uoi.gr/jspui/handle/123456789/39599Full metadata record
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.author | Γεωργίου, Αθανάσιος | |
| dc.contributor.author | Georgiou, Athanasios | |
| dc.date.accessioned | 2025-11-10T13:44:39Z | - |
| dc.date.available | 2025-11-10T13:44:39Z | - |
| dc.identifier.uri | https://olympias.lib.uoi.gr/jspui/handle/123456789/39599 | - |
| dc.rights | Default License | - |
| dc.subject | Ελλιπή δεδομένα | el |
| dc.subject | Έλεγχοι υποθέσεων | el |
| dc.subject | Missing data | en |
| dc.subject | Hypothesis testing | en |
| dc.subject | MCAR | en |
| dc.title | Ελλιπή δεδομένα: Έλεγχος της υπόθεσης MCAR | el |
| dc.title | Missing data: testing the MCAR hypothesis | en |
| dc.type | masterThesis | - |
| heal.type | masterThesis | el |
| heal.type.en | Master thesis | en |
| heal.type.el | Μεταπτυχιακή εργασία | el |
| heal.classification | Ελλιπή δεδομένα | el |
| heal.classification | Missing data | en |
| heal.dateAvailable | 2025-11-10T13:45:40Z | - |
| heal.language | el | el |
| heal.access | free | el |
| heal.recordProvider | Πανεπιστήμιο Ιωαννίνων. Σχολή Θετικών Επιστημών | el |
| heal.publicationDate | 2025-07-01 | - |
| heal.abstract | Συχνά σε πρακτικές εφαρμογές δεν είναι διαθέσιμες όλες οι παρατηρήσεις και ο στατιστικός έχει τελικά στη διάθεσή του ένα σύνολο δεδομένων που χαρακτη- ρίζεται από ελλιπείς τιμές. Οι λόγοι που παρουσιάζονται σύνολα δεδομένων με ελλιπείς τιμές είναι ποικίλοι και οδηγούν σε διάφορες μορφές-μοτίβα ελλιπών δε- δομένων. Ο Rubin (1976) θέλοντας να εξηγήσει τον μηχανισμό εμφάνισης των ελλιπών τιμών και να δώσει απάντηση στο ερώτημα αν το γεγονός ότι κάποιες μεταβλητές εμφανίζουν ελλιπείς τιμές σχετίζεται με την τιμή των μεταβλητών αυ- τών στο σύνολο των δεδομένων περιέγραψε τρεις μηχανισμούς που οδηγούν σε ελλιπή δεδομένα. Πιο συγκεκριμένα, σύμφωνα με τον Rubin (1976), έχουμε τα Πλήρως Τυχαία Ελλιπή (Missing Completely at Random (MCAR)), τα Τυχαία Ελλιπή (Missing at Random (MAR)) και τα Μη Τυχαία Ελλιπή (Non Missing at Random (NMAR)) δεδομένα. Μεταξύ αυτών, για λόγους που θα παρουσια- στούν στο πρώτο κεφάλαιο αυτής της μεταπτυχιακής διατριβής, ξεχωριστή θέση κατέχουν τα MCAR δεδομένα και για αυτόν τον λόγο είναι απαραίτητο όταν υπάρχουν ελλιπή δεδομένα να επιβεβαιώνεται ότι αυτά μπορούν να θεωρηθούν ότι έχουν προέλθει από έναν τέτοιον μηχανισμό. Για τον λόγο αυτό στη βι- βλιογραφία, ιδιαίτερα τα τελευταία έτη, παρατηρείται ιδιαίτερο ενδιαφέρον για την εισαγωγή μεθόδων για τον έλεγχο αν ο μηχανισμός έλλειψης των δεδομένων εί- ναι MCAR ή όχι. Στο πλαίσιο αυτό, έχουν παρουσιαστεί μεθοδολογίες ελέγχου τόσο για τη γενική περίπτωση που τα διαθέσιμα δεδομένα μπορούν να θεωρη- θούν ένα τυχαίο δείγμα από τον υπό μελέτη πληθυσμό, αλλά και μεθοδολογίες για ειδικές περιπτώσεις δεδομένων (διαχρονικά, επαναλαμβανόμενες μετρήσεις κ.ο.κ.). Επιπλέον, κάποιες από τις μεθοδολογίες είναι ειδικά σχεδιασμένες για διακριτά/κατηγορικά δεδομένα ή μεικτού τύπου δεδομένα. Στο πλαίσιο αυτής της διατριβής, θα περιοριστούμε στην παρουσίαση των μεθοδολογιών εκείνων που είναι σχεδιασμένες για τη γενική περίπτωση που έχουμε διαθέσιμο ένα τυ- χαίο σύνολο συνεχών δεδομένων ή που μπορούν να εφαρμοστούν σε τέτοιες περιπτώσεις χωρίς να είναι απαραίτητη η διακριτοποίηση των δεδομένων. Στο παραπάνω πλαίσιο, η διάρθρωση του υπολοίπου της διατριβής έχει ως εξής. Στο Κεφάλαιο 1 (Εισαγωγή) παρουσιάζονται διάφορα πιθανά μοτίβα ελ- λιπών δεδομένων, ορίζονται οι τρεις μηχανισμοί δημιουργίας ελλιπών δεδομένων και αναδεικνύεται τόσο η σπουδαιότητα των MCAR δεδομένων όσο και η σπου- δαιότητα ύπαρξης στατιστικών ελέγχων ότι τα διαθέσιμα ελλιπή δεδομένα είναι τέτοιου τύπου. Στη συνέχεια, στο Κεφάλαιο 2 παρουσιάζονται οι έλεγχοι εκεί- νοι των οποίων η κεντρική ιδέα είναι η ακόλουθη: τα διαθέσιμα ελλιπή δεδομένα χωρίζονται σε διακεκριμένα μοτίβα και ο έλεγχος της υπόθεσης MCAR ανάγεται στον έλεγχο ότι κάθε ένα από αυτά τα μοτίβα προέρχεται από τον ίδιο πληθυσμό. Αυτό πρακτικά σημαίνει ότι ο έλεγχος της υπόθεσης MCAR ανάγεται στον έλεγ- χο αν τα δεδομένα ικανοποιούν την υπόθεση της ομοιογένειας. Είναι προφανές ότι απόρριψη της υπόθεσης της ομοιογένειας συνεπάγεται απόρριψη της υπόθε- σης MCAR, ενώ αν η υπόθεση της ομοιογένειας δεν μπορεί να απορριφθεί αυτό δεν σημαίνει ότι επιβεβαιώνεται η υπόθεση MCAR. Από την άλλη, όσοι έλεγχοι δεν μπορούν να ταξινομηθούν σε αυτήν την κατηγορία ελέγχων παρουσιάζονται στο Κεφάλαιο 3. Σε κάθε ενότητα των δύο κεφαλαίων οι έλεγχοι υλοποιούνται σε ένα συγκεκριμένο σύνολο δεδομένων, με χρήση συναρτήσεων της R που εί- ναι διαθέσιμες σε κάποια πακέτα της, αλλά και άλλων που υλοποιήθηκαν στο πλαίσιο αυτής τη διατριβής. Στο Κεφάλαιο 4 το ενδιαφέρον επικεντρώνεται στην παρουσίαση των αποτελεσμάτων των συγκριτικών μελετών απόδοσης των στατι- στικών ελέγχων που παρουσιάστηκαν στα προηγούμενα δύο κεφάλαια τόσο ως προς τη διατήρηση του επιπέδου σημαντικότητας όσο και ως προς την ισχύ. Στο Κεφάλαιο 5 συνοψίζονται τα συμπεράσματα αυτής της μεταπτυχιακής διατριβής, αναφέρονται σημαντικοί έλεγχοι που έχουν παρουσιαστεί στη βιβλιογραφία για άλλους τύπους δεδομένων και δίνονται προτάσεις για περαιτέρω έρευνα. Τέλος, η μεταπτυχιακή διατριβή ολοκληρώνεται με το Παράρτημα, όπου παρατίθενται οι συναρτήσεις υλοποίησης κάποιων εκ των στατιστικών ελέγχων στη γλώσσα προγραμματισμού R, και τη Βιβλιογραφία. | el |
| heal.abstract | In practical applications, not all observations are often available, and the statistician ultimately works with a dataset with missing values. The reasons for missingness are diverse and lead to various patterns of incomplete data. Rubin (1976) aimed to explain the mechanisms that lead to missing values and to address the question of whether the fact that some variables have missing values is related to the values of these variables within the data set. In this framework, he described three mechanisms that result in missing data: the Missing Completely at Random - MCAR, the Missing at Random - MAR, and the Non Missing at Random - NMAR. Among these, for reasons that will be discussed in the first chapter of this master’s thesis, MCAR data hold particular importance. Therefore, when dealing with missing data, it is essential to verify whether they can be considered to have arisen from such a mechanism. Consequently, there exists a growing interest in the development of methods to test whether the missing data mechanism is MCAR or not. In this context, methodologies for testing have been developed both for the general case where the available data can be considered as a random sample from the population under study, as well as for specific types of data (longitudinal, repeated measurements, etc.). Additionally, some of these methodologies are specifically designed for discrete/categorical data or mixed data. In this thesis, we will focus on presenting those methodologies that are intended for the general case where a random set of continuous data is available or methods that can be applied in such cases without the need for data discretization. In the above context, the structure of the remainder of this thesis is as follows. Chapter 1 (Introduction) presents various possible missing data patterns, defines the three mechanisms by which missing data can arise, and highlights the importance of MCAR, as well as the necessity of conducting statistical tests to determine whether the available missing data fall under this mechanism. Specifically, Chapter 2 introduces the class of tests based on the following central idea: the available incomplete data are divided into distinct patterns, and testing the MCAR hypothesis is reduced to testing whether each of theii se patterns originates from the same population. In practice, this means that testing the MCAR hypothesis is equivalent to testing the assumption of homogeneity. Clearly, rejection of the homogeneity assumption implies rejection of the MCAR hypothesis, whereas failure to reject the homogeneity assumption does not confirm the MCAR hypothesis. On the other hand, tests that cannot be classified into this category are presented in Chapter 3. In each section, we apply the MCAR at a specific data set. Chapter 4 focuses on presenting the results of Monte Carlo studies performed in the statistical literature in order to evaluate the performance of the statistical tests presented in the previous two chapters, in terms of both maintaining the significance level and statistical power. Chapter 5 summarizes the conclusions of this master’s thesis, mentions important tests that have been presented in the literature for other data types, and provides suggestions for further research. Finally, the thesis concludes with the Appendix, which includes R code implementations of some of the statistical tests, and the References section. | en |
| heal.advisorName | Μπατσίδης, Αποστόλης | el |
| heal.committeeMemberName | Μπατσίδης, Αποστόλης | el |
| heal.committeeMemberName | Ζωγράφος, Κωνσταντίνος | el |
| heal.committeeMemberName | Μπάγκαβος, Δημήτριος | el |
| heal.academicPublisher | Πανεπιστήμιο Ιωαννίνων. Σχολή Θετικών Επιστημών. Τμήμα Μαθηματικών | el |
| heal.academicPublisherID | uoi | el |
| heal.numberOfPages | 78 | el |
| heal.fullTextAvailability | true | - |
| Appears in Collections: | Διατριβές Μεταπτυχιακής Έρευνας (Masters) - ΜΑΘ | |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| Μεταπτυχιακή Διατριβή.pdf | 1.17 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.