Please use this identifier to cite or link to this item:
Full metadata record
DC FieldValueLanguage
dc.contributor.authorΑλιβάνογλου, Αναστάσιοςel
dc.contributor.authorAlivanoglou, Anastasiosen
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.subjectΚατανομή Π- sigmoidel
dc.subjectΜέγιστη πιθανοφάνειαel
dc.titleΜικτά μοντέλα π-σιγμοειδών κατανομώνel
dc.titleΠ-sigmoid mixture modelsen
heal.type.enMaster thesisen
heal.type.elΜεταπτυχιακή εργασίαel
heal.recordProviderΠανεπιστήμιο Ιωαννίνων. Σχολή Θετικών Επιστημώνel
heal.abstractΟ τομέας της αναγνώρισης προτύπων ασχολείται με ένα πλήθος προβλημάτων επεξεργασίας πληροφορίας όπως για παράδειγμα την αναγνώριση χειρόγραφων χαρακτήρων, την εξαγωγή κανόνων για δημιουργία συστημάτων λήψης απόφασης κ.α. Προκειμένου να είμαστε αποδοτικοί στην επίλυση αυτών των προβλημάτων είναι αναγκαίο να δημιουργηθεί ένα ευέλικτο και αποδοτικό μοντέλο περιγραφής δεδομένων. To GMM (Gaussian Mixture Model) αποτελεί ένα από τα πιο διαδεδομένα μοντέλα περιγραφής, διότι τόσο οι καλές αναλυτικές του ιδιότητες όσο και η δυνατότητα περιγραφής πολλών τύπων δεδομένων το καθιστούν ξεχωριστό. Εντούτοις, και σε αυτό το μοντέλο υπάρχουν κάποιες βασικές αδυναμίες που συνοψίζονται κυρίως σε δύο βασικά σημεία. Πρώτον, τα αποτελέσματα της ομαδοποίησης που δίνει (τα κέντρα και οι πίνακες συμμεταβλητότητας) δεν μπορούν να παράγουν ερμηνεύσιμους, από τον άνθρωπο, κανόνες. Δεύτερον, αδυνατεί να περιγράψει με ικανοποιητικό τρόπο τα δεδομένα που ακολουθούν ομοιόμορφη κατανομή. Μια προσέγγιση στη λύση αυτών των προβλημάτων δίνει η συνάρτηση πυκνότητας πιθανότητας Π-sigmoid που προτείνεται στην εργασία αυτή. Η τελευταία μπορεί αφενός να περιγράψει ομοιόμορφα δεδομένα και αφετέρου να δημιουργήσει ερμηνεύσιμους κανόνες, αφού λύση που παρέχει είναι μια λίστα από υποδιαστήματα ανά διάσταση. Η τομή των υποδιαστημάτων αυτών ορίζει στις D διαστάσεις ένα υπερ-ορθογώνιο. Στη συνέχεια ορίζεται το μικτό μοντέλο Π-sigmoid κατανομών (nsMM) και για την εκπαίδευση προτείνεται η χρήση του αλγορίθμου GEM (Generalized EM). Για την βελτιστοποίηση στο M-βήμα του GEM γίνεται χρήση της μεθόδου βελτιστοποίησης BFGS. Επίσης, προτείνουμε μια τροποποίηση της Π-sigmoid κατανομής για να μπορεί περιγράφει και περιστραμμένες ομάδες δεδομένων. Το γεγονός αυτό οδήγησε στην ανάπτυξη ειδικής τεχνικής για τον καθορισμό των πινάκων περιστροφής, τόσο για την απλή κατανομή όσο και για ένα nsMM. Η απόδοση του nsMM εξετάζεται μέσα από πειράματα σε τεχνητά και πραγματικά δεδομένα, καθώς επίσης σε προβλήματα κατηγοριοποίησης δεδομένων και κατάτμησης εικόνων.el
heal.abstractThe term pattern recognition encompasses a wide range of information processing problems of great practical significance, from speech recognition an the classification of handwritten characters, to fault detection in machinery and medical diagnosis. Often these are problems which many humans solve in a seemingly effortless fashion. However, their solution using computers has, in many cases, proved to be immensely difficult. In order to have the best opportunity of developing effective solutions, it is important to adopt a principled approach based on sound theoritical concepts. The most general, and the most natural, framework in which to formulate solutions to pattern recognition problems is a statistical one, which recognizes the probabilistic nature both of the information we seek to process, and of the form in which we should express the results. Statistical pattern recognition is a well established field with a long history. In statistical pattern recognition we assume that the data has been generated as a result of a statistical process and we seek the statistical model that best fits the data, where the statistical model is described in terms of a distribution and a set of parameters for that distribution. At a high level, this process involves deciding on a statistical model for the data and estimating the parameters of that model from the data. This thesis deals with a particular type of statistical model, mixture models, which model the data by using a convex combination of statistcal distributions. Each distribution corresponds to a cluster and the parameters of each distribution provide a description of the corresponding cluster. In this thesis we propose a new probability density function, the Ȇ-sigmoid. It took its name from its ability to form the shape of the greek letter “Ȇ”. More specifically, we demonstrate the properties and the different shapes that can take for particular values of its parameters. We then describe Ȇ-sigmoid mixture models (ȆsMM) and we consider how parameters can be estimated for this statistical model. We first show how a procedure known as maximum likelihood estimation (MLE) can be used to estimate parameters for the simple case of a single Ȇ-sigmoid and then present how can we extend this approach for estimating the parameters of a ȆsMM. This can be achieved via the Generalized Expectation Maximization (GEM) algorithm, which makes an initial guess for the parameters, and then iteratively improves these estimates. Moreover, we provide techniques to adjust orientation of the distribution as well as the way to deal with noisy atasets.en
heal.advisorNameΛύκας, Αριστείδηςel
heal.committeeMemberNameΛύκας, Αριστείδης-
heal.academicPublisherΠανεπιστήμιο Ιωαννίνων. Σχολή Θετικών Επιστημών. Τμήμα Μηχανικών Η/Υ & Πληροφορικήςel
heal.numberOfPages123 σ.-
Appears in Collections:Διατριβές Μεταπτυχιακής Έρευνας (Masters) - ΜΥ

Files in This Item:
File Description SizeFormat 

This item is licensed under a Creative Commons License Creative Commons