Please use this identifier to cite or link to this item: https://olympias.lib.uoi.gr/jspui/handle/123456789/38095
Full metadata record
DC FieldValueLanguage
dc.contributor.authorDougia, Aggelikien
dc.contributor.authorΔούγια, Αγγελικήel
dc.date.accessioned2024-07-02T15:31:24Z-
dc.date.available2024-07-02T15:31:24Z-
dc.identifier.urihttps://olympias.lib.uoi.gr/jspui/handle/123456789/38095-
dc.identifier.urihttp://dx.doi.org/10.26268/heal.uoi.17802-
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectData storytellingen
dc.subjectChart queriesen
dc.subjectHighlightsen
dc.titleData storytelling via sibling queries and highlight extractionen
dc.typemasterThesisen
heal.typemasterThesisel
heal.type.enMaster thesisen
heal.type.elΜεταπτυχιακή εργασίαel
heal.dateAvailable2024-07-02T15:32:24Z-
heal.languageenel
heal.accessfreeel
heal.recordProviderΠανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολήel
heal.publicationDate2024-06-
heal.abstractΗ Επιχειρησιακή νοημοσύνη (Business Intelligence) στηρίζεται σε α) σε ιεραρχικά πολυδιάστατα δεδομένα, που έρχονται με τη μορφή κύβων δεδομένων και δια-στάσεων με ιεραρχίες για την αναπαράσταση πληροφοριών και β) προηγμένους τελεστές ερωτημάτων για την εξαγωγή ενδιαφέροντών φαινομένων από τα διαθέσιμα δεδομένα. Σε αυτή την εργασία, προτείνουμε έναν τελεστή ερωτήματος που παίρνει τον προσδιορισμό ενός γραφήματος ως είσοδο και παράγει μια ιστορία δεδομένων (data story) ως έξοδο. Το κίνητρο για αυτόν τον τελεστή Query-As-A-Chart έγκει-ται στην παρατήρηση ότι τα παραδοσιακά ερωτήματα, συμπεριλαμβανομένων αυτών της επιχειρησιακής νοημοσύνης, είναι ανεπαρκή για να εκφράσουν τους στόχους γνώσης υψηλότερου επιπέδου που έχουν επί του παρόντος οι αναλυτές. Στην περίπτωση που τα αποτελέσματα του ερωτήματος μπορούν να οπτικοποιη-θούν, ο τελεστής λαμβάνει το ερώτημα ως είσοδο μαζί με τον προσδιορισμό της γραφικής παράστασης (γραφήματος) που επέλεξε ο αναλυτής για να δει. Οι διαθέσιμες επιλογές είναι γραμμικό γράφημα (line-chart), ραβδόγραμμα (bar-chart) και γράφημα διασποράς (scatter-plot). Εκτός από την πρώτη επέκταση στην παραδοσιακή αναζήτηση, με τον προσδιο-ρισμό γραφήματος μαζί με το ερώτημα, μια δεύτερη επέκταση περιλαμβάνει την επέκταση του τρόπου χειρισμού των αποτελεσμάτων των ερωτημάτων. Στο πλαί-σιο της εργασίας, προστίθενται δύο επεκτάσεις στην αρχική εκτέλεση ερωτήμα-τος. Η πρώτη αφορά του αρχικού ερωτήματος με βοηθητικά ερωτήματα, ονομα-ζόμενα (sibling), τα οποία παρέχουν αποτελέσματα παρόμοιων υποσυνόλων του χώρου δεδομένων με του αρχικού. Έτσι, για παράδειγμα, εάν το αρχικό ερώτημα αφορά ένα ατομικό φίλτρο της μορφής «πόλη = Ιωάννινα», θέλουμε να δημιουρ-γήσουμε αυτόματα ερωτήματα sibling για όλες τις πόλεις που αφορούν την ίδια χώρα με τα Ιωάννινα, δηλαδή την Ελλάδα, και να αντιπαραβάλουμε τα αποτελέ-σματα τους. Η δεύτερη επέκταση, αφορά την εφαρμογή μοντέλων στα δεδομένα των αποτελεσμάτων. Υποθέτοντας ότι μία από τις διαστάσεις ομαδοποίησης είναι ο χρόνος, δημιουργώντας έτσι μια χρονοσειρά ως αποτέλεσμα του ερωτήματος, μοντέλα όπως trend, unimodality, bimodality, or dominance, μπορούν να εφαρ-μόζονται σε διαφορετικές παραγόμενες χρονοσειρές για τα διάφορα ερωτήματα και συγκρίνοντας τα μεταξύ τους για ομοιότητες και διαφορές. Τα εξαγόμενα highlight βαθμολογούνται, ταξινομούνται και φιλτράρονται με ένα φίλτρο rank-n-prune. Το αποτέλεσμα ολόκληρης της διαδικασίας είναι (α) ένα σύνολο γραφημάτων που απεικονίζουν τα αποτελέσματα, αλλά το πιο σημαντικό, (β) μια συνδυασμέ-νη αναφορά ή ιστορία δεδομένων, που συνδυάζει τις γραφικές παραστάσεις, μαζί με μια περιγραφή κειμένου των κυριότερων ανιχνευόμενων σημείων, για να επι-στραφεί στον αναλυτή.el
heal.abstractBusiness Intelligence relies on (a) hierarchical multidimensional data, coming in the form of data cubes and dimension hierarchies for the representation of infor-mation, and (b) advanced querying operators for the extraction of interesting facts from the available data. In this Thesis, we propose a querying operator that takes a chart specification as its input and produces a data story as its output. The motivation for this Query-As-A-Chart operator lies in the observation that traditional queries, including Business Intelligence ones, are inadequate to express the higher-level knowledge goals that analysts currently have. To the extent that query results are typically visualized, the operator takes this fact as input, and complements its specification with the type of graphical representa-tion (chart) expected to be produced, in the form of a line-chart, bar-chart, or scat-ter plot. Apart from this first extension to traditional querying, in the form of extending the query specification, a second extension includes the extension of how query results are handled. In the context of this Thesis, two extensions are added to the original query execution. The first concerns complementing the original query with auxilia-ry, sibling queries that provide results of similar subsets of the data space to the original one. So, for example, if the original query concerns an atomic filter of the form “city = Ioannina”, we want to automatically generate sibling queries for all the cities that pertain to the same country as Ioannina, i.e., Greece, and contrast the re-sults. A second extension has to do with the application of models to the resulting data. Assuming one of the grouper dimensions is time, thus producing a timeseries as a result of the query, models like trend, unimodality, bimodality, or dominance, can be applied over the different timeseries produced for the different queries and compared for commonalities and exceptions. The extracted highlights are appropri-ately scored, ranked and pruned on the basis of a simple rank-n-prune filter. The result of the entire process is (a) a set of charts that visualize the results, but most importantly, (b) a combined report, or data story, that combines the graphical representations, along with a textual description of the detected highlights, to be returned to the analyst.en
heal.advisorNameVassiliadis, Panosen
heal.committeeMemberNameVassiliadis, Panosen
heal.committeeMemberNameMamoulis, Nikolaosen
heal.committeeMemberNameZarras, Apostolosen
heal.academicPublisherΠανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικήςel
heal.academicPublisherIDuoiel
heal.numberOfPages74 p.el
heal.fullTextAvailabilitytrue-
Appears in Collections:Διατριβές Μεταπτυχιακής Έρευνας (Masters) - ΜΗΥΠ

Files in This Item:
File Description SizeFormat 
AggelikiDougiaMscThesis_20240626.pdf1.41 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons