Please use this identifier to cite or link to this item: https://olympias.lib.uoi.gr/jspui/handle/123456789/39756
Full metadata record
DC FieldValueLanguage
dc.contributor.authorΜουζάκης, Ιωάννηςel
dc.date.accessioned2026-02-04T10:22:23Z-
dc.date.available2026-02-04T10:22:23Z-
dc.identifier.urihttps://olympias.lib.uoi.gr/jspui/handle/123456789/39756-
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectΕκπαίδευσηel
dc.subjectRAGen
dc.subjectChat boten
dc.titleΕξατομίκευση Chatbot σε πραγματικά δεδομέναel
heal.typebachelorThesis-
heal.type.enBachelor thesisen
heal.type.elΠροπτυχιακή/Διπλωματική εργασίαel
heal.classificationΕκπαιδευτικό σύστημα - Chat bot-
heal.classificationRAG - Εκπαιδευτικό σύστημα-
heal.dateAvailable2026-02-04T10:23:24Z-
heal.languageel-
heal.accessfree-
heal.recordProviderΠανεπιστήμιο Ιωαννίνων. Σχολή Πληροφορικής και Τηλεπικοινωνιών. Τμήμα Πληροφορικής και Τηλεπικοινωνιώνel
heal.publicationDate2025-
heal.abstractΗ παρούσα εργασία παρουσιάζει την υλοποίηση ενός εκπαιδευτικού chat bot που απαντά τεκμηριωμένα σε ερωτήματα σχετιζόμενα με το Τμήμα, αξιοποιώντας προσέγγιση Retrieval Augmented Generation. Αρχικά, πραγματοποιείτε web scraping του ιστότοπου σε όλα τα τμήματα (ανακοινώσεις, προσωπικό, γραμματεία κ.λπ.) και λήψη – επεξεργασία των συνημμένων pdf. Τα έγγραφα μετατρέπονται σε καθαρό κείμενο χρησιμοποιώντας διάφορες τεχνικές. Αφού γίνουν οι απαραίτητες τροποποιήσεις, τα δεδομένα αποθηκεύονται σε SQLite βάση όπου κατασκευάζονται corpus σε chunks με ευρετήριο FTS5/BM25 για λεξική αναζήτηση. Παράλληλα, τα ίδια αποσπάσματα υπολογίζονται embeddings και αποθηκεύονται σε ChromaDB, επιτρέποντας σημασιολογική αναζήτηση. Η ανάκτηση είναι υβριδική, τα αποτελέσματα από τη λεξική και σημασιολογική αναζήτηση συγχωνεύονται με Reciprocal Rank Fusion, ενώ χρησιμοποιούνται εργαλεία για την διατήρηση συμφραζομένων και πηγών. Έπειτα, τα καλύτερα αποτελέσματα τροφοδοτούν ένα προσεκτικά σχεδιασμένο prompt προς το LLM, το οποίο παράγει σύντομες και ελέγξιμες απαντήσεις. Η διεπαφή υλοποιείτε σε Gradio, προσφέροντας ρυθμίσεις παραμέτρων και εξαγωγή συνομιλίας.el
heal.abstractThis thesis presents the implementation of an educational chatbot that provides evidence-based answers to department-related queries using Retrieval-Augmented Generation (RAG) approach. Firstly, the department website is scraped across all sections (announcements, staff, secretariat, etc.) and attached PDFs are downloaded and processed. Documents are converted to clean text using various techniques. After the necessary preprocessing, the data are stored in an SQLite database, where the corpus is split into chunks and indexed with FTS5/BM25 for lexical search. In parallel, the same chunks are embedded and stored in ChromaDB to enable semantic search. Retrieval is hybrid: results from lexical and semantic search are fused via Reciprocal Rank Fusion, with additional steps to preserve context and source traceability. The best results then feed a carefully designed prompt to the LLM, which produces concise, certifiable answers. The user interface is implemented in Gradio, offering parameter controls and chat exports.en
heal.advisorNameΚαρβέλης, Πέτροςel
heal.committeeMemberNameΤζάλλας, Αλέξανδροςel
heal.committeeMemberNameΓιαννακέας, Νικόλαοςel
heal.academicPublisherΤμήμα Πληροφορικής και Τηλεπικοινωνιώνel
heal.academicPublisherIDuoi-
heal.fullTextAvailabilitytrue-
Appears in Collections:Προπτυχιακές εργασίες Τμ. Μηχανικών Πληροφορικής Τ.Ε.



This item is licensed under a Creative Commons License Creative Commons