Please use this identifier to cite or link to this item:
https://olympias.lib.uoi.gr/jspui/handle/123456789/39756Full metadata record
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.author | Μουζάκης, Ιωάννης | el |
| dc.date.accessioned | 2026-02-04T10:22:23Z | - |
| dc.date.available | 2026-02-04T10:22:23Z | - |
| dc.identifier.uri | https://olympias.lib.uoi.gr/jspui/handle/123456789/39756 | - |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 United States | * |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/us/ | * |
| dc.subject | Εκπαίδευση | el |
| dc.subject | RAG | en |
| dc.subject | Chat bot | en |
| dc.title | Εξατομίκευση Chatbot σε πραγματικά δεδομένα | el |
| heal.type | bachelorThesis | - |
| heal.type.en | Bachelor thesis | en |
| heal.type.el | Προπτυχιακή/Διπλωματική εργασία | el |
| heal.classification | Εκπαιδευτικό σύστημα - Chat bot | - |
| heal.classification | RAG - Εκπαιδευτικό σύστημα | - |
| heal.dateAvailable | 2026-02-04T10:23:24Z | - |
| heal.language | el | - |
| heal.access | free | - |
| heal.recordProvider | Πανεπιστήμιο Ιωαννίνων. Σχολή Πληροφορικής και Τηλεπικοινωνιών. Τμήμα Πληροφορικής και Τηλεπικοινωνιών | el |
| heal.publicationDate | 2025 | - |
| heal.abstract | Η παρούσα εργασία παρουσιάζει την υλοποίηση ενός εκπαιδευτικού chat bot που απαντά τεκμηριωμένα σε ερωτήματα σχετιζόμενα με το Τμήμα, αξιοποιώντας προσέγγιση Retrieval Augmented Generation. Αρχικά, πραγματοποιείτε web scraping του ιστότοπου σε όλα τα τμήματα (ανακοινώσεις, προσωπικό, γραμματεία κ.λπ.) και λήψη – επεξεργασία των συνημμένων pdf. Τα έγγραφα μετατρέπονται σε καθαρό κείμενο χρησιμοποιώντας διάφορες τεχνικές. Αφού γίνουν οι απαραίτητες τροποποιήσεις, τα δεδομένα αποθηκεύονται σε SQLite βάση όπου κατασκευάζονται corpus σε chunks με ευρετήριο FTS5/BM25 για λεξική αναζήτηση. Παράλληλα, τα ίδια αποσπάσματα υπολογίζονται embeddings και αποθηκεύονται σε ChromaDB, επιτρέποντας σημασιολογική αναζήτηση. Η ανάκτηση είναι υβριδική, τα αποτελέσματα από τη λεξική και σημασιολογική αναζήτηση συγχωνεύονται με Reciprocal Rank Fusion, ενώ χρησιμοποιούνται εργαλεία για την διατήρηση συμφραζομένων και πηγών. Έπειτα, τα καλύτερα αποτελέσματα τροφοδοτούν ένα προσεκτικά σχεδιασμένο prompt προς το LLM, το οποίο παράγει σύντομες και ελέγξιμες απαντήσεις. Η διεπαφή υλοποιείτε σε Gradio, προσφέροντας ρυθμίσεις παραμέτρων και εξαγωγή συνομιλίας. | el |
| heal.abstract | This thesis presents the implementation of an educational chatbot that provides evidence-based answers to department-related queries using Retrieval-Augmented Generation (RAG) approach. Firstly, the department website is scraped across all sections (announcements, staff, secretariat, etc.) and attached PDFs are downloaded and processed. Documents are converted to clean text using various techniques. After the necessary preprocessing, the data are stored in an SQLite database, where the corpus is split into chunks and indexed with FTS5/BM25 for lexical search. In parallel, the same chunks are embedded and stored in ChromaDB to enable semantic search. Retrieval is hybrid: results from lexical and semantic search are fused via Reciprocal Rank Fusion, with additional steps to preserve context and source traceability. The best results then feed a carefully designed prompt to the LLM, which produces concise, certifiable answers. The user interface is implemented in Gradio, offering parameter controls and chat exports. | en |
| heal.advisorName | Καρβέλης, Πέτρος | el |
| heal.committeeMemberName | Τζάλλας, Αλέξανδρος | el |
| heal.committeeMemberName | Γιαννακέας, Νικόλαος | el |
| heal.academicPublisher | Τμήμα Πληροφορικής και Τηλεπικοινωνιών | el |
| heal.academicPublisherID | uoi | - |
| heal.fullTextAvailability | true | - |
| Appears in Collections: | Προπτυχιακές εργασίες Τμ. Μηχανικών Πληροφορικής Τ.Ε. | |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| ΜΟΥΖΑΚΗΣ ΙΩΑΝΝΗΣ - ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ.pdf | 2.59 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License