Αποθήκες και Εξόρυξη Δεδομένων

Μαθησιακά Αποτελέσματα

Οι φοιτητές μετά την επιτυχή ολοκλήρωση του μαθήματος θα μπορούν:

  • να αξιολογούν την ποιότητα των δεδομένων προς ανάλυσης και να εφαρμόζουν τις απαραίτητες τεχνικές προετοιμασίας των δεδομένων
  • να επιλέγουν την κατάλληλη τεχνική εξόρυξης γνώσης με βάση τις απαιτήσεις και τον τύπο δεδομένων
  • να εφαρμόζουν τεχνικές σχεδίασης και υλοποίησης αποθηκών δεδομένων
  • να χρησιμοποιούν τις κατάλληλες τεχνικές και εργαλεία για την εξαγωγή γνώσης από συλλογές δεδομένων
  • να αξιολογούν την ποιότητα των αποτελεσμάτων εξόρυξης δεδομένων

Περιεχόμενα

  • Εισαγωγή στην διαδικασία εξόρυξης δεδομένων/γνώσης: βασικές έννοιες της εξόρυξης δεδομένων, παρουσίαση των βασικών βημάτων της διαδικασίας ανακάλυψης γνώσης από βάσεις δεδομένων.
  • Προ-επεξεργασία δεδομένων: Καθαρισμός δεδομένων, μετασχηματισμός, τεχνικές μείωσης διαστάσεων.
  • Aποθήκες Δεδομένων: Πολυδιάστατα μοντέλα, Αρχιτεκτονική, Υλοποίηση Αποθηκών Δεδομένων, OLAP.
  • Συσταδοποίηση (Clustering): Μέθοδοι συσταδοποίησης. Παρουσίαση βασικών αλγορίθμων συσταδοποίησης (διαιρετικοί, ιεραρχικοί, πυκνότητας κλπ). Εφαρμογές συσταδοποίησης.
  • Κατηγοριοποίηση (Classification): Bayesian classifiers, Δέντρα αποφάσεων (decision trees), μέθοδος κοντινότερων γειτόνων (k-NN).
  • Κανόνες συσχέτισης (Association Rules): Αλγόριθμος Apriori, σύγκριση αλγορίθμων, αντιπροσωπευτικοί κανόνες συσχέτισης.
  • Εξόρυξη γνώσης από τον Παγκόσμιο Ιστο (ΠΙ): Καλύπτονται θέματα που αφορούν σε ανάλυση υπερσυνδέσμων (Link Analysis), αναζήτηση στο ΠΙ (Web Search), αλγορίθμους κατάταξης (PageRank).

Προτεινόμενα Συγγράμματα

  • Χαλκίδη Μ. & Βαζιργιάννης Μ. (2005): Εξόρυξη Γνώσης από Βάσεις Δεδομένων και τον Παγκόσμιο Ιστό, Έκδόσεις Γ. Δαρδανός-Κ. Δαρδανός ΟΕ.
  • Dunham M.H. (2004): Data Mining: Εισαγωγικά και Προηγμένα Θέματα Εξόρυξης Γνώσης από Δεδομένα (μεταφρασμένο), Εκδόσεις Νέων Τεχνολογιών.

Πρόσθετη Βιβλιογραφία

Επιπλέον, στον Eύδοξο αναρτώνται σε ηλεκτρονική μορφή άρθρα, οπτικοακουστικό υλικό διαλέξεων και διαδικτυακές διευθύνσεις για χρήσιμες πληροφορίες καθώς και ασκήσεις για την εξάσκηση των φοιτητών/τριών. Παρουσιάζονται μελέτες περίπτωσης, παραδειγματικά προβλήματα και μέθοδοι επίλυσης αυτών.

Αναγνώριση Προτύπων

Μαθησιακά Αποτελέσματα

Η Αναγνώριση Προτύπων (Pattern Recognition) είναι η επιστημονική περιοχή που έχει στόχο την απόδοση κάποιας τιμής ή διακριτικού στοιχείου σε εισαγόμενα δεδομένα. Οι άνθρωποι και τα άλλα όντα έχουν την ικανότητα να ταυτοποιούν πραγματικά δεδομένα χρησιμοποιώντας τις αισθήσεις τους και την αντιληπτική τους ικανότητα (cognition) προκειμένου να λάβουν τις κατάλληλες αποφάσεις ώστε να επιβιώσουν στο περιβάλλον τους. Μία μηχανή, όπως ένας ηλεκτρονικός υπολογιστής, πρέπει να εκπαιδευθεί κατάλληλα ώστε να αναγνωρίζει πρότυπα (patterns) και να τα κατηγοριοποιεί αυτόματα σε κατηγορίες.

 

Οι φοιτητές μετά την επιτυχή ολοκλήρωση του μαθήματος θα είναι σε θέση να:

A)     Να κατανοούν τις βασικές μεθοδολογίες αναγνώρισης προτύπων

B)     Να αναλύουν προβλήματα σε διάφορα πεδία εφαρμογών, όπως για παράδειγμα η αναγνώριση φωνής και ήχου, ανάλυση εικόνας και βίντεο, η βιομετρία και η βιοπληροφορική.

C)     Να επιλέγουν σωστούς ταξινομητές, μεθόδους επιλογής χαρακτηριστικών, μετασχηματισμούς δεδομένων, και ομαδοποίησής τους.

D)     Να αξιολογούν τα συστήματα αναγνώρισης προτύπων

Περιεχόμενα

  • Συστήματα αναγνώρισης προτύπων
  • Ταξινομητές Bayes, πλησιέστερου γείτονα
  • Bayesian Δίκτυα
  • Παραμετρική εκτίμηση πυκνότητας πιθανότητας (maximum Likelihood, maximum Aposteriori)
  • Μη παραμετρικές μέθοδοι εκτίμησης πιθανότητας (παράθυρα Parzen)
  • Μη γραμμικοί ταξινομητές
  • Αλγόριθμος perceptron, Νευρωνικά Δίκτυα, Δίκτυα Βαθειάς Μάθησης
  • Μη επιβλεπόμενη αναγνώριση – Συσταδοποίηση
  • Μηχανές Υποστήριξης Διανυσμάτων
  • Γέννηση χαρακτηριστικών: Σχήματα αναπαράστασης και περιγραφής μορφών, περιγράμματα, σχήματα αναπαράστασης και περιγραφής περιγράμματος, κώδικας αλυσίδας, πολύγωνα, υπογραφές, μετασχηματισμοί Fourier, σχήματα περιγραφής εσωτερικού περιοχής εικόνας, ροπές, υφή
  • Εργαλεία Αναγνώρισης Προτύπων

Προτεινόμενα Συγγράμματα

  • Αναγνώριση Προτύπων, Συγγραφείς: Theodoridis S., ISBN: 9789604891450, Τύπος: Σύγγραμμα, Διαθέτης (Εκδότης): BROKEN HILL PUBLISHERS LTD
  • Αναγνώριση προτύπων, Συγγραφείς: ΣΤΡΙΝΤΖΗΣ ΜΙΧΑΛΗΣ, ISBN: 978-960-343-290-6, Τύπος: Σύγγραμμα, Διαθέτης (Εκδότης): ΕΚΔΟΤΙΚΟΣ ΟΙΚΟΣ ΑΔΕΛΦΩΝ ΚΥΡΙΑΚΙΔΗ Α.Ε.

Πρόσθετη Βιβλιογραφία

Επιπλέον, στον Eύδοξο αναρτώνται σε ηλεκτρονική μορφή άρθρα, οπτικοακουστικό υλικό διαλέξεων και διαδικτυακές διευθύνσεις για χρήσιμες πληροφορίες καθώς και ασκήσεις για την εξάσκηση των φοιτητών/τριών. Παρουσιάζονται μελέτες περίπτωσης, παραδειγματικά προβλήματα και μέθοδοι επίλυσης αυτών.