Σχεδιασμός Βάσεων Δεδομένων

Μαθησιακά Αποτελέσματα

Οι φοιτητές μετά την επιτυχή ολοκλήρωση του μαθήματος θα μπορούν:

  • να αναλύουν ένα πρόβλημα σχεδιασμού βάσης δεδομένων και να συλλέγουν τις απαιτήσεις για την υλοποίηση του συστήματος βάσης δεδομένων.
  • να σχεδιάζουν μία βάση δεδομένων σε εννοιολογικό και λογικό επίπεδο και να δημιουργούν των κατάλληλα μοντέλα δεδομένων
  • να σχεδιάζουν και υλοποιούν καλά δομημένες βάσεις δεδομένων με βάση τους κανόνες κανονικοποίησης.
  • να γνωρίζουν και χρησιμοποιούν τα κατάλληλα εργαλεία για τη σχεδίαση και υλοποίηση μίας σχεσιακής βάσης δεδομένων
  • να υλοποιούν ερωτήματα SQL για τον ορισμό και τη διαχείριση βάσεων δεδομένων.

Περιεχόμενα

  • Εισαγωγή: Παρουσιάση θεμελιωδών εννοιών του Συστήματος Διαχείρισης Βάσεων Δεδομένων. Σκοπός και αρχιτεκτονική ενός συστήματος Βάσης Δεδομένων. Μοντέλα δεδομένων.
  • Μοντέλο οντοτήτων-συσχετίσεων: Βασικές έννοιες, οντότητες, συσχετίσεις, χαρακτηριστικά, κλειδιά, διαγράμματα, μετατροπή σε πίνακες
  • Σχεσιακό μοντέλο: Σχέσεις, πίνακες, χαρακτηριστικά, σχήμα, σχεσιακή άλγεβρα (τελεστές, πράξεις), σχεσιακός λογισμός (μαθηματική λογική)
  • Σχεδίαση Σχεσιακών Βάσεων Δεδομένων: Περιορισμοί ακεραιότητας, λειτουργικές εξαρτήσεις, διάσπαση, κανονικοποίηση.
  • Γλώσσα επερωτήσεων SQL: Γενικές αρχές, βασική μορφή, joins, εμφωλευμένα ερωτήματα, αθροιστικές συναρτήσεις, ενημέρωση βάσης δεδομένων, όψεις.

Προτεινόμενα Συγγράμματα

  • Βασιλακόπουλος Γ. (2009): Σχεδιασμός Βάσεων Δεδομένων, Αυτοέκδοση.
  • Ramakrishnan R. & Gehrke J. (2002): Συστήματα Διαχείρισης Βάσεων Δεδομένων, Τόμος Ι, Έκδοση 2η (μεταφρασμένο), Eκδόσεις Τζιόλα/McGraw Hill.

Πρόσθετη Βιβλιογραφία

Επιπλέον, στον Eύδοξο αναρτώνται σε ηλεκτρονική μορφή άρθρα, οπτικοακουστικό υλικό διαλέξεων και διαδικτυακές διευθύνσεις για χρήσιμες πληροφορίες καθώς και ασκήσεις για την εξάσκηση των φοιτητών/τριών. Παρουσιάζονται μελέτες περίπτωσης, παραδειγματικά προβλήματα και μέθοδοι επίλυσης αυτών.

Δίκτυα Υπολογιστών Ι

Μαθησιακά Αποτελέσματα

Στόχος του μαθήματος Δίκτυα Υπολογιστών Ι είναι να εισάγει τους φοιτητές στα δίκτυα υπολογιστών και συγκεκριμένα στη μελέτη της ιεραρχίας των πρωτοκόλλων δικτύων, δίνοντας ιδιαίτερη έμφαση στο επίπεδο δικτύου (network layer). Μέσω του μαθήματος αυτού οι φοιτητές θα γνωρίσουν με τρόπο αναλυτικό τη λειτουργία των δικτύων υπολογιστών και θα μπορέσουν να κατανοήσουν τον τρόπο και τις αρχές στις οποίες βασίζεται η μεταφορά δεδομένων μέσα από ένα δίκτυο υπολογιστών.

Με την επιτυχή ολοκλήρωση του μαθήματος, ο φοιτητής/τρια θα είναι σε θέση:

  • να αντιλαμβάνεται αναλυτικά και να περιγράψει τη λειτουργία και την αρχιτεκτονική των πρωτοκόλλων δικτύου,
  • να αντιλαμβάνεται αναλυτικά τις λειτουργίες του επιπέδου δικτύου,
  • να επιλέξει και να εφαρμόσει τους κατάλληλους αλγόριθμους δρομολόγησης,
  • να υλοποιήσει τη βέλτιστη διαδρομή κάθε φορά ανάλογα με τις ανάγκες του δικτύου,
  • να περιγράψει, να αναλύσει και να αναπτύξει περαιτέρω αλγορίθμους επιπέδου δικτύου σε γλώσσες όπως C/C++ ή Java.

Περιεχόμενα

  • Ενότητα 1: Εισαγωγή στα δίκτυα. Ανάγκη για δίκτυα. Κατηγορίες δικτύων, στοιχεία δικτύων (network elements), σύνδεσμοι (links).
  • Ενότητα 2: Πρωτόκολλα. Ιεραρχίες πρωτοκόλλων. Ρόλος του κάθε πρωτοκόλλου στην ιεραρχία.
  • Ενότητα 3: Λειτουργίες του Επιπέδου Δικτύου.
  • Ενότητα 4: Μεταγωγή Πακέτου/ Μεταγωγή Κυκλώματος (Packet/ Circuit Switching).
  • Ενότητα 5: Αλγόριθμοι δρομολόγησης. Dijkstra, Bellman-Ford, spanning tree, multicast, broadcast.
  • Ενότητα 6: Έλεγχος συμφόρησης.
  • Ενότητα 7: Εκπόνηση προγραμματιστικών εργασιών. Σχεδίαση και υλοποίηση απλών πρωτοκόλλων σε γλώσσα προγραμματισμού C/C++ ή Java.
  • Επιπλέον, στον εύδοξο αναρτώνται σε ηλεκτρονική μορφή άρθρα και διαδικτυακές διευθύνσεις για χρήσιμες πληροφορίες καθώς και ασκήσεις για την εξάσκηση των φοιτητών/τριών.

Προτεινόμενα Συγγράμματα

  • Tanenbaum A. (2003): Δίκτυα Υπολογιστών (μεταφρασμένο), Εκδόσεις Κλειδάριθμος.
  • Haykin S. (2009): Συστήματα Επικοινωνίας (μεταφρασμένο), Εκδόσεις Παπασωτηρίου.

Συναφή επιστημονικά περιοδικά:

  • ΙΕΕΕ Computer Networks
  • IEEE Communications Magazine
  • IEEE Access
  • IEEE Wireless Communications
  • International Journal of Network Management
  • Transactions on Emerging Telecommunications Technologies
  • EURASIP Journal on Wireless Communications and Networking

 

Αλγόριθμοι και Πολυπλοκότητα

Μαθησιακά Αποτελέσματα

Με την επιτυχή ολοκλήρωση του μαθήματος ο φοιτητής / η φοιτήτρια θα είναι σε θέση:

  • να εξηγεί και χειρίζεται θεμελιώδεις έννοιες όπως πρόβλημα (και τύπος προβλήματος, αναλόγως της πολυπλοκότητας), αλγόριθμος, στιγμιότυπο, χρόνος εκτέλεσης ως συνάρτηση μεγέθους στιγμιοτύπου, ασυμπτωτική συμπεριφορά αλγορίθμου, ασυμπτωτικός συμβολισμός, αναδρομικές σχέσεις και μεθόδους επίλυσής τους.
  • να αναλύει, επιλέγει, και αποτιμά αλγορίθμους βασιζόμενος/η στις παραπάνω έννοιες.
  • να σχεδιάζει αποτελεσματικούς αλγορίθμους βασιζόμενος/η στις παραπάνω έννοιες και σε βασικές τεχνικές σχεδιασμού αλγορίθμων (διαίρει και βασίλευε, απληστία, δυναμικός προγραμματισμός)
  • να επικοινωνεί αλγοριθμικές ιδέες με καθαρό, σαφή και τυπικό τρόπο.

Με στόχο να κατασκευάζει και να αποτιμά υπολογιστικά προγράμματα και την χρήση των πόρων που απαιτούν.

Περιεχόμενα

  • Εισαγωγικές έννοιες: Η έννοια του προβλήματος, του αλγορίθμου, της ανάλυσης αλγορίθμων, και της υπολογιστικής πολυπλοκότητας. Προβλήματα βελτιστοποίησης και απόφασης, παραδείγματα. Παραδείγματα ανάλυσης αλγορίθμων: Πειραματικά και θεωρητικά. Υπολογιστικό μοντέλο. Βασικά εισαγωγικά στοιχεία για τις κλάσεις υπολογιστικής πολυπλοκότητας.
  • Ασυμπτωτικός Συμβολισμός. Ορισμοί, παραδείγματα και ασκήσεις. Παραδείγματα επί απλών αλγορίθμων.
  • Επανάληψη σωρών, δέντρων, και παρουσίασή τους ως μαθηματικά αντικείμενα (γενικευμένες δομές δεδομένων). Χρήση τους σε λειτουργίες που αφορούν στην ταξινόμηση, αναζήτηση κλπ. Υπολογισμός της υπολογιστικής πολυπλοκότητας λειτουργιών σε σωρούς, και λεπτομερής υπόδειξη του υπολογισμού της πολυπλοκότητας ταξινόμησης με σωρό. Συγκριτικοί αλγόριθμοι ταξινόμησης και υπολογισμός κάτω ασυμπτωτικού ορίου χρονικής πολυπλοκότητας για συγκριτικους αλγορίθμους ταξινόμησης.
  • Η γενικευμένη δομή του λεξικού: Παρουσίαση και συζήτηση για την υπολογιστική πολυπλοκότητα εισαγωγής, διαγραφής, αναζήτησης στοιχείου, αναλόγως της υλοποίησης του λεξικού. Πρόσθετο παράδειγμα υπολογισμού διαμέρισης συνόλου με λειτουργίες ένωσης και εύρεσης. Συζήτηση και παρουσίαση του υπολογισμού της υπολογιστικής πολυπλοκότητας των λειτουργιών ένωσης και εύρεσης σε δάσος (που αναπαριστά τα σύνολα διαμέρισης), βελτιστοποιήσεις των λειτουργιών και εφαρμογή σε γραφήματα (εύρεση συνιστωσών σε μη συνδετικά γραφήματα).
  • Εισαγωγή στην τεχνική διαίρει και βασίλευε. Επίδειξη του αλγορίθμου ταξινόμησης με συγχώνευση για την κατανόηση της τεχνικής και υπολογισμός της υπολογιστικής πολυπλοκότητας του αλγορίθμου με χρήση δέντρου αναδρομής. Εισαγωγή στις αναδρομικές εξισώσεις πολυπλοκότητας. Γενίκευση δέντρων αναδρομής και αναδρομικών εξισώσεων. Παρουσίαση και απόδειξη του κεντρικού θεωρήματος. Παραδείγματα και εφαρμογές.
  • Συνέχεια στην τεχνική διαίρει και βασίλευε: Η ταχυταξινόμηση ως παράδειγμα. Υπενθύμιση του αλγορίθμου, υπολογισμός της υπολογιστικής πολυπλοκότητας. Εισαγωγή στην έννοια του στοχαστικού αλγορίθμου και επίδειξη τρόπου υπολογισμού υπολογιστικής πολυπλοκότητας για στοχαστική ταχυταξινόμηση.
  • Απληστία: Βασικές έννοιες και παραδείγματα με συγκεκριμένα προβλήματα. Αποδείξεις ορθότητας αλγορίθμων και υπολογιστικής πολυπλοκότητάς τους.
  • Δυναμικός προγραμματισμός: Βασικές έννοιες. Διαφορές από τη μέθοδο της απληστίας και συζήτηση με παραδείγματα για τη σωστή χρήση της τεχνικής. Παραδείγματα προβλημάτων και υπολογισμός πολυπλοκότητας των αντίστοιχων αλγορίθμων δυναμικού προγραμματισμού. Εφαρμογές σε γραφήματα (μεταξύ άλλων).

Προτεινόμενα Συγγράμματα

  • Τ. Cormen, C.Leiserson, R.Rivest, C.Stein (2009): Introduction to Algorithms, The MIT Press (μεταφρασμένο στα Ελληνικά, εκδόσεις ΠΕΚ)
  • Sedgewick R. (2006): Αλγόριθμοι σε C, Μέρη 1-4, 3η αμερικάνικη έκδοση (μεταφρασμένο), Εκδόσεις Kλειδάριθμος.
  • Rawling G.J.E (2004): Αλγόριθμοι Ανάλυση και Σύγκριση (μεταφρασμένο), Εκδόσεις Κριτική.
  • Papadimitriou C. H. & Steiglitz K. (1982): Combinatorial optimization : algorithms and complexity, Prentice Hall.
  • Knuth D. (1997): Fundamental Algorithms, Third Edition. Reading, Massachusetts: Addison-Wesley,
  • Kleinberg J. &Tardos E. (2006): Algorithm Design, (Pearson International Edition), Addison Wesley,
  • Anany V. Levitin (2007): Introduction to the Design & Analysis of Algorithms, (Pearson International Edition), Addison Wesley.

Πρόσθετη Βιβλιογραφία

Επιπλέον, στον Eύδοξο αναρτώνται σε ηλεκτρονική μορφή άρθρα, οπτικοακουστικό υλικό διαλέξεων και διαδικτυακές διευθύνσεις για χρήσιμες πληροφορίες καθώς και ασκήσεις για την εξάσκηση των φοιτητών/τριών. Παρουσιάζονται μελέτες περίπτωσης, παραδειγματικά προβλήματα και μέθοδοι επίλυσης αυτών.

Λειτουργικά Συστήματα – UNIX

Μαθησιακά Αποτελέσματα

Ο σκοπός του μαθήματος είναι vα αναδείξει τις ιδιαίτερες απαιτήσεις και τα χαρακτηριστικά λειτουργικών συστημάτων για πολυεπεξεργαστές, πολυ-Υπολογιστές, κατανεμημένα συστήματα και συστήματα πολυμέσων. Επίσης παρουσιάζονται τα θέματα ασφάλειας λειτουργικών συστημάτων καθώς και οι βασικές αρχές σχεδίασης τους. Παράλληλα, έμφαση δίνεται στο λειτουργικό σύστημα UNIX (χρήση και προγραμματισμό).

Σ’ αυτό το πλαίσιο, οι μαθησιακοί στόχοι του μαθήματος είναι, μετά από την επιτυχημένη ολοκλήρωση του μαθήματος, ο/η φοιτητής/τρια να είναι ικανός/η:

  • να κατανοεί τις βασικές έννοιες των λειτουργικών συστημάτων για πολυεπεξεργαστικά – πολύ-υπολογιστικά και κατανεμημένα συστήματα.
  • να γνωρίζει τους βασικούς μηχανισμούς ασφάλειας (ταυτοποίηση, αυθεντικοποίηση, έλεγχο προσπέλασης κ.λ.π.) που υλοποιεί ένα λειτουργικό σύστημα καθώς και τις βασικές αρχές σχεδίασης ενός λειτουργικού συστήματος.
  • να αναλύει, να αξιολογεί και να τεκμηριώνει εναλλακτικές τεχνολογίες/μηχανισμούς λειτουργικών συστημάτων.
  • να σχεδιάζει προγράμματα (scripts) για την υλοποίηση συγκεκριμένων λειτουργιών σε επίπεδο λειτουργικού.

Περιεχόμενα

  • Λειτουργικά Συστήματα για Πολυεπεξεργαστές, Πολυ-Υπολογιστές και Κατανεμημένα Συστήματα.
  • Λειτουργικά Συστήματα Πολυμέσων: Αρχεία Πολυμέσων, Συμπίεση Βίντεο.
  • Χρονοπρογραμματισμός Αρχείων Πολυμέσων.
  • Ασφάλεια Λειτουργικών Συστημάτων: Απειλές, Επιθέσεις, Πιστοποίηση Ταυτότητας Χρήστη, Μηχανισμοί Ελέγχου Προσπέλασης.
  • Αρχές Σχεδίασης Λειτουργικών Συστημάτων.
  • Λειτουργικά Συστήματα Έξυπνων Καρτών: Υποστήριξη πολλών εφαρμογών από ένα πάροχο υπηρεσιών, υποστήριξη πολλών εφαρμογών από πολλούς παρόχους, JAVA κάρτες.
  • Ιστορία και Βασικές έννοιες του UNIX: Πλοήγηση στο Σύστημα Αρχείων, Ο φλοιός του UNIX, Βοηθητικά Προγράμματα, Η δομή του Πυρήνα.
  • Διεργασίες στο UNIX.
  • Διαχείριση Μνήμης στο UNIX.
  • Είσοδος – Έξοδος στο UNIX.
  • Τo Σύστημα Αρχείων του UNIX.
  • Ο Φλοιός Bourne: Χρήση, Προσαρμογή Περιβάλλοντος Φλοιού, Επαναπροσδιορισμός Εισόδου και Εξόδου.
  • Προγραμματισμός Φλοιού: Μεταβλητές, Έλεγχος Ροής, Κανονικές Εκφράσεις, Σήματα και Κατάσταση.
  • Διαχείριση Συστήματος, Διαχείριση Χρηστών και Ομάδων, Διαχείριση Δίσκων και Συστημάτων Αρχείων, Εγκατάσταση και Διαχείριση Λογισμικού.

Προτεινόμενα Συγγράμματα

  • Andrew S. Tanenbaum, Herbert Bos (2018), Σύγχρονα Λειτουργικά Συστήματα, 4η Αμερικανική Έκδοση (μεταφρασμένο), ΕΚΔΟΣΕΙΣ ΚΛΕΙΔΑΡΙΘΜΟΣ.
  • Wrightson K. & Merlino J. (2001): Πλήρες Εγχειρίδιο του UNIX (μεταφρασμένο), Εκδόσεις Γκιούρδας.
  • Kernighan B.W. & Pike R. (2001): Το Περιβάλλον Προγραμματισμού UNIX (μεταφρασμένο), Εκδόσεις Κλειδάριθμος Ι. Φαλδάμης & ΣΙΑ Ε.Ε.

Πρόσθετη Βιβλιογραφία

Στο σύστημα ΕΥΔΟΞΟΣ αναρτώνται σε ηλεκτρονική μορφή χρήσιμες πληροφορίες καθώς και ασκήσεις για την εξάσκηση των φοιτητών/τριών.

Στατιστική

Μαθησιακά Αποτελέσματα

Στα πλαίσια του μαθήματος διδάσκονται ορισμοί, μαθηματικά αποτελέσματα, θεμελιώδεις μέθοδοι Στατιστικής ανάλυσης και βασικές μέθοδοι εξαγωγής συμπερασμάτων σχετικά με τις μεθόδους στατιστικής ανάλυσης που απαντώνται στη θεμελίωση και στην εφαρμογή της επιστήμης των υπολογιστών Το μάθημα υποστηρίζει άμεσα τα περισσότερα αντικείμενα και μαθήματα του προγράμματος σπουδών: Ας σημειωθεί πως κατά τη διάρκεια του μαθήματος συζητούνται συγκεκριμένα παραδείγματα εφαρμογής σε ψηφιακά συστήματα (κρυπτογραφία, θεωρία πληροφορίας, τηλεπικοινωνιακά συστήματα, ηλεκτρονικές υπηρεσίες) με χρήση νέων Τεχνολογιών με τη βοήθεια προγραμμάτων όπως είναι το Matlab, το SPSS  και η R.

Μετά την επιτυχή παρακολούθηση αυτού του μαθήματος, ο φοιτητής/τρια θα είναι σε θέση:

  • να γνωρίζει, να περιγράφει και να χειρίζεται τις βασικές γνώσεις της Στατιστικής ανάλυσης (ενδεικτικά: περιγραφική στατιστική, δειγματοληψία και κατανομές δειγματοληψίας, Εκτιμητική (αρχή μέγιστης πιθανοφάνειας), Στατιστική συμπερασματολογία, διαστήματα εμπιστοσύνης, έλεγχοι υπόθεσης, Χ^2 έλεγχοι ανεξαρτησίας και goodness of fit, γραμμική παλινδρόμηση, Ανάλυση διακύμανσης, Λογιστική παλινδρόμηση, Στατιστική ανάλυση με λoγισμικό, εφαρμογές στην επιστήμη της πληροφορικής).
  • Να επιλέγει τις κατάλληλες μαθηματικές έννοιες της στατιστικής ανάλυσης και να μπορεί να μοντελοποιήσει το εκάστοτε πρόβλημα Πληροφορικής που καλείται να επιλύσει. Επιπλέον να αναπτύσσει μαθηματική σκέψη και να μπορεί να αναλύσει και να προσαρμόσει τις αποκτηθείσες γνώσεις σε εφαρμογές της επιστήμης των υπολογιστών.
  • Να διακρίνει τους τύπους συμπερασμάτων που εξάγει η στατιστική συμπερασματολογία, να μπορεί να γνωρίζει ποιο είναι το κατάλληλο μοντέλο για την ανάλυση δεδομένων και να αξιολογεί την ακρίβεια των αποτελεσμάτων στατιστικών μεθόδων.
  • Να γνωρίζει τα λογισμικά Matlab, SPSS και R και να μπορεί να ερμηνεύει τα αποτελέσματα που εξάγονται από αυτά.

Περιεχόμενα

    • Περιγραφική και επαγωγική στατιστική. Μέτρα θέσης, μέτρα διασποράς.
    • Θεωρία δειγματοληψίας. Τυχαία και μη τυχαία δειγματοληψία-Δειγματικές κατανομές
    • Συνδιακύμανση και συσχέτιση. Κεντρικό Οριακό Θεώρημα και εφαρμογές
    • Σημειακή εκτιμητική. Εκτιμητές μέγιστης πιθανοφάνειας. Μέθοδος των ροπών. Μέθοδος ελαχίστων τετραγώνων. Ιδιότητες εκτιμητριών συναρτήσεων. Αμερόληπτοι εκτιμητές και εφαρμογές
    • Διαστήματα εμπιστοσύνης. Εφαρμογές με χρήση του SPSS/R σε προβλήματα υπηρεσιών-δικτύων-θεωρίας πληροφορίας
    • Έλεγχοι υποθέσεων. Εφαρμογές με χρήση του SPSS/R σε προβλήματα υπηρεσιών-δικτύων-θεωρίας πληροφορίας
    • Χ^2 τεστ για μία ποιοτική μεταβλητή. Χ^2 τεστ για δύο ποιοτικές μεταβλητές
    • Γραμμική παλινδρόμηση και συνδιακύμανση-συσχέτιση για την παλιδρόμηση
    • Πολλαπλή παλινδρόμηση-Λογαριθμική πολυωνυμική παλιδρόμηση και μη παραμετρική τεστ
    • Ανάλυση διακύμανσης κατά ένα και κατά δύο παράγοντες με ή χωρίς αλληλεπίδραση (ΑΝΟVA). Πολυμεταβλητή στατιστική ανάλυση.

Προτεινόμενα Συγγράμματα

  • Μ. Φιλιππάκης, Στατιστικές μέθοδοι & Ανάλυση Παλινδρόμησης για τις νέες Τεχνολογίες, Εκδόσεις Τσότρας, Β έκδοση, Αθήνα 2017.
  • Τ. Παπαιωάννου, Σ. Λουκάς, Εισαγωγή στη Στατιστική, Εκδόσεις Σταμούλη, Αθήνα 2002.
  • Σημειώσεις διδάσκοντα.
  • Πρόσθετη βιβλιογραφία

Πρόσθετη Βιβλιογραφία

Στο σύστημα ΕΥΔΟΞΟΣ αναρτώνται σε ηλεκτρονική μορφή χρήσιμες πληροφορίες καθώς και ασκήσεις για την εξάσκηση των φοιτητών/τριών.

Ανάλυση Δεδομένων

Μαθησιακά Αποτελέσματα

Στα πλαίσια του μαθήματος διδάσκονται μέθοδοι και τεχνικές ανάλυσης δεδομένων: μέθοδοι οπτικοποίησης για εξερεύνηση δεδομένων, αναλυτική μοντελοποίηση δεδομένων, υπολογιστική εξόρυξη δεδομένων, και εφαρμογές ανάλυσης/χρήσης δεδομένων. Ο στόχος του μαθήματος είναι να εξοικειωθούν οι φοιτητές με την έννοια της ανάλυσης δεδομένων και να αποκτήσουν δεξιότητες στη διαχείριση και ανάλυση συνόλων δεδομένων στην πράξη.

Με την επιτυχή ολοκλήρωση του μαθήματος ο φοιτητής /τρια θα είναι σε θέση:

  • να έχει κατανοήσει τις βασικές έννοιες ανάλυσης δεδομένων
  • να χρησιμοποιεί εργαλεία και τεχνικές διερευνητικής ανάλυσης δεδομένων
  • να κατανοεί τις ιδιότητες και τα χαρακτηριστικά οποιουδήποτε δοθέντος συνόλου δεδομένων
  • να επιλύει πρακτικά προβλήματα ανάλυσης συνόλων δεδομένων
  • να μοντελοποιεί προβλήματα που αφορούν στην ανάλυση δεδομένων και να χρησιμοποιεί το μοντέλο για την εξαγωγή συμπερασμάτων για το εκάστοτε υποκείμενο σύνολο δεδομένων
  • να εφαρμόζει μοντέλα και αλγόριθμους πρόβλεψης σε σύνολα δεδομένων

Περιεχόμενα

  • Εισαγωγή στην ανάλυση δεδομένων: δεδομένα, τύποι δεδομένων, ποιότητα δεδομένων, προεπεξεργασία δεδομένων, μέτρα ομοιότητας, ομοιότητα πολυδιάστατων δεδομένων, ομοιότητα αλφαριθμητικών, ομοιότητα συνόλων-λιστών, ομοιότητα κειμένων.
  • Μονομεταβλητή και διμεταβλητή ανάλυση: οπτικοποίηση, ιστογράμματα, συνάρτηση αθροιστικής κατανομής, στοιχεία συνοπτικής στατιστικής, μέτρα θέσης και διασποράς, εντοπισμός συσχετίσεων ανάμεσα σε δύο μεταβλητές, εναλλακτικοί τρόποι απεικόνισης με χρήση διαγραμμάτων.
  • Ανάλυση χρονοσειρών: τάση, εποχικότητα, θόρυβος, μέθοδοι εξομάλυνσης, κινούμενοι μέσοι όροι, συνάρτηση συσχέτισης και αυτοσυσχέτισης, πρακτική μέθοδος ανάλυσης χρονοσειρών.
  • Εισαγωγή στην προγνωστική μοντεολοποίηση: επιλογή γνωρισμάτων, εντροπία, κέρδος πληροφορίας, δέντρα απόφασης.
  • Προσαρμογή μοντέλου σε δεδομένα: προσαρμογή γραμμικού μοντέλου, γραμμική παλινδρόμηση, λογιστική παλινδρόμηση, μηχανές διανυσμάτων υποστήριξης, μέθοδος Κ-κοντινότερων γειτόνων, κατηγοριοποιητής Bayes.
  • Υπερπροσαρμογή και αξιολόγηση μοντέλων: το πρόβλημα της κατηγοριοποίησης, αλγόριθμοι κατηγοριοποίησης, η διαδικασία εκπαίδευσης, η διαδικασία ελέγχου, αποτίμηση κατηγοριοποίησης, τεχνικές βελτίωσης ακρίβειας, αναγνώριση υπερπροσαρμογής, γράφημα προσαρμογής (fitting graph), παρακράτηση δεδομένων (hold out data), διασταυρωτική επικύρωση (cross-validation), καμπύλη μάθησης, μέτρα αξιολόγησης κατηγοριοποιητών.
  • Εύρεση συστάδων, ορισμός συσταδοποίησης, προεπεξεργασία και μετεπεξεργασία, μέθοδοι συσταδοποίησης, αλγόριθμοι αναζήτησης κέντρων, αλγόριθμοι κατασκευής δέντρων, αλγόριθμοι μεγέθυνσης γειτονιών.
  • Ανάλυση συσχέτισης: σύνολα συχνών στοιχείων, παραγωγή συχνών στοιχειοσυνόλων, ο αλγόριθμος Apriori, παραγωγή κανόνων, σύντομη αναπαράσταση συχνών στοιχειοσυνόλων.
  • Ανάλυση κύριων συνιστωσών, το πρόβλημα ανακάλυψης σχετιζόμενων γνωρισμάτων, μέθοδοι επιλογής γνωρισμάτων, εφαρμογή της ανάλυσης κύριων συνιστωσών στην πράξη.
  • Πιθανοτική θεώρηση και προσομοιώσεις: διωνυμική κατανομή και δοκιμές Bernoulli, η σημασία της κανονικής κατανομής, το Κεντρικό Οριακό Θεώρημα, κατανομές power-law, μέθοδος κατασκευής γεννήτριας τυχαίας κατανομής, ο ρόλος της προσομοίωσης για την εξαγωγή πληροφορίας από δεδομένα, προσομοίωση Μόντε-Κάρλο, χρήση προσομοίωσης για περιπτώσεις που η αναλυτική μοντελοποίηση είναι πολύπλοκη, ανάπτυξη μοντέλων με προσομοίωση, επικύρωση μοντέλων με προσομοίωση.
  • Ανίχνευση ανωμαλιών: χαρακτηριστικά προβλήματα, χαρακτηριστικά μεθόδων ανίχνευσης ανωμαλιών, προσεγγίσεις βάσει εγγύτητας, προσεγγίσεις βάσει πυκνότητας, προσεγγίσεις βάσει συσταδοποίησης, αξιολόγηση ανίχνευσης ανωμαλιών.

Προτεινόμενα Συγγράμματα

  • Mohammed J. Zaki, Wagner Meira Jr.(2017): Εξόρυξη και Ανάλυση Δεδομένων: Βασικές Έννοιες και Αλγόριθμοι, Εκδόσεις Κλειδάριθμος.
  • Anand Rajaraman, Jeffrey David Ullman (2013): Εξόρυξη από Μεγάλα Σύνολα Δεδομένων, Εκδόσεις Νέων Τεχνολογιών.
  • Pang-Ning Tan, Michael Steinbach, Vipin Kumar (2010): Εισαγωγή στην Εξόρυξη Δεδομένων, Εκδόσεις Τζιόλα.
  • Philipp K. Janert (2011): Data Analysis with Open Source Tools, O’Reilly Press.

Πρόσθετη βιβλιογραφία

Στο σύστημα ΕΥΔΟΞΟΣ αναρτώνται σε ηλεκτρονική μορφή χρήσιμες πληροφορίες καθώς και ασκήσεις για την εξάσκηση των φοιτητών/τριών.