24 Μαρτίου 2009

Ελληνικη γλώσσα & τεχνολογία

H/Y Ίβυκος και το πρόγραμμα TLG


Το Πανεπιστήμιο Irvine της Καλιφόρνια κυκλοφόρησε νέο CD-ROM με άπαντα τα κείμενα των αρχαίων Ελλήνων συγγραφέων. Ο ψηφιακός δίσκος είχε εξαγγελθεί πριν από τρία χρόνια ως νέα αναβαθμισμένη και συμπληρωμένη έκδοση του προηγούμενου δίσκου (TLG #D).

Στο νέο δίσκο TLG #Ε περιέχονται 76 εκατομμύρια τύποι λέξεων της αρχαίας, ελληνιστικής και μεσαιωνικής ελληνικής γλώσσας σε κείμενα από τον Ομηρο (8ος αιώνας π.Χ.) μέχρι το Γεώργιο Σφραντζή (16ος αιώνας μ.Χ.).

Το έργο της καταγραφής της ελληνικής γλώσσας για την προαναφερθείσα περίοδο (8ος-16ος) έχει αναλάβει το "Thesaurus Linguae Graecae" (Θησαυρός της Ελληνικής Γλώσσας) το οποίο ιδρύθηκε το 1972 από την τελειόφοιτη τότε, νυν καθηγήτρια της Κλασικής Φιλολογίας,
κ. Μαριάννα ΜακΝτόναλντ (Marianne McDonald).

'Ολα ξεκίνησαν τον καιρό που η κ. Μ. ΜακΝτόναλντ εκπονούσε την πτυχιακή της εργασία με θέμα τους όρους που εκφράζουν την ευτυχία στον Ευριπίδη. Τότε συνειδητοποίησε πόσο χρήσιμη θα ήταν μια υπολογιστική τράπεζα δεδομένων ολόκληρης της ελληνικής λογοτεχνίας. Η σύλληψή της ήταν πρωτότυπη ακόμη και για τα αμερικανικά δεδομένα, διότι μέχρι τότε κανείς δεν είχε σκεφτεί μια ένωση της κλασικής φιλολογίας με τη σύγχρονη τεχνολογία.

Το "TLG Project" ξεκίνησε υπό την καθοδήγηση του καθηγητή Θεόδωρου Φ. Μπρούνερ (Theodore F. Brunner), ο οποίος διηύθυνε το "TLG" από το 1972 μέχρι το 1998, όταν συνταξιοδοτήθηκε από το Πανεπιστήμιο της Καλιφόρνια, Irvine.

Η καινοτόμος για τον καιρό της προσπάθεια κατέστη εφικτή με τη συμπαράσταση του Ντέιβιντ Γ. Πάκαρντ (David W. Packard). Ο ίδιος και η ομάδα του κατασκεύασαν την αναγκαία τεχνολογική υποδομή (το σύστημα Ιβυκος) για το "Thesaurus Linguae Graecae", ώστε να προχωρήσουν η καταγραφή, η διόρθωση, η ανεύρεση και η επεξεργασία των αρχαίων ελληνικών κειμένων.

Η προσπάθεια του "Τhesaurus Linguae Graecae" ήταν ιδιαίτερα δύσκολη, κυρίως στο τμήμα που αφορούσε στην εξεύρεση των κειμένων. Γι' αυτόν το λόγο ξεκίνησε μια γιγαντιαία προσπάθεια εξεύρεσης των σπάνιων ελληνικών κειμένων που φυλάσσονταν σε μουσεία και βιβλιοθήκες, ώστε να συμπεριληφθούν στη βάση του "TLG".

Κώδικες, πάπυροι και περγαμηνές από ολόκληρη τη Γη φωτογραφήθηκαν και στάλθηκαν στο Πανεπιστήμιο της Καλιφόρνια, Irvine, για να ενταχθούν στο σώμα υλικού (corpus) της τράπεζας δεδομένων που η ομάδα του "Θησαυρού" ήθελε να δημιουργήσει στη δυτική ακτή των Ηνωμένων Πολιτειών. Οι δυσκολίες όμως της πραγματοποίησης του έργου δεν περιορίστηκαν στην εξεύρεση των κειμένων.

Τα έργα των Ελλήνων συγγραφέων έπρεπε να δακτυλογραφηθούν λέξη λέξη, καθώς η χρήση σαρωτή (scanner) δεν ήταν τόσο φθηνή ούτε τόσο διαδεδομένη όσο είναι σήμερα. 'Ετσι, ένα μεγάλο μέρος της δακτυλογράφησης των ελληνικών κειμένων έγινε στην Κορέα όπου λόγω του χαμηλού ωρομίσθιου το κόστος περιοριζόταν στο ελάχιστο.

'Επειτα από 28 συναπτά έτη ασταμάτητης εργασίας (1972-2000) το TLG παράγει το δίσκο #Ε των 11.000 έργων και των 3.000 συγγραφέων που συγκροτούν μια βάση δεδομένων 76.000.000 ξεχωριστών τύπων λέξεων.

'Ετσι δημιουργήθηκε μία από τις μεγαλύτερες και αναλυτικότερες ψηφιακές τράπεζες κειμενικών δεδομένων που υπάρχουν στον κόσμο, η οποία περιέχει τα μείζονος σημασίας έργα για την ανάπτυξη της δυτικής σκέψης. Σήμερα, τη διευθύνει μια Ελληνίδα, η καθηγήτρια κ. Μαρία Παντελιά, ως διάδοχος του καθηγητή Θ. Φ. Μπρούνερ.

Αυτή είναι ως συνελόντι ειπείν η ιστορία του TLG. Μια ακόμη περιπέτεια του ανθρώπινου πνεύματος. Ενα παραμύθι οράματος, δημιουργικότητας, καινοτομίας και -πάνω από όλα- αποφασιστικότητας. Καρπός της προσπάθειας: το να κάθεται κανείς νωχελικά μπροστά στον υπολογιστή του και, τοποθετώντας στον οδηγό CD ένα δίσκο 614 ΜΒ, να μπορεί να διαβάζει όλα τα κείμενα των αρχαίων, ελληνιστικών, μεσαιωνικών και βυζαντινών συγγραφέων από το πρωτότυπο. Μοναδική προϋπόθεση, να ξέρει κανείς ελληνικά...


---------------------------------

Αν επιθυμείτε να αποκτήσετε το CD-ROM TLG #E, θα πρέπει να επικοινωνήσετε απευθείας με το Πανεπιστήμιο της Καλιφόρνια, Irvine, μέσω ηλεκτρονικού ή συμβατικού ταχυδρομείου. Το κόστος "δανεισμού" του δίσκου, για πέντε χρόνια, είναι 300 δολάρια ΗΠΑ.
Επικοινωνία
Αλλες πληροφορίες
Thesaurus Linguae Graecae
University of California, Irvine
3450 Berkeley Place,
Irvine, CA 92697-5550
USA
e-mail: tlg@uci.edu
web: http://www.tlg.uci.edu/~tlg
1. Ο κατάλογος των αρχαίων Ελλήνων συγγραφέων που περιέχονται στο CD-ROM D και στο CD-ROM Ε.
2. Τα νέα κείμενα που περιλαμβάνονται στο CD-ROM Ε.

Πηγή...

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου