ΔΕΔΟΜΕΝΑ

ΚΕΦΑΛΑΙΟ 1.3

ΔΕΔΟΜΕΝΑ


1.3.1. Πηγή Δεδομένων

Στο προηγούμενο ποστ μιλήσαμε σχετικά με το πώς μπορούμε να διαφυλάξουμε τις υποθέσεις μας, με βάση τους κανόνες και την γραμματική. Ωστόσο δεν αναφερθήκαμε καθόλου στο πώς συλλέγουμε τα δεδομένα που χρειαζόμαστε, ώστε να καταλάβουμε πώς μοιάζουν αυτοί οι κανόνες και η γραμματική. Υπάρχουν προφανείς πηγές δεδομένων που μπορούν να χρησιμοποιήσουν οι συντακτικοί. Μπορούν να χρησιμοποιήσουν μια πληθώρα από γραπτά ή προφορικά δεδομένα. Αυτά ονομάζονται σώματα κειμένων (corpora). Τα σώματα κειμένων μπορούν να προέρχονται από ποικίλες πηγές, για παράδειγμα από τηλεφωνικούς διαλόγους, από καθημερινούς διαλόγους, εφημερίδες, βιβλία και περιοδικά, παραμύθια που έχουν συλλεχθεί από επιτόπιες έρευνες. Και βέβαια υπάρχει και το διαδίκτυο. Τα σώματα κειμένων μπορούν να αποτελούν πολύ χρήσιμες πηγές. Μας λένε πολλά και για τον πολιτισμό, αλλά και για τη γλώσσα. Επίσης, τα σώματα κειμένων μπορούν να μας δείξουν δομές, για τις οποίες αλλιώς δεν θα μπορούσαμε να γνωρίζουμε ότι υπάρχουν.


1.3.2. Τα μειονεκτήματα των σωμάτων κειμένων


Ωστόσο, για τα σώματα κειμένων υπάρχουν και μειονεκτήματα. Ας πάρουμε, για παράδειγμα, τη σημασία των παρακάτω προτάσεων, για τη  οποία χρησιμοποιούμε το ένστικτό μας. Ας πάρουμε λοιπόν την παρακάτω πρόταση στα Αγγλικά:


«Where do you think she dances?»

Στην πραγματικότητα, αυτή η πρόταση είναι αμφίσημη, και μπορεί να σημαίνει δύο πράγματα. Μπορεί να ερωτάται πού βρίσκεται το μέρος, στο οποίο γίνεται ο χορός. Αλλά μπορεί να ρωτάμε, πού έγινε η σκέψη. Μια ερώτηση που κάνουν οι γλωσσολόγοι είναι, γιατί είναι πιθανές οι αμφισημίες σαν την παραπάνω. Όμως μπορούμε να το κάνουμε πιο περίπλοκο, αν σκεφτούμε την παρακάτω πρόταση:

«Where do you wonder if she dances?»

Αυτή η πρόταση δεν είναι καθόλου αμφίσημη. Μπορεί να αναφέρεται μόνο στο πού κάποιος αναρωτιέται. Δεν μπορεί να σημαίνει ότι κάποιος αναρωτιέται για το μέρος στο οποίο το υποκείμενο χορεύει. 

Αν είχαμε μπροστά μας ένα σώμα κειμένου, θα μπορούσαμε να ορίσουμε ότι υπάρχει διαφορά στην αμφισημία ανάμεσα στην πρώτη και τη δεύτερη πρόταση; Από ένα σώμα κειμένου και μόνο, δεν υπάρχει κάποιος τρόπος να διακρίνουμε αυτή την αμφισημία. Ακόμη, ας σκεφτούμε και την παρακάτω πρόταση:

*«Who do you think ate the honey soup?»

Ένας Άγγλος φυσικός ομιλητής θα συνειδητοποιήσει ότι αυτή δεν είναι πρόταση στα Αγγλικά. Ωστόσο δεν είμαστε σίγουροι γιατί δεν είναι, εκτός κι αν αναρωτηθούμε για το τι είναι τελικά μια πρόταση που δεν μπορούμε να εκφέρουμε. Ένα από τα κλειδιά που χρειαζόμαστε, για να κάνουμε ένα επιστημονικό πείραμα, είναι να είμαστε σε θέση να ορίσουμε αν η υπόθεσή μας είναι επαληθεύσιμη ή όχι. Για να δούμε αν η υπόθεσή μας είναι σωστή ή όχι, πρέπει να είμαστε σε θέση να ψάξουμε τα δεδομένα, που θα αποδεικνύουν ότι μπορεί να είναι και λανθασμένη. Αν αποδείξουμε ότι η υπόθεσή μας είναι λανθασμένη, τότε πρέπει να την επανεξετάσουμε. Αυτό ονομάζεται επαληθευσιμότητα (falsifiability).

Αν σκεφτούμε προσεκτικά τι είναι τα σώματα κειμένων, δεν είναι ξεκάθαρο αν περιέχουν τα δεδομένα που χρειαζόμαστε, για να επαληθεύσουμε την υπόθεσή μας. Κάποιες φορές την επαληθεύουν, αλλά όχι πάντα. Και ο λόγος που συχνά δεν την επαληθεύουν είναι, διότι στις υποθέσεις δεν περιλαμβάνονται μη αποδεκτές προτάσεις. Ή αν περιέχουν μη αποδεκτές προτάσεις, δεν είναι αυτές που χρειαζόμαστε για να διαψεύσουμε την υπόθεσή μας. Αυτά τα δεδομένα τα λαμβάνουμε από άλλες πηγές. 

1.3.3. Κριτήρια αποδεκτότητας

Αυτά τα δεδομένα τα λαμβάνουμε, όταν έχουμε πρόσβαση στη νοητική γνώση ενός ομιλητή. Τα ονομάζουμε κριτήρια αποδεκτότητας (acceptability tasks) και αποτελούν μια εδραιωμένη επιστημονικά μεθοδολογία για να εξερευνούμε τη γλώσσα. Τα κριτήρια αποδεκτότητας πολλές φορές ονομάζονται και γλωσσικές διαισθήσεις (intuitions), ένας τίτλος αρκετά εσφαλμένος. Δεν πρόκειται απλώς για διαισθήσεις, αλλά σχετίζεται περισσότερο με το αν ένας ομιλητής μπορεί να κρίνει μια πρόταση ως αποδεκτή ή μη.

Υπάρχουν δύο είδη κριτηρίων αποδεκτότητας. Το ένα, που ονομάζεται κριτήριο συντακτικής αποδεκτότητας (syntactic judgement), αφορά τη μορφή της πρότασης. Για παράδειγμα, γνωρίζουμε ότι η παρακάτω πρόταση στα Αγγλικά:

*Peanuts the my eat not cat.

δεν είναι μια γραμματική πρόταση της Αγγλικής, οι λέξεις δεν είναι στη σωστή σειρά και η μορφή της πρότασης είναι λανθασμένη.

Ένα άλλο κριτήριο αποδεκτότητας είναι το σημασιολογικό (semantic judgement). Είδαμε ήδη ένα παράδειγμα αμφισημίας, που πρόκειται για κριτήριο σημασιολογικής αποδεκτότητας. Αυτό το κριτήριο σχετίζεται με το ότι η σημασία μιας πρότασης μπορεί να φαίνεται περίεργη. Για παράδειγμα η πρόταση: 

#My toothbrush is pregnant.

είναι πολύ περίεργη, αν την εκφωνήσει κανείς. Θα ασχοληθούμε και με τα δύο κριτήρια σε όλα τα μαθήματα.


1.3.4 Γλωσσική ικανότητα vs. γλωσσική πραγμάτωση


Αξίζει να σημειώσουμε ότι τα σώματα κειμένων και τα κριτήρια αποδεκτότητας ξεχωρίζουν πολύ διαφορετικές πηγές πληροφοριών. Τα σώματα κειμένων αντανακλούν την γλωσσική πραγμάτωση (language performance), δηλαδή τι λέμε στην πραγματικότητα και τι ακούμε. Αντανακλούν κάτι το οποίο ονομάζεται εξ- γλώσσα (e-language) ή εξωτερική γλώσσα (external language), δηλαδή τη γλώσσα όπως την παρατηρούμε στον κόσμο. Με άλλα λόγια, είναι η εξωτερική έκφραση μιας γλώσσας, για παράδειγμα τα Ελληνικά ή τα Αγγλικά, όπως τα σκεφτόμαστε συνήθως, πρόκειται για εξωτερικές γλώσσες.

Από την άλλη, τα κριτήρια αποδεκτότητας διακρίνουν κάτι διαφορετικό. Διακρίνουν αυτό που ονομάζουμε γλωσσική ικανότητα (language competence). Εδώ η λέξη competence έχει διαφορετική σημασία από αυτή που έχει σε άλλους κλάδους. Εδώ αναφέρεται στην εσωτερική μας γνώση για κάτι. Άρα όταν διακρίνουμε τα κριτήρια αποδεκτότητας, στην πραγματικότητα διακρίνουμε την γλωσσική μας ικανότητα. Ο στόχος της γενετικής γραμματικής είναι η γλωσσική ικανότητα και περιγράφουμε αυτό που διακρίνουμε ως εσ- γλώσσα (i-language) ή συγκεκριμένη γλώσσα (internal language), δηλαδή η γνωσιακή δομή που αποτελεί τη βάση της ικανότητας που έχουμε να μιλούμε μια γλώσσα, π.χ. την εσωτερική γνώση της Ελληνικής ή της Αγγλικής. 

Επομένως, αυτό που μας ενδιαφέρει είναι αυτό που έχουμε στο νου μας και μας επιτρέπει να μιλούμε και να κατανοούμε μια γλώσσα, αλλά είναι μια εντελώς εσωτερική δομή. Άρα τα κριτήρια αποδεκτότητας διακρίνουν την εσ- γλώσσα και αναφέρονται στην γλωσσική ικανότητα, ενώ τα σώματα κειμένων διακρίνουν την εξ- γλώσσα και αναφέρονται στην γλωσσική πραγμάτωση.


1.3.5. Κριτήρια επάρκειας


Αξίζει να δούμε πώς χρησιμοποιούμε τα δεδομένα, για να αξιολογήσουμε πόσο καλές είναι οι υποθέσεις μας.  Το 1965, ο Νόαμ Τσόμσκυ στο βιβλίο του Aspects of the Theory of Syntax πρότεινε ότι υπάρχουν τρία επίπεδα γραμματικής. Το πιο μινιμαλιστικό είδος γραμματικής είναι αυτό που αξιολογεί πόσο καλή είναι η υπόθεσή μας, όσον αφορά τα σώματα κειμένων η άλλα δεδομένα γλωσσικής επιτέλεσης. Αυτό το επίπεδο γραμματικής ονομάζεται παρατηρητική επάρκεια (observational adequacy). Το επόμενο επίπεδο, που είναι κάπως καλύτερο, είναι η περιγραφική επάρκεια (descriptive adequacy), που λαμβάνει υπόψη του όλα τα δεδομένα, συν τα κριτήρια αποδεκτότητας ή την γλωσσική πραγμάτωση. Το τελευταίο και καλύτερο κριτήριο επάρκειας που αναγνώρισε ο Τσόμσκυ είναι η ερμηνευτική επάρκεια (explanatory adequacy), όχι μόνο λαμβάνουν υπόψη τους σώματα κειμένων ή δεδομένα γλωσσικής πραγμάτωσης ή δεδομένα αποδεκτότητας, αλλά λαμβάνουν υπόψη τους επίσης και το πώς κατέχουμε το σύστημα. Με άλλα λόγια, εξηγούν πώς αποκτήσαμε το σύστημα, πώς το μάθαμε και πώς το σύστημα αναπτύχθηκε εξελικτικά.


1.3.6. Συνοψίζοντας


Συνοψίζοντας, είδαμε ποια είδη δεδομένων μπορούμε να χρησιμοποιήσουμε για να επαληθεύσουμε την υπόθεσή μας. Μιλήσαμε για τα σώματα κειμένων, που αποτελούν εξαίρετες πηγές, αλλά είδαμε και ότι έχουν κάποια μειονεκτήματα. Για αυτό πρέπει και να εξετάσουμε τα κριτήρια αποδεκτότητας. Τα κριτήρια αποδεκτότητας διακρίνονται σε δύο είδη: τα κριτήρια συντακτικής αποδεκτότητας και τα κριτήρια σημασιολογικής αποδεκτότητας. Σημειώσαμε ότι τα δύο διαφορετικά είδη πηγών δεδομένων, για τα οποία μιλήσαμε, δηλαδή τα σώματα κειμένων και τα κριτήρια αποδεκτότητας διακρίνουν δύο διαφορετικά είδη πληροφοριών. Τα σώματα κειμένων και άλλα είδη καταγραφών και συλλογών δεδομένων αντανακλούν την γλωσσική επιτέλεση ή με άλλα λόγια αυτό που παράγουμε. Από την άλλη τα κριτήρια αποδεκτότητας αντικατοπτρίζουν τη γλωσσική ικανότητα ή αυτά που ξέρουμε για τη γλώσσα μας. Τέλος, καταλήξαμε σε μια σύντομη συζήτηση για το πώς μπορούμε να αξιολογήσουμε την υπόθεσή μας, όσον αφορά τα δεδομένα που καλύπτουν: η παρατηρητική επάρκεια αφορά τα σώματα κειμένων ή τα δεδομένα επιτέλεσης, η περιγραφική επάρκεια περιλαμβάνει σώματα κειμένων, δεδομένα επιτέλεσης και κριτήρια αποδεκτότητας και η ερμηνευτική επάρκεια προχωράει ένα βήμα και προσπαθεί να εξηγήσει πώς αποκτήσαμε το σύστημα που έχουμε.

Comments

Popular posts from this blog

ΤΙ ΕΙΝΑΙ Η ΣΥΝΤΑΞΗ

ΕΙΣΑΓΩΓΗ