Monday, July 21, 2008

συνταγή για εξυπνάδες #234

Παίρνουμε ένα ελληνικό κείμενο που έχουμε πρόχειρο σε ηλεκτρονική μορφή (σαν αρχείο word στο δίσκο μας για παράδειγμα), στην περίπτωση μου μερικά κεφάλαια από μια μετάφραση του βιβλίου της Ursula Le Guin "Γεωθάλασσα", και χρησιμοποιώντας ένα εργαλείο της επιλογής μας, του κάνουμε μερικά μαγικά (με for και if) και καταλήγουμε σε ένα κείμενο που κάθε γράμμα κάθε λέξης ακολουθείται από ένα κενό (μοιάζει κάπως έτσι: "π ο λ ε μ ι σ τ ε σ σ τ η ν ο μ ι χ λ η τ ο ν η σ ι γ κ ο ν τ ε ν α μ ο ν α χ ι κ ο β ο υ ν ο π ο υ η κ ο ρ υ φ η τ ο υ υ ψ ω ν ε τ α ι ε ν α μ ι λ ι")

Το αποτέλεσμα το στέλνουμε στο φοβερό και τρομερό Wordle.net και έχουμε μια απεικόνιση των συχνοτήτων των γραμμάτων της ελληνικής.



Που βέβαια είναι λίγο προβληματική, γιατί τα χρώματα μπερδεύουν το μάτι…
Σε ασπρόμαυρο είναι καλύτερα...



Αλλά και πάλι δεν είμαστε σίγουροι αν δεύτερο πιο συχνό γράμμα είναι το "ο" ή το "ι"...

4 comments:

Zaf said...

αυτό το αστείο με το "for και if" θα το εξηγήσω μια άλλη φορά...

Zaf said...

και θα επανέρθω στο θέμα των συχνοτήτων των γραμμάτων της ελληνικής, αυτό ήταν ένα βιαστικό post στο τέλος της Κυριακής

Zafiris Keramidas said...

χαχαχα, πολύ καλό. Μετά τα "κόβεις" ένα ένα και τα βάζεις στο autocad για να μετρήσεις το ύψος τους;

agorf said...

Ωραία ιδέα! Καλό θα ήταν να έριχνες ένα ακόμη for στα γράμματα και να διαπίστωνες προγραμματιστικά τη συχνότητά τους για να έλυνες στο κοινό σου την απορία. :)