βοηθεια με τον idle

aakkuan | Κυρ, 06/26/2011 - 17:02 | 2'

 εδώ και λίγο καιρό έχω αρχίσει να ασχολούμαι με python και συγκεκριμένα με το nltk (natural language toolkit)

το πρόβλημα μου είναι το εξής:

ενώ ξέρω αρκετές εντολές, συμβαίνουν κάποια περίεργα πράματα που δεν καταλαβαίνω τη λογική τους.
για παράδειγμα όταν γράψω στον idle δυο φορές την εντολή print len(set(text)) όπου text είναι ένα αρχειο txt την πρώτη φορά μου το βγάζει ενώ την δεύτερη όχι!!!!!! μου βγάζει 0....
αμα ξανακάνω open το αρχείο την πρώτη φορά πάλι βγάζει κανονικά το len

επίσης αφού κάνω import το nltk μου βγάζει κάποια κείμενα με τα οποία με ένα απλό len(text) μου βγάζει πόσες λέξεις έχει. όταν φορτώνω δικό μου αρχείο μου βγάζει λάθος ότι δεν έχει τέτοια ιδιότητα το αρχείο....:

TypeError: object of type 'file' has no len()

συμπεραίνω ότι έχουν σωθεί διαφορετικά τα αρχεία στο nltk και μπορεί και αναγνωρίζει τις λέξεις.
εγώ αν θέλω σε ένα txt να μετρήσω τις λέξεις, πρέπει να το χωρίσω σε lines, μετά με split() σε λέξεις και μετά να τις μετρήσω;; 

 

Δώσε αστέρια!

MO: (ψήφοι: 0)