Ιερογλυφικά σε Excele Πώς να διορθώσετε. Τι γίνεται αν το αρχείο εξαγωγής CSV δεν εμφανίζει ρωσικούς χαρακτήρες; Αλλαγή κωδικοποίησης στο Excel

Με την ανάγκη αλλαγής κωδικοποίησης κειμένου, οι χρήστες που εργάζονται τα προγράμματα περιήγησης, οι συντάκτες κειμένου και οι επεξεργαστές συχνά αντιμετωπίζονται. Ωστόσο, όταν εργάζεστε στον Πίνακα Excel επεξεργαστή, μια τέτοια ανάγκη μπορεί επίσης να συμβεί, επειδή αυτό το πρόγραμμα επεξεργάζεται όχι μόνο τους αριθμούς, αλλά και το κείμενο. Ας το καταλάβουμε πώς να αλλάξετε την κωδικοποίηση σε excele.

Μάθημα: Κωδικοποίηση στο Microsoft Word


Κείμενο που κωδικοποιεί - Αυτό το σύνολο ηλεκτρονικών ψηφιακών εκφράσεων που μετατρέπονται σε αυτές κατανοητές στους χαρακτήρες του χρήστη. Υπάρχουν πολλοί τύποι κωδικοποίησης, καθένα από τα οποία έχει τους δικούς του κανόνες και τη γλώσσα του. Η ικανότητα του προγράμματος για την αναγνώριση μιας συγκεκριμένης γλώσσας και το μεταφράζεται σε αυτά που είναι κατανοητά για μια συνηθισμένη πινακίδα προσώπου (γράμματα, αριθμοί, άλλοι χαρακτήρες) καθορίζουν αν η αίτηση θα είναι σε θέση να εργαστεί με ένα συγκεκριμένο κείμενο ή όχι. Μεταξύ των δημοφιλών κωδικοποιητών κειμένου πρέπει να διατεθούν ως εξής:

  • Windows-1251;
  • Koi-8;
  • Ascii;
  • Ansi;
  • UKS-2;
  • UTF-8 (Unicode).

Το επώνυμο είναι το πιο συνηθισμένο μεταξύ των κωδικοποιητών στον κόσμο, καθώς θεωρείται ένα είδος καθολικού προτύπου.

Τις περισσότερες φορές, το ίδιο το πρόγραμμα αναγνωρίζει την κωδικοποίηση και μεταβαίνει αυτόματα σε αυτήν, αλλά σε ορισμένες περιπτώσεις ο χρήστης πρέπει να καθορίσει την εμφάνισή του. Μόνο τότε μπορεί να λειτουργήσει σωστά με κωδικοποιημένα σύμβολα.

Ο μεγαλύτερος αριθμός προβλημάτων με την αποκωδικοποίηση κωδικοποίησης από το πρόγραμμα Excel εμφανίζεται όταν προσπαθείτε να ανοίξετε τα αρχεία CSV ή την εξαγωγή txt αρχεία. Συχνά, αντί των συνήθων επιστολών όταν ανοίγετε αυτά τα αρχεία μέσω του Excel, μπορούμε να παρατηρήσουμε ακατανόητα σύμβολα, λεγόμενη "krakozhebra". Σε αυτές τις περιπτώσεις, ο χρήστης πρέπει να κάνει ορισμένους χειρισμούς για να ξεκινήσει το πρόγραμμα για να ξεκινήσει σωστά τα δεδομένα. Υπάρχουν διάφοροι τρόποι επίλυσης αυτού του προβλήματος.

Μέθοδος 1: Αλλάξτε την κωδικοποίηση χρησιμοποιώντας το Notepad ++

Δυστυχώς, ένα πλήρες εργαλείο που θα σας επέτρεπε να αλλάξετε γρήγορα την κωδικοποίηση σε οποιοδήποτε είδος κειμένων από το Excel. Επομένως, είναι απαραίτητο να χρησιμοποιήσετε λύσεις πολλαπλών σταδίων για το σκοπό αυτό ή να καταφύγετε για βοήθεια. Εφαρμογές τρίτων. Ένας από τους πιο αξιόπιστους τρόπους είναι να χρησιμοποιήσετε τον επεξεργαστή κειμένου Notepad ++.


Παρόλο Αυτή τη μέθοδο Με βάση τη χρήση λογισμικού τρίτου μέρους, είναι μία από τις απλούστερες επιλογές για την επαναφορά των περιεχομένων των αρχείων για το Excel.

Μέθοδος 2: Εφαρμογή του Wizard κειμένου

Επιπλέον, μπορείτε να κάνετε τη μετατροπή και τη χρήση των ενσωματωμένων εργαλείων προγραμμάτων, δηλαδή τους οδηγούς κειμένου. Περιέργως Αυτό το εργαλείο πιο περίπλοκη από την εφαρμογή Πρόγραμμα τρίτωνπου περιγράφεται στην προηγούμενη μέθοδο.

Μέθοδος 3: Αποθήκευση ενός αρχείου σε μια συγκεκριμένη κωδικοποίηση

Υπάρχει επίσης μια αντίστροφη κατάσταση όταν το αρχείο δεν πρέπει να ανοίξει με σωστή οθόνη δεδομένων και να αποθηκεύσετε στην εγκατεστημένη κωδικοποίηση. Στο Excel, μπορείτε να εκτελέσετε αυτήν την εργασία.


Το έγγραφο θα αποθηκευτεί σε σκληρό δίσκο ή αφαιρούμενο μέσο στην κωδικοποίηση που έχετε εντοπίσει. Αλλά πρέπει να εξετάσετε ότι τώρα τα πάντα έγγραφα που είναι αποθηκευμένα στο Excel θα αποθηκευτούν σε αυτή την κωδικοποίηση. Για να το αλλάξετε, πρέπει να βγείτε ξανά. "Παράμετροι εγγράφων Web" και να αλλάξετε τις ρυθμίσεις.

Υπάρχει ένας άλλος τρόπος να αλλάξετε τις ρυθμίσεις κωδικοποίησης του αποθηκευμένου κειμένου.

Το CSV είναι ένα de facto πρότυπο για επικοινωνία μεταξύ ετερογενών συστημάτων, για τη μετάδοση και την επεξεργασία ογκομετρικών δεδομένων με μια "σκληρή", πίνακα δομής. Σε πολλές γλωσσικές γλώσσες προγραμματισμού, υπάρχουν ενσωματωμένα εργαλεία και εργαλεία παραγωγής, είναι καλά κατανοητά ως προγραμματιστές και συνηθισμένοι χρήστες και τα προβλήματα με τα ίδια τα δεδομένα είναι καλά ανακαλυφόμενα σε αυτό, όπως λένε, μάτι.

Η ιστορία αυτής της μορφής έχει τουλάχιστον 30 χρόνια. Αλλά ακόμα και τώρα, στην εποχή της βοήθειας του XML, το CSV εξακολουθεί να χρησιμοποιείται για τη μεταφόρτωση και τη λήψη μεγάλων ποσοτήτων δεδομένων. Και παρά το γεγονός ότι η ίδια η μορφή είναι αρκετά καλά περιγράφεται στο RFC, το καθένα το καταλάβει με τον δικό του τρόπο.

Σε αυτό το άρθρο, θα προσπαθήσω να συνοψίσουμε τις υπάρχουσες γνώσεις σχετικά με αυτή τη μορφή, να δείξω τυπικά σφάλματα, καθώς και να απεικονίζουν τα προβλήματα που περιγράφονται στο παράδειγμα της καμπύλης εισαγωγής και εξαγωγής εισαγωγής Το γραφείο της Microsoft. 2007. Θα δείξω επίσης πώς να παρακάμψω αυτά τα προβλήματα (συμπεριλαμβανομένου του αυτόματου μετασχηματισμού των τύπων excel σε dateime και αριθμό) κατά το άνοιγμα. CSV.

Ξεκινήστε με το γεγονός ότι η μορφή CSV ονομάζεται πραγματικά τρεις διαφορετικές μορφές κειμένου που διαφέρουν τα σύμβολα: στην πραγματικότητα το ίδιο το CSV (τιμές που χωρίζονται με κόμματα - τιμές διαχωρισμένες με κόμματα), TSV (τιμές διαχωρισμένες με καρτέλες - τιμές διαχωρίζονται από τις καρτέλες) και SCSV (τιμές διαχωρισμένες σε ημικολάου - τιμές που διαχωρίζονται από ένα ερωτηματικό). Στη ζωή, και οι τρεις μπορεί να ονομάζονται ένα CSV, το σύμβολο διαχωρισμού στην καλύτερη περίπτωση επιλέγεται κατά την εξαγωγή ή την εισαγωγή, και πιο συχνά είναι "ραμμένη" μέσα στον κώδικα. Αυτό δημιουργεί πολλά προβλήματα σε μια προσπάθεια να καταλάβουν.

Ως εικονογράφηση, φαίνεται να είμαστε μια ασήμαντη εργασία: εισαγωγή σε Microsoft Outlook. Δεδομένα από τον πίνακα στο Microsoft Excel..

Το Microsoft Excel διαθέτει εργαλεία εξαγωγής στο CSV και στο Microsoft Outlook - κατάλληλες εισαγωγές. Τι θα μπορούσε να είναι ευκολότερο - έκανε ένα αρχείο, "βροχή" Ταχυδρομικό πρόγραμμα Και γίνεται η υπόθεση; Ανεξάρτητα από το πώς.

Δημιουργήστε ένα σημάδι δοκιμής στο Excel:

... και ας προσπαθήσουμε να το εξάκουμε σε τρεις μορφές κειμένου:

Ποιο συμπέρασμα το κάνουμε από αυτό; .. Το γεγονός ότι η Microsoft ονομάζει "CSV (Comma-Comma)" είναι στην πραγματικότητα μια μορφή με έναν διαχωριστή κόμματος. Το Microsoft Format είναι αυστηρά Windows-1251. Επομένως, εάν έχετε χαρακτήρες Unicode στο Excel, θα εμφανιστούν στην έξοδο CSV σε ερωτηματικά. Επίσης, ότι οι μεταφράσεις των χορδών είναι πάντα ένα ζεύγος συμβόλων, το γεγονός ότι η Microsoft ανέρχεται απλά σε εισαγωγικά όλα όπου βλέπει ένα σημείο κόμμα. Επίσης, αν δεν έχετε καθόλου χαρακτήρες Unicode, μπορείτε να αποθηκεύσετε το αρχείο. Επίσης, ότι το Unicode υποστηρίζεται μόνο από το UTF-16 και όχι το UTF-8, το οποίο θα ήταν έντονα λογικό.

Τώρα ας δούμε πώς το βλέπει το Outlook. Ας προσπαθήσουμε να εισάγαμε αυτά τα αρχεία από αυτήν, καθορίζοντας τις ίδιες πηγές δεδομένων. Outlook 2007: Αρχείο -\u003e Εισαγωγή και εξαγωγή ... -\u003e Εισαγωγή από άλλο πρόγραμμα ή αρχείο. Στη συνέχεια, επιλέξτε τη μορφή δεδομένων: "Οι τιμές διαιρούμενες με τιμές (Windows)" και "Οι τιμές διαχωρίζονται από την καρτέλα (Windows)".

Δύο προϊόντα της Microsoft δεν καταλαβαίνουν ο ένας τον άλλον, δεν έχουν καμία ευκαιρία να περάσουν Αρχείο κειμένου Δομημένα δεδομένα. Προκειμένου να λειτουργούν τα πάντα, οι "χοροί με προγραμματιστές Tambourine" απαιτείται.

Θυμάσουμε το Microsoft Excel να λειτουργεί με αρχεία κειμένου, τα δεδομένα εισαγωγής από την CSV, αλλά στην έκδοση 2007 το καθιστά πολύ παράξενο. Για παράδειγμα, αν ανοίξετε απλά το αρχείο μέσω του μενού, θα ανοίξει χωρίς οποιαδήποτε αναγνώριση μορφοποίησης, απλά ως αρχείο κειμένου, πλήρως τοποθετημένο στην πρώτη στήλη. Εάν κάνετε ένα διπλό κλικ στο CSV, το Excel λαμβάνει άλλη εντολή και εισάγει την CSV όπως πρέπει, χωρίς να ζητάτε επιπλέον ερωτήσεις. Τρίτη επιλογή - Εισάγετε ένα αρχείο στο τρέχον φύλλο. Σε αυτή τη διεπαφή, μπορείτε να προσαρμόσετε τους διαιρέτες, να παρακολουθήσετε αμέσως τι συνέβη. Αλλά ένα πράγμα είναι: λειτουργεί άσχημα. Για παράδειγμα, το Excel δεν κατανοεί τις αναφερόμενες μεταφορές των γραμμών μέσα στα πεδία.

Επιπλέον, η ίδια λειτουργία διατήρησης στο CSV, που προκαλείται από τη διεπαφή και μέσω της μακροεντολής, λειτουργεί με διάφορους τρόπους. Η επιλογή με τη μακροεντολή δεν εξετάζει καθόλου τις περιφερειακές ρυθμίσεις.

Το πρότυπο CSV ως τέτοιο, δυστυχώς, όχι, αλλά εν τω μεταξύ, υπάρχει το λεγόμενο. Σημείωμα. Αυτό το RFC 4180 2005, στο οποίο όλα περιγράφονται αρκετά έξυπνα. Για την απουσία οτιδήποτε άλλο, να τηρούν τουλάχιστον το RFC. Αλλά για συμβατότητα με το Excel, είναι απαραίτητο να ληφθεί υπόψη η κοινωνικότητά του.

  • Μεταξύ των σειρών - η μεταφορά της συμβολοσειράς CRLF [κατά τη γνώμη μου, δεν αξίζει τον περιορισμό των δύο bytes, δηλ. Όπως το CRLF (0 × 0d, 0 × 0a) και CR 0 × 0D]
  • Διαχωριστικά - κόμματα, στο τέλος της γραμμής δεν πρέπει να είναι κόμμα,
  • Στην τελευταία σειρά, το CRLF δεν απαιτείται,
  • Η πρώτη γραμμή μπορεί να είναι μια συμβολοσειρά κεφαλίδας (που δεν έχει επισημανθεί ταυτόχρονα)
  • Οι χώροι που περιβάλλουν τον διαχωριστή του κόμματος αγνοούνται.
  • Εάν η τιμή περιέχει CRLF, CR, LF (σύμβολα συμβολοσειρών), διπλή εισαγωγή ή κόμμα (διαχωριστής πεδίου), τότε απαιτείται η ολοκλήρωση της τιμής σε αποσπάσματα. Διαφορετικά, επιτρέπεται.
  • εκείνοι. Επιτρεπόμενες μεταφράσεις γραμμών μέσα στο πεδίο. Αλλά αυτές οι τιμές των πεδίων πρέπει να διαμορφώνονται,
  • Εάν υπάρχουν διπλά εισαγωγικά μέσα στο αναφερόμενο μέρος, χρησιμοποιεί συγκεκριμένα αποσπάσματα εισαγωγικά στο CSV - την επανάληψή τους.

Εδώ στη σημείωση ABNF Περιγραφή της μορφής:

Αρχείο \u003d εγγραφή * (Crlf Record) Header \u003d όνομα * (όνομα κόμματος) Εγγραφή \u003d πεδίο * (πεδίο κόμμα) Όνομα \u003d πεδίο πεδίου \u003d (διαφυγής / μη διαφυγής) διαφυγής \u003d dquote * (textdata / comma / cr / lf / 2dquote ) Dquote μη δραπετεύεται \u003d * textdata comma \u003d% x2c dquote \u003d% x22 lf \u003d% x0a crlf \u003d cr lf textdata \u003d% x20-21 /% x23-2b /% x2d-7e

Επίσης, κατά την εφαρμογή της μορφής, θα πρέπει να θυμόμαστε ότι επειδή δεν υπάρχουν δείκτες στον αριθμό και τον τύπο των στηλών, καθώς δεν υπάρχει απαίτηση να τοποθετήσετε τον τίτλο, εδώ υπάρχουν συμβάσεις που πρέπει να ξεχάσετε:

  • Μια τιμή συμβολοσειράς από τους αριθμούς που δεν περικλείεται στην προσφορά μπορεί να γίνει αντιληπτό από το πρόγραμμα ως αριθμητικό, γι 'αυτό οι πληροφορίες μπορούν να χαθούν, για παράδειγμα, οι κορυφαίοι μηδενικοί,
  • Ο αριθμός των τιμών σε κάθε σειρά μπορεί να διαφέρει και πρέπει να χειρίζεται σωστά αυτή την κατάσταση. Σε ορισμένες περιπτώσεις πρέπει να προειδοποιήσετε τον χρήστη, σε άλλους - να δημιουργήσετε πρόσθετες στήλες και να τα γεμίσετε κενές τιμές. Μπορείτε να αποφασίσετε ότι ο αριθμός των στηλών ορίζεται από τον τίτλο και μπορείτε να τα προσθέσετε δυναμικά, ως εισαγωγές CSV,
  • Γρήγορη αποσπάσματα μέσω της "Slash" όχι σύμφωνα με το πρότυπο, μην το κάνετε.
  • Δεδομένου ότι δεν υπάρχουν πεδία πεδίων, δεν υπάρχουν απαιτήσεις για αυτούς. Οι διαιρέτες του συνόλου και των κλασματικών τμημάτων σε διαφορετικές χώρες είναι διαφορετικές και αυτό οδηγεί στο γεγονός ότι το ίδιο CSV, που είναι συναρπαστικό από την εφαρμογή, είναι "κατανοητό" σε μια εξορία, στην άλλη. Επειδή το Microsoft Office επικεντρώνεται στην περιφερειακή Ρυθμίσεις των WindowsΚαι μπορεί να υπάρχει οτιδήποτε. Στη Ρωσία, αναφέρεται ότι ο διαχωριστής είναι κόμμα
  • Εάν το CSV δεν είναι ανοιχτό μέσω του μενού "Δεδομένα", αλλά απευθείας, τότε το Excel δεν καθορίζει ερωτήσεις και το πώς φαίνεται σωστό. Για παράδειγμα, ένα πεδίο με τιμή 1,24 κατανοεί την προεπιλεγμένη ως "24 Ιανουαρίου"
  • Το Excel σκοτώνει τα μηδενικά και ενεργοποιεί τους τύπους ακόμη και όταν η τιμή υποδεικνύεται σε εισαγωγικά. Μην το κάνετε, είναι λάθος. Αλλά για να παρακάμψετε αυτό το πρόβλημα του Excel, μπορείτε να κάνετε ένα μικρό "hack" - την αξία για να ξεκινήσετε από το σημάδι "ίση σημάδι", μετά το οποίο είναι δυνατόν να τεθούν σε εισαγωγικά, τι πρέπει να μεταδοθεί χωρίς να αλλάξει τη μορφή.
  • Το Excel έχει έναν ειδικό "ίση", το οποίο στο CSV θεωρείται αναγνωριστικό τύπου. Δηλαδή, αν θα συναντηθεί στο CSV \u003d 2 + 3, θα διπλώσει δύο και τρία και το αποτέλεσμα θα γραφτεί στο κελί. Σύμφωνα με το πρότυπο, δεν πρέπει να το κάνει αυτό.

Παράδειγμα έγκυρου CSV, οι οποίες μπορούν να χρησιμοποιηθούν για δοκιμές:

Επώνυμο, όνομα, διεύθυνση, πόλη / προσωπικό, δείκτης, απλώς μια σειρά Ivanov, Ιβάν, Λέννα 20, Μόσχα, 08075, "1/3" Tyler, John, 110 Αίθριο, PA, 20121, "1.24" "Petrov" " Kul "", Petya, 120 Hambling St., NJ, 08075, "1.24" Smirnov, Vasya, "7452 Street" "κοντά στην πλατεία" Road ", York, 91234," 3-01 ", Μισά, Λένινγκραντ, Λένινγκραντ, 00123, "03-01" "John" "Black Head" ", Claude", Rock, ", Miami Beach, 00111," 0000 "Sergey,

Ακριβώς το ίδιο SCSV:

Επώνυμο; Ονομα; Διεύθυνση; Πόλη-κράτος; δείκτης; Μόνο μια σειρά του Ιβάνοφ. Ιβάν; Λένιν 20; Μόσχα; 08075; "1/3" Tyler; John; 110 ταράτσα; Pa; 20121 · "1.24" petrov "" kul "" "; PETYA, 120 HAWBLING ST.; Nj · 08075 · "1.24" smirnov · vasya · "7452 οδός" "κοντά στην πλατεία" Road ". York; 91234; "3-01"; misha ;; leningrad; 00123; "03-01" "John" "Black Head" "; Claude"; Rock; ""; Miami Beach; 00111; "0000" Sergey ;;

Το πρώτο αρχείο που είναι ρεαλιστικό χωρισμένο, αποθηκεύεται από το V.csv, το Excel δεν θεωρείται καθόλου.

Το δεύτερο αρχείο που σύμφωνα με τη λογική του SCSV θεωρείται και βγαίνει εδώ:

Excel-I Εισαγωγή σφαλμάτων:

  1. Υπήρχαν κενά γύρω από τους διαιρέτες
  2. Η τελευταία στήλη δεν αναγνώρισε πραγματικά, παρά το γεγονός ότι τα δεδομένα σε εισαγωγικά. Η εξαίρεση είναι μια συμβολοσειρά με το "Petrov" - 1,24 αναγνωρίστηκε σωστά εκεί.
  3. Στον τομέα, ο δείκτης Excel "κατέβηκε" τους κορυφαίους μηδέν.
  4. Στο σωστό πεδίο της τελευταίας γραμμής, τα κενά πριν τα αποσπάσματα σταμάτησαν να δείχνουν έναν ειδικό

Εάν χρησιμοποιείτε τη λειτουργικότητα εισαγωγής (δεδομένα -\u003e από το αρχείο) και καλέστε κατά την εισαγωγή όλων των πεδίων με κείμενο, θα είναι η ακόλουθη εικόνα:

Με την προβολή των τύπων που εργάστηκαν, αλλά τώρα οι κανονικά μεταφορές των σειρών δεν υποβάλλονται σε επεξεργασία και το πρόβλημα παραμένει με κορυφαία μηδενικά, εισαγωγικά και περιττούς χώρους. Ναι, και οι χρήστες που ανοίγουν το CSV είναι εξαιρετικά άβολα.

Υπάρχει ένας αποτελεσματικός τρόπος για τον τρόπο με τον οποίο να κάνετε το Excel Μην δίνουν τύπους όταν δεν χρειαζόμαστε. Αλλά θα είναι CSV "ειδικά για το Excel". Αυτό γίνεται με την τοποθέτηση του σημείου "\u003d" μπροστά από τα αποσπάσματα παντού, όπου το πρόβλημα με τους τύπους μπορεί ενδεχομένως. Την ίδια στιγμή αφαιρούμε τα επιπλέον κενά.

Επώνυμο, όνομα, διεύθυνση, πόλη / κράτος; δείκτης; μόνο μια γραμμή του Ivanov, ivan; Λένιν 20, Μόσχα; \u003d "08075"; \u003d "1/3" Tyler; John, 110 Αίθριο, PA; \u003d "20121"; \u003d "1.24" "Petrov" "Kul" ", Peter, 120 Hambling St .; NJ; \u003d" 08075 ". \u003d" 1.24 "Smirnov; Vasya;" 7452 Street " "Κοντά στην πλατεία" "Road"; york; york; \u003d "3-01"; misha ;; leningrad; \u003d "00123"; \u003d 03-01 "" John "" Black Head ""; Claude " · Βράχος; "" miami beach; \u003d "00111"; \u003d "0000" Sergey ;;

Και αυτό συμβαίνει αν ανοίγουμε αυτό το αρχείο στο Excel:

Περίληψη.

Για να δημιουργήσετε ένα τέτοιο CSV, το οποίο θα μπορούσε να χρησιμοποιηθεί, ο χρήστης πρέπει να είναι σε θέση να κάνει τις ακόλουθες ρυθμίσεις πριν από την εξαγωγή:

  1. Επιλέξτε την κωδικοποίηση. Κατά κανόνα, είναι σημαντικό για UTF-8, UTF-16, Windows-1251, Koi8-r. Τις περισσότερες φορές, δεν υπάρχουν άλλες επιλογές. Ένα από αυτά πρέπει να πάει από προεπιλογή. Σε περίπτωση που τα δεδομένα περιέχουν χαρακτήρες που δεν διαθέτουν ανάλογα στην κωδικοποίηση στόχου, πρέπει να προειδοποιήσετε τον χρήστη ότι τα δεδομένα θα σπάσουν.
  2. Επιλέξτε διαχωριστικό μεταξύ πεδίων. Επιλογές - Πίνακας, κόμμα, σημείο με κόμμα. Από προεπιλογή - ένα σημείο με κόμμα. Μην ξεχνάτε ότι αν ο διαχωριστής εισάγεται στο κείμενο, θα είναι πολύ δύσκολο να εισέλθετε στην καρτέλα, είναι επίσης ένα αδράνεια σύμβολο.
  3. Επιλέξτε διαχωριστικό μεταξύ σειρών (CRLF 0 × 0D 0 × 0A ή CR 0 × 0D).
  4. Επιλέξτε τον ακέραιο και κλασματικό διαχωριστή για αριθμητικά δεδομένα (σημείο ή κόμμα).
  5. Επιλέξτε εάν θα εμφανιστεί μια συμβολοσειρά κεφαλίδας.
  6. Επιλέξτε πώς να πραγματοποιήσετε klotting specialsimeters (ειδικά σειρές και αποσπάσματα μεταφράσεις). Κατ 'αρχήν, μπορείτε να υποχωρήσετε από το πρότυπο και να τις ανέφεραν ως \\ n και \\ ", αλλά σε αυτή την περίπτωση, μην ξεχάσετε να Quort τον εαυτό σας \\ n, αν συναντηθούν και μην το ξεχάσετε να το κάνετε αυτό με μια επιλογή κατά την εξαγωγή των εισαγωγών. Αλλά η συμβατότητα θα πάει στο δάσος, επειδή οποιοδήποτε πρότυπο σχεδιασμό αναλυτών RFC ..., "ABC \\", ... καταμέτρηση για ένα σφάλμα.
  7. πολύ ιδανικό - Βάλτε ένα τσίμπημα "για το Excel" και λάβετε υπόψη εκεί εκείνες τις μη τυποποιήσεις που έκαναν τη Microsoft. Για παράδειγμα, αντικαταστήστε τις τιμές των αριθμητικών πεδίων, "παρόμοιες με την ημερομηνία", στο σχέδιο \u003d "<значение поля>«.
  8. Αποφασίστε εάν θα αφήσετε την "ουρά" από τους άδειους διαχωριστέςαν σχηματίζεται. Για παράδειγμα, από 20 πεδία μόνο τα πρώτα περιέχουν δεδομένα και τα υπόλοιπα είναι κενά. Ως αποτέλεσμα, στη γραμμή μπορείτε είτε να δημοσιεύσετε μετά από τους πρώτους 19 διαχωριστές είτε να μην εγκαταστήσετε. Για μεγάλες ποσότητες δεδομένων, μπορεί να αποθηκεύσει την επεξεργασία των χιλιοστών του δευτερολέπτου και να μειώσει το μέγεθος του αρχείου.

Για να δημιουργήσετε έναν καλό και βολικό εισαγωγέα CSV, πρέπει να θυμάστε τα εξής:

  1. Η ανάλυση αρχείων πρέπει να γίνεται από lexems σύμφωνα με τη γραμματική πάνω ή Χρησιμοποιήστε καλά αποδεδειγμένες έτοιμες βιβλιοθήκες (Το Excel λειτουργεί διαφορετικά, επειδή το πρόβλημα εισάγεται).
  2. Παρέχετε στον χρήστη τη δυνατότητα επιλογής κωδικοποίησης (Αρκετά 4 κορυφαία).
  3. Παρέχετε στον χρήστη τη δυνατότητα να επιλέξετε διαχωριστικό μεταξύ πεδίων (κόμμα, πινακίδα, σημείο με κόμμα).
  4. Παρέχετε στον χρήστη τη δυνατότητα να επιλέξετε ένα διαχωριστή μεταξύ σειρώνΑλλά εκτός από τις παραλλαγές CR και CrlF, πρέπει να παρέχονται cr ή crlf. Αυτό οφείλεται στο γεγονός ότι, για παράδειγμα, το Excel κατά την εξαγωγή ενός πίνακα με μεταφράσεις χορδών μέσα στα κύτταρα που εξάγει αυτές τις σειρές σειρών ως CR και οι υπόλοιπες σειρές μοιράζονται το CRLF. Σε αυτή την περίπτωση, όταν εισάγετε το αρχείο, είναι ακόμα, CR ή CRLF.
  5. Παρέχετε στον χρήστη τη δυνατότητα να επιλέξετε ένα διαχωριστικό μεταξύ ολόκληρων και κλασματικών εξαρτημάτων (κόμμα ή σημείο) ·
  6. Αποφασίστε με τη μέθοδο ανάλυσης - Πρώτα διαβάζουμε τα πάντα στη μνήμη, στη συνέχεια επεξεργαστείτε ή επεξεργαστείτε μια συμβολοσειρά για μια συμβολοσειρά. Στην πρώτη περίπτωση, μπορεί να χρειαστείτε περισσότερη μνήμη, στη δεύτερη περίπτωση, το σφάλμα στη μέση θα προκαλέσει μερικές εισαγωγές, οι οποίες μπορούν να προκαλέσουν προβλήματα. Προτιμώντας την πρώτη επιλογή.

Rauf Aliyev,
Αναπληρωτής Τεχνικός Διευθυντής Mail.ru Group

CSV. (Οι τιμές που διαχωρίζονται με κόμματα) είναι μια κοινή μορφή για την αποθήκευση δεδομένων πίνακα (αριθμητικό και κείμενο) ως απλό κείμενο. Αυτή η μορφή των αρχείων είναι δημοφιλής και η ζωή λόγω του γεγονότος ότι ένας τεράστιος αριθμός προγραμμάτων και εφαρμογών κατανοούν το CSV, τουλάχιστον ως εναλλακτική λύση Μορφή αρχείου Για εισαγωγή / εξαγωγή. Επιπλέον, η μορφή CSV επιτρέπει στον χρήστη να εξετάσει το αρχείο και να βρει αμέσως ένα πρόβλημα με τα δεδομένα, αν υπάρχει, αλλάξει τον διαχωριστή CSV, τους κανόνες αναφοράς και ούτω καθεξής. Αυτό είναι δυνατό επειδή το CSV είναι ένα απλό κείμενο και ούτε καν ένας έμπειρος χρήστης, θα είναι σε θέση να το καταλάβει εύκολα χωρίς ειδική εκπαίδευση.

Σε αυτό το άρθρο θα μάθουμε γρήγορα και Αποτελεσματικές μέθοδοι Εξαγωγή δεδομένων από το Excel στο CSV και μάθετε πώς να μετατρέψετε Αρχειοθέτηση του excel Σε CSV, διατηρώντας χωρίς παραμόρφωση όλα τα ειδικά και ξένα σύμβολα. Οι τεχνικές που περιγράφονται στο άρθρο του άρθρου σε όλες τις εκδόσεις του Excel 2013, 2010 και 2007.

Πώς να μετατρέψετε το αρχείο Excel στο CSV

Εάν θέλετε να εξάγετε το αρχείο Excel σε οποιαδήποτε άλλη εφαρμογή, για παράδειγμα, στο Βιβλίο διευθύνσεων Outlook ή Βάση δεδομένων Δεδομένα πρόσβασης, Προ-μετατροπή του Excel στο αρχείο CSV και, στη συνέχεια, εισαγάγετε το αρχείο. .csv Σε άλλη εφαρμογή. Παρακάτω δίνεται Οδηγός βήμα προς βήμαΠώς να εξάγετε το βιβλίο εργασίας του Excel σε μορφή CSV χρησιμοποιώντας το εργαλείο Excel - " Αποθήκευση ως».

Σχόλιο: Όλες οι προαναφερθείσες μορφές αποθηκεύουν μόνο ένα ενεργό φύλλο Excel.


Εξαγωγή από το Excel σε CSV με κωδικοποίηση UTF-8 ή UTF-16

Εάν ένα φύλλο Excel περιέχει οποιοδήποτε ειδικό ή ξένο σύμβολο (Tilde, έμφαση και παρόμοια) ή ιερογλυφικά, ο μετασχηματισμός του φύλλου Excel στη μέθοδο CSV που περιγράφεται παραπάνω δεν θα λειτουργήσει.

Το γεγονός είναι ότι η ομάδα Αποθήκευση ως > CSV. (Αποθήκευση ως\u003e CSV) θα στρεβλώσει όλους τους χαρακτήρες εκτός από την ASCII (ο αμερικανικός τυπικός κωδικός για ανταλλαγή πληροφοριών). Και αν υπάρχουν ζευγαρωμένα αποσπάσματα ή μακρά παύλα στο φύλλο Excel (μεταφέρονται στο Excel, για παράδειγμα, από Έγγραφο λέξη. Κατά την αντιγραφή / εισαγωγή κειμένου) - τα σύμβολα αυτά θα είναι επίσης αυθόρμητα.

  • UTF-8. - Αυτή είναι μια πιο συμπαγή κωδικοποίηση που χρησιμοποιεί για κάθε χαρακτήρα από 1 έως 4 bytes. Πιο συχνά συνιστάται η χρήση αυτής της μορφής όταν οι χαρακτήρες ASCII κυριαρχούν στο αρχείο, επειδή Οι περισσότεροι από αυτούς τους χαρακτήρες απαιτούν 1 byte μνήμης. Ένα άλλο πλεονέκτημα είναι ότι η κωδικοποίηση του αρχείου UTF-8 που περιέχει μόνο χαρακτήρες ASCII, δεν θα διαφέρει από το ίδιο αρχείο ASCII.
  • UTF-16 Χρησιμοποιεί από 2 έως 4 byte για να αποθηκεύσετε κάθε σύμβολο. Σημειώστε ότι σε όλες τις περιπτώσεις το αρχείο UTF-16 απαιτεί περισσότερο χώρο στη μνήμη από το αρχείο UTF-8. Για παράδειγμα, οι ιαπωνικοί χαρακτήρες καταλαμβάνουν από 3 έως 4 bytes στο UTF-8 και από 2 έως 4 bytes στο UTF-16. Έτσι, έχει νόημα να χρησιμοποιήσετε το UTF-16 εάν τα δεδομένα περιέχουν ασιατικούς χαρακτήρες, όπως ιαπωνικά, κινέζικα και κορεατικά. Ένα σημαντικό μειονέκτημα αυτής της κωδικοποίησης είναι ότι δεν είναι πλήρως συμβατό με αρχεία ASCII και απαιτείται Ειδικά προγράμματα Για να εμφανίσετε τέτοια αρχεία. Θυμηθείτε αυτό αν σκοπεύετε να εισαγάγετε τα αρχεία που προκύπτουν από το Excel κάπου αλλού.

Πώς να μετατρέψετε το αρχείο Excel στο CSV UTF-8

Ας υποθέσουμε ότι έχουμε ένα φύλλο Excel με ξένα σύμβολα, στο παράδειγμά μας είναι τα ιαπωνικά ονόματα.

Για να εξαγάγετε αυτή τη λίστα Excel στο αρχείο CSV, διατηρώντας ταυτόχρονα όλους τους χαρακτήρες, θα κάνουμε τα εξής:


Σχόλιο: Όλοι οι απλοί επεξεργαστές κειμένου υποστηρίζουν πλήρως τους χαρακτήρες Unicode, έτσι ώστε μερικά από αυτά να μπορούν να εμφανίζονται ως ορθογώνια. Στις περισσότερες περιπτώσεις, δεν θα επηρεάσει το τελικό αρχείο και απλά δεν μπορείτε να δώσετε προσοχή σε αυτό ή να επιλέξετε έναν πιο προηγμένο επεξεργαστή, για παράδειγμα, το Notepad ++.

  1. Επειδή στο αρχείο Unicode κειμένου, η καρτέλα χρησιμοποιείται ως διαχωριστικά και θέλουμε να το μετατρέψουμε σε CSV (διαχωριστές κόμματος), τότε είναι απαραίτητο να αντικατασταθούν τα σύμβολα καρτέλας για κόμμα.

Σχόλιο: Εάν δεν υπάρχει αυστηρή ανάγκη να πάρετε ένα αρχείο με delimiters - κόμματα και χρειάζεστε οποιοδήποτε αρχείο CSV που μπορεί να καταλάβει το Excel, τότε αυτό το βήμα μπορεί να παραλειφθεί, αφού το Microsoft Excel εξαιρετικό κατανοεί τα αρχεία με έναν διαχωριστή.

Σχόλιο: Εάν το αρχείο σας προορίζεται για χρήση έξω από το Excel και η μορφή UTF-8 είναι μια υποχρεωτική απαίτηση, μην κάνετε αλλαγές στο φύλλο και μην το αποθηκεύσετε ξανά στο Excel, καθώς μπορεί να οδηγήσει σε προβλήματα με την κωδικοποίηση ανάγνωσης. Εάν κάποιο μέρος των δεδομένων δεν εμφανίζεται στο Excel, ανοίξτε το ίδιο αρχείο στο Σημειωματάριο και κάντε διορθώσεις στα δεδομένα. Μην ξεχάσετε να αποθηκεύσετε ξανά το αρχείο σε μορφή UTF-8.

Πώς να μετατρέψετε το αρχείο Excel στο CSV UTF-16

Η εξαγωγή στο αρχείο CSV UTF-16 είναι πολύ ταχύτερη και ευκολότερη από ό, τι στο UTF-8. Το γεγονός είναι ότι το Excel χρησιμοποιεί αυτόματα τη μορφή UTF-16 κατά την αποθήκευση ενός αρχείου ως Κείμενο Unicode (Κείμενο Unicode).

Για να το κάνετε αυτό, αποθηκεύστε το αρχείο χρησιμοποιώντας το εργαλείο Αποθήκευση ως (Αποθήκευση ως) στο Excel και στη συνέχεια στην Εξερεύνηση των Windows αλλάξτε την επέκταση του δημιουργούμενου αρχείου σε .csv. Ετοιμος!

Εάν χρειάζεστε ένα αρχείο CSV με ένα ερωτηματικό ή ένα ερωτηματικό ως διαχωριστικό, αντικαταστήστε όλες τις καρτέλες σε κόμματα ή ερωτηματικά, αντίστοιχα, στο σημειωματάριο ή σε οποιοδήποτε άλλο επεξεργαστής κειμένου στην επιλογή σας (νωρίτερα σε αυτό το άρθρο Λεπτομερείς οδηγίες, πώς γίνεται).

Άλλοι τρόποι μετατροπής αρχείων Excel στο CSV

Οι παραπάνω μέθοδοι για την εξαγωγή δεδομένων από το Excel σε CSV (UTF-8 και UTF-16) είναι καθολικά, δηλ. Κατάλληλο για εργασία με οποιονδήποτε ειδικούς χαρακτήρες και σε οποιαδήποτε έκδοση του Excel από το 2003 έως το 2013.

Υπάρχουν πολλοί άλλοι τρόποι για τη μετατροπή δεδομένων από τη μορφή Excel σε CSV. Σε αντίθεση με τις παραπάνω αποφάσεις, αυτές οι μέθοδοι δεν θα οδηγήσουν σε ένα καθαρό αρχείο UTF-8 (αυτό δεν αφορά, το οποίο μπορεί να εξάγει τα αρχεία του Excel σε διάφορες επιλογές κωδικοποίησης UTF). Αλλά στις περισσότερες περιπτώσεις, το προκύπτον αρχείο θα περιέχει το σωστό σύνολο χαρακτήρων, το οποίο στη συνέχεια μπορεί να μετατρέψει ανώδυνα σε μορφή UTF-8 χρησιμοποιώντας οποιοδήποτε πρόγραμμα επεξεργασίας κειμένου.

Μεταμορφώνουμε το αρχείο Excel στο CSV χρησιμοποιώντας το Google Tables

Όπως αποδείχθηκε, είναι δυνατόν να μετατρέψετε απλά το αρχείο Excel σε CSV χρησιμοποιώντας πίνακες Google. Υπό την προϋπόθεση ότι η μονάδα Google είναι ήδη εγκατεστημένη στον υπολογιστή σας, εκτελέστε τα ακόλουθα 5 απλά βήματα:

Υπόδειξη: Εάν το αρχείο Excel είναι σχετικά μικρό, τότε για εξοικονόμηση χρόνου, μπορείτε να μεταφέρετε δεδομένα στο τραπέζι Google χρησιμοποιώντας το αντίγραφο / ένθετο.


Τέλος, ανοίξτε το δημιουργημένο αρχείο CSV σε οποιονδήποτε επεξεργαστή κειμένου για να βεβαιωθείτε ότι όλοι οι χαρακτήρες αποθηκεύονται σωστά. Δυστυχώς, τα αρχεία CSV που δημιουργήθηκαν με αυτόν τον τρόπο δεν εμφανίζονται πάντα σωστά στο Excel.

Αποθηκεύστε το αρχείο.xlsx ως .xls και στη συνέχεια μετατρέψτε στο αρχείο CSV

Αυτή η μέθοδος δεν απαιτεί πρόσθετα σχόλια, καθώς όλα είναι σαφή από το όνομα.

Βρήκα αυτή την απόφαση σε ένα από τα φόρουμ αφιερωμένα στο Excel, δεν θυμάμαι πλέον τι ακριβώς. Ειλικρινά, ποτέ δεν χρησιμοποίησα αυτή τη μέθοδο, αλλά, σύμφωνα με τις ανασκοπήσεις πολλών χρηστών, μερικοί Ειδικά σύμβολα χάνονται αν αποθηκεύσετε απευθείας από .xlsx σε .csvαλλά παραμένουν, αν πρώτα .xlsx αποθήκευση ως .xls.και τότε πώς .csv, σαν κι εμάς .

Ένας ή ένας άλλος, δοκιμάστε αυτή τη μέθοδο δημιουργίας αρχείων CSV από το Excel και αν εμφανιστεί, θα είναι μια καλή εξοικονόμηση χρόνου.

Αποθηκεύστε το αρχείο Excel ως CSV χρησιμοποιώντας το OpenOffice

Το OpenOffice είναι ένα ανοιχτό πακέτο εφαρμογών. Κωδικός πηγήςΑυτό περιλαμβάνει μια αίτηση για εργασία με τους πίνακες, οι οποίοι τέλεια αντιμετωπίζουν το καθήκον των δεδομένων εξαγωγής από τη μορφή Excel στο CSV. Στην πραγματικότητα, αυτή η εφαρμογή παρέχει πρόσβαση σε μεγαλύτερο αριθμό παραμέτρων κατά τη μετατροπή των πινάκων σε αρχεία CSV (κωδικοποίηση, διαιρέτες κ.λπ.) από το Excel και τα φύλλα της Google σε συνδυασμό.

Απλά ανοίξτε το αρχείο Excel στο OpenOffice Calc, κάντε κλικ στο κουμπί Αρχείο > Αποθήκευση ως (Αρχείο\u003e Αποθήκευση ως) και επιλέξτε τον τύπο του αρχείου Κείμενο CSV. (Κείμενο CSV).

Στο Επόμενο κλάσμα Προτείνεται η επιλογή των τιμών παραμέτρων Κωδικοποίηση (Σύνολα χαρακτήρων) και Διαχωριστής πεδίου (Οριοθέτης πεδίου). Φυσικά, αν θέλουμε να δημιουργήσουμε ένα αρχείο CSV UTF-8 με κόμματα ως διαχωριστές, τότε επιλέξτε UTF-8. Και εισάγετε το κόμμα (,) στα αντίστοιχα πεδία. Παράμετρος Διαχωριστήρας κειμένου (Οριοθέτης κειμένου) αφήνεται συνήθως αμετάβλητες - εισαγωγικά ("). Επόμενο κλικ Εντάξει.

Με τον ίδιο τρόπο για μια γρήγορη και ανώδυνη μετατροπή από το Excel στο CSV, μπορείτε να χρησιμοποιήσετε μια άλλη εφαρμογή - LibreOffice. Συμφωνώ, θα ήταν ωραίο αν το Microsoft Excel έδωσε την ευκαιρία να προσαρμόσει τις παραμέτρους κατά τη δημιουργία αρχείων CSV.

Σε αυτό το άρθρο, μου είπε τις μεθόδους μετατροπής αρχείων Excel σε CSV. Εάν είστε εξοικειωμένοι περισσότερο Αποτελεσματικές μέθοδοι Εξαγωγές από το Excel στο CSV, πείτε μας σχετικά με τα σχόλια. Ευχαριστώ για την προσοχή!

Csv ( Αξιοθετημένες τιμές - οι τιμές που χωρίζονται με κόμματα) είναι Μορφή κειμένουπου έχουν σχεδιαστεί για να αντιπροσωπεύουν τα δεδομένα πίνακα. Για παράδειγμα, χρησιμοποιείται για την εξαγωγή δεδομένων εάν οι όγκοι τους είναι αρκετά μεγάλοι. Ωστόσο, το πρόβλημα συμβαίνει συχνά: Το αρχείο CSV που δημιουργήθηκε μπορεί να μην εμφανίζει τα σύμβολα του ρωσικού αλφαβήτου ή να τους παραμορφώσουν. Ωστόσο, αυτό το πρόβλημα επιλύεται εύκολα.

Η ουσία του προβλήματος έχει ως εξής. Εάν η έκδοση του Excel στην οποία λειτουργεί ο χρήστης δεν είναι αγγλική, μπορεί να περιμένει μια άλλη κωδικοποίηση αρχείων CSV που δημιουργήθηκε για την εξαγωγή δεδομένων. Συγκεκριμένα: η κωδικοποίηση της γλώσσας στην οποία ανήκει η έκδοση του Excel. Ταυτόχρονα, αυτά τα σύμβολα που δεν περιλαμβάνονται στο πρότυπο σύνολο ASCII μπορούν να παραμορφωθούν.

Το πρόβλημα επιλύεται με τον ακόλουθο απλό τρόπο:

1. Εκτελέστε το Excel.
2. Ανοίξτε το "Δεδομένα → Από το κείμενο" (σε εντοπισμένο Excel, τα στοιχεία μενού μπορούν να καλούνται διαφορετικά).
3. Ανοίξτε το αρχείο CSV και στο παράθυρο Wizard Text, εγκαταστήστε τον απαιτούμενο διαχωριστή και την κωδικοποίηση (χρησιμοποιήστε το "UTF-8").

Οδηγίες για την επίλυση του ίδιου προβλήματος για τη ρωσική γλώσσα του Excel 2007

1. Δημιουργία νέο έγγραφο (Βιβλίο) στο Excel

2. Στο μενού "Δεδομένα / εξόδου", επιλέξτε Εισαγωγή "από κείμενο". Στο παράθυρο επιλογής αρχείων, επιλέξτε το αρχείο CSV. Το Excel θα ξεκινήσει αυτόματα το κύριο κειμένου (εισαγωγή).

3. Στη ρύθμιση "Μορφή αρχείου", επιλέξτε "Unicode (UTF-8)":

5. Στη συνέχεια, κάντε κλικ στο κουμπί Τέλος. Για Σωστή επιλογή Δεν πρέπει να είναι τα προβλήματα κωδικοποίησης με επαρκή εμφάνιση κυριλλικών χαρακτήρων.

Και κάτι σημαντικό και απαραίτητο ...

Ο ιστότοπός μας ήταν χρήσιμος για εσάς;

Έχω ένα αρχείο Excel που έχει μερικούς ισπανικούς χαρακτήρες (Tildes, κλπ.) Τι πρέπει να μετατρέψω στο αρχείο CSV για να χρησιμοποιήσω ως αρχείο εισαγωγής. Ωστόσο, όταν σώζω τόσο το CSV, παραμορφώνει τους "ειδικούς" ισπανικούς χαρακτήρες που δεν είναι χαρακτήρες ASCII. Φαίνεται ότι συμβαίνει επίσης με τα αριστερά και τα δεξιά αποσπάσματα και τις μακριές παύλες, οι οποίες φαίνεται να προέρχονται από τον χρήστη πηγής δημιουργώντας ένα αρχείο Excel στο Mac.

Επειδή το CSV είναι απλά ένα αρχείο κειμένου, είμαι βέβαιος ότι μπορεί να επεξεργαστεί την κωδικοποίηση UTF8, οπότε υποθέτω ότι πρόκειται για έναν περιορισμό του Excel, αλλά ψάχνω για έναν τρόπο να φτάσω από το Excel σε CSV και να εξοικονομήσετε άλλους χαρακτήρες εκτός από το ASCII.

30 απαντήσεις

Σημείωση: Προσέξτε με εμπιστευτικά δεδομένα από φύλλα Google.

Μετά την αποταμίευση στο CSV κάτω από το Excel Γραμμή εντολών Βάζω:

Iconv -f cp1250 -t UTF-8 κωδικοποιημένο-cp1250.csv\u003e κωδικοποιημένο αρχείο-utf8.csv

(Μην ξεχάσετε να αντικαταστήσετε το CP1250 με την κωδικοποίηση σας).

Λειτουργεί γρήγορα και εξαιρετικά μεγάλα αρχεία, όπως η βάση δεδομένων κώδικα αλληλογραφίας που δεν μπορεί να εισαχθεί σε GoogleDocs (περιορισμένα 400.000 κύτταρα).

υποστηρίζω Τετάρτη παράθυρα, Να αποθηκεύσετε και να συνεργαστείτε με το αρχείο, όπως συνήθως, στο Excel, αλλά στη συνέχεια ανοίξτε το αποθηκευμένο αρχείο Excel στο GNOME Gnumeric (δωρεάν). Αποθηκεύστε το Gnome Gnumeric Table ως CSV, το οποίο - για μένα σε κάθε περίπτωση, το σώζει ως UTF-8 CSV.

Ένας απλός τρόπος για να το κάνετε αυτό είναι: Κατεβάστε το Open Office (), κατεβάστε το υπολογιστικό φύλλο και ανοίξτε το αρχείο Excel (.xls or.xlsx). Στη συνέχεια, απλά αποθηκεύστε το ως αρχείο CSV κειμένου και το παράθυρο ανοίγει για να αποθηκεύσει την τρέχουσα μορφή ή να αποθηκεύσετε ως. Μορφή ODF. Επιλέξτε "Αποθήκευση τρέχουσας μορφής" και σε ένα νέο παράθυρο, επιλέξτε την επιλογή που λειτουργεί καλύτερα για εσάς, σύμφωνα με τη γλώσσα στην οποία είναι γραμμένο το αρχείο σας. Για ισπανικά, επιλέξτε Δυτική Ευρώπη (Windows-1252 / Winlatin 1) και το αρχείο λειτουργεί μόνο καλά. Εάν επιλέξετε Unicode (UTF-8), δεν θα λειτουργήσει με ισπανικούς χαρακτήρες.

Επίσης, έτρεξα στο ίδιο πρόβλημα, αλλά γι 'αυτό υπάρχει μια απλή λύση.

  1. Ανοίξτε το αρχείο XLSX στο Excel 2016 ή υψηλότερο.
  2. Στο "Αποθήκευση ως" Επιλέξτε αυτήν την επιλογή: "(CSV UTF-8 (με διαχωριστές κόμματος) *. CSV)"

Λειτουργεί τέλεια και δημιουργείται το αρχείο CSV, το οποίο μπορεί να εισαχθεί σε οποιαδήποτε λογισμικό. Έχω εισάγει αυτό το αρχείο CSV στη βάση δεδομένων μου Sqlite και λειτουργεί καλά με όλους τους χαρακτήρες Unicode.

Έγραψα ένα μικρό σενάριο Python, το οποίο μπορεί να εξάγει φύλλα στο UTF-8.

Απλά πρέπει να δώσετε ένα αρχείο Excel ως την πρώτη παράμετρο και στη συνέχεια τα φύλλα που θέλετε να εξάγετε. Εάν τα φύλλα δεν παρέχονται, το σενάριο εξάγει όλα τα φύλλα που υπάρχουν στο αρχείο Excel.

# / USR / BIN / ENV PYTHON # φύλλα δεδομένων από XLSX σε CSV από OpenpyXL Εισαγωγή φορτίου_WorkBook Εισαγωγή CSV από OS Εισαγωγή SYS RELOAK (SYS) SYSSEDEFAUTECODING ("UTF-8") DEF GET_ALL_SHEETS: φύλλα \u003d βιβλίο εργασίας \u003d φορτίο excel_file, use_itherators \u003d true, data_only \u003d true) all_worksheets \u003d workbook.get_sheet_names () για το φύλλο εργασίας στο all_worksheets: sheets.Append (worksheet_file) φύλλα επιστροφής TRUE) Για φύλλα εργασίας σε φύλλα: Εκτύπωση ("Εξαγωγή" + Worksheet_Name + "...") Δοκιμάστε: Worksheet \u003d workebook.get_sheet_by_name (worksheet_name) εκτός από keyError: Εκτύπωση ("Δεν ήταν δυνατή η εύρεση" + worksheet_name) sys.exit (1) Your_csv_file \u003d open (". Συμμετοχή ()," WB ") wr \u003d csv.writer (your_csv_file, αναφερόμενο \u003d csv.quote_all) για σειρά σε φύλλο εργασίας.iter_ere (): Lrow \u003d για κελί στη σειρά: Lrow. Προσάρτηση (Cell. Αξία) wr.writerow (lrow) Εκτύπωση ("... γίνει") your_csv_file.Close () αν όχι 2<= len(sys.argv) <= 3: print("Call with " + sys.argv + " ") sys.Exit (1) αλλιώς: φύλλα \u003d αν len (sys.argv) \u003d\u003d 3: φύλλα \u003d λίστα (sys.argv.split (", ")) αλλιώς: φύλλα \u003d get_all_sheets (sys.argv) Assert (sys.argv) Φύλλα! \u003d Κανένα και Len (φύλλα)\u003e 0) csv_from_excel (sys.argv, φύλλα)