Hijeroglife u Exceleu kako to škripac. Što ako CSV izvozna datoteka ne prikazuje ruske znakove? Promjena kodiranja u Excelu

Uz potrebu za promjenom kodiranja teksta, često se susreću korisnici koji rade preglednici, uređivači teksta i procesori. Međutim, kada se radi u stolu Excel procesor, takva potreba se također može dogoditi, jer ovaj program ne obrađuje ne samo brojeve, već i tekst. Shvatimo kako promijeniti kodiranje u Exceleu.

Lekcija: Kodiranje u programu Microsoft Word


Kodiranje teksta - Ovaj skup elektroničkih digitalnih izraza koji se pretvaraju u one razumljive za korisničke znakove. Postoji mnogo vrsta kodiranja, od kojih svaki ima svoja pravila i jezik. Vještina programa prepoznavanja određenog jezika i prevodite ga na one razumljive za znakove obične osobe (slova, brojevi, drugi znakovi) određuje hoće li aplikacija moći raditi s određenim tekstom ili ne. Među popularnim tekstualnim kodiranje treba dodijeliti na sljedeći način:

  • Windows-1251;
  • Koi-8;
  • Ascii;
  • Ansi;
  • Uks-2;
  • UTF-8 (Unicode).

Prezime je najčešće među kodiranjem u svijetu, jer se smatra nekom vrstom univerzalnog standarda.

Najčešće, sam program prepoznaje kodiranje i automatski se prebacuje na njega, ali u nekim slučajevima korisnik treba odrediti svoj izgled. Tek tada može ispravno raditi s kodiranim simbolima.

Najveći broj problema s kodiranjem dekodiranja iz programa Excel nastaje kada pokušate otvoriti CSV datoteke ili izvoz txt datoteke, Često, umjesto običnih slova kada otvorite te datoteke putem Excela, možemo promatrati nerazumljivi simboli, tzv. "Krakozhebra". U tim slučajevima, korisnik treba napraviti određene manipulacije kako bi program počeo ispravno prikazati podatke. Postoji nekoliko načina za rješavanje ovog problema.

Metoda 1: Promijenite kodiranje pomoću Notepad ++

Nažalost, punopravni alat koji će vam omogućiti da brzo promijenite kodiranje u bilo kojoj vrsti tekstova iz Excela. Stoga je potrebno koristiti multi-korak rješenja za tu svrhu ili pribjegavati pomoć. aplikacije treće strane, Jedan od najpouzdanijih načina je korištenje urednika teksta Notepad ++.


Iako ova metoda Na temelju korištenja softvera treće strane, to je jedna od najjednostavnijih opcija za prepoznavanje sadržaja datoteka za Excel.

Metoda 2: Primjena čarobnjaka za tekst

Osim toga, možete pretvoriti i koristiti ugrađene programske alate, odnosno čarobnjake za tekst. Čudno je dovoljno ovaj alat kompliciraniji od primjene program treće straneopisano u prethodnoj metodi.

Metoda 3: Spremanje datoteke u određenom kodiranju

Tu je i obrnuta situacija kada se datoteka ne smije otvoriti s ispravnim prikazom podataka i spremiti u instaliranom kodiranju. U Excelu možete izvesti ovaj zadatak.


Dokument će biti spremljen na tvrdom disku ili izmjenjivim medijima u kodiranju koje ste identificirali. Ali morate uzeti u obzir da je sada uvijek dokumenti pohranjeni u Excelu bit će spremljeni u ovom kodiranju. Da biste ga promijenili, morate ponovno izaći. "Parametri web dokumenata" i promijenite postavke.

Postoji još jedan način za promjenu postavki kodiranja spremljenog teksta.

CSV je de facto standard za komunikaciju između heterogenih sustava, za prijenos i obradu volumetrijskih podataka s "tvrdom", tabličnom strukturom. U mnogim skriptiranim programskim jezicima, ugrađeni su alati i alati za generiranje, dobro je shvaćen kao programeri i obični korisnici, a problemi sa samim podacima dobro su otkriveni u njemu, kao što kažu, oko.

Povijest ovog formata ima najmanje 30 godina. Ali čak i sada, u eri pomoći XML, CSV se još uvijek koristi za učitavanje i preuzimanje velikih količina podataka. I, unatoč činjenici da je sama format prilično dobro opisan u RFC-u, svaki ga razumije na svoj način.

U ovom članku, pokušat ću sažeti postojeće znanje o ovom formatu, ukazati na tipične pogreške, kao i ilustrirati probleme opisane na primjeru uvoza i izvoza uvozne krivulje u Microsoft Office. 2007. Također ću pokazati kako zaobići te probleme (uklj. Automatska transformacija Excel tipova u Datetime i Broj) pri otvaranju. CSV.

Počnite s činjenicom da se CSV format zapravo naziva tri različita tekstualna formata koji se razlikuju simboli: zapravo sama CSV (vrijednosti odvojene zarezima - vrijednosti podijeljene zarezima), TSV (vrijednosti odvojene na kartici - vrijednosti - vrijednosti - vrijednosti odvojeni pomoću kartica) i SCSV (vrijednosti odvojene zarezom - vrijednosti odvojene zarezom). U životu se sva tri mogu nazvati jedan CSV, simbol separatora u najboljem slučaju odabran je prilikom izvoza ili uvoza, a češće je "ušiveno" unutar koda. To stvara mnogo problema u pokušaju da shvati.

Kao ilustracija, čini se da smo trivijalni zadatak: uvoz u Microsoft Outlook. Podatke iz tablice u Microsoft Excel..

Microsoft Excel ima izvozne alate za CSV, au Microsoft Outlook - odgovarajući uvoz. Što bi moglo biti lakše - napravio datoteku, "kiša" poštanski program I je li slučaj učinio? Nije bitno kako.

Napravite testni znak u Excel:

... i pokušajmo ga izvesti u tri formata teksta:

Kakav zaključak radimo od toga? .. Činjenica da Microsoft pozivi "CSV (Comma-Comma)" zapravo je format s separatorom zarez. Microsoft format je strogo Windows-1251. Stoga, ako imate Unicode-znakove u Excelu, oni će se pojaviti na CSV izlaz za upitnik. Također, da su prijevodi žica uvijek par simbola, činjenica da Microsoft glupo preuzima citati sve gdje vidi točku zarez. Također, ako uopće nemate Unicode znakove, možete spremiti na datoteku. Također da je Unicode podržan samo UTF-16, a ne UTF-8, koji bi bio jako logičan.

Sada ćemo vidjeti kako je Outlook pogleda. Pokušajmo uvesti te datoteke iz njega navodeći iste izvore podataka. Outlook 2007: File -\u003e Uvoz i izvoz ... -\u003e Uvoz iz drugog programa ili datoteke. Zatim odaberite format podataka: "Vrijednosti podijeljene zarezima (Windows)" i "Vrijednosti odvojene karticom (Windows)".

Dva Microsoftova proizvoda ne razumiju jedni druge, oni nemaju priliku proći tekstualna datoteka Strukturirani podaci. Da bi sve potrebno, "plesovi s programom za tamburinu".

Sjećamo se da Microsoft Excel može raditi s tekstualnim datotekama, uvesti podatke iz CSV-a, ali u verziji 2007. čini ga vrlo čudnim. Na primjer, ako jednostavno otvorite datoteku putem izbornika, otvorit će se bez prepoznavanja formata, jednostavno kao tekstualnu datoteku, u potpunosti smještena u prvom stupcu. Ako napravite dvokrevetni klik na CSV, Excel prima drugu naredbu i uvesti CSV kao što bi trebao, bez postavljanja dodatnih pitanja. Treća opcija - umetanje datoteke na trenutni list. U ovom sučelju možete prilagoditi razdjelnike, odmah gledati što se dogodilo. Ali jedno je: radi loše. Na primjer, Excel ne razumije citirane transfere linija unutar polja.

Štoviše, ista konzervatorska funkcija u CSV-u, uzrokovana sučeljem i kroz makro, radi na različite načine. Opcija s makronaredbom uopće ne gleda na regionalne postavke.

CSV standard kao takav, nažalost, ne, ali u međuvremenu postoji tzv. Dopis. Ovaj RFC 4180 2005, u kojem je sve opisano sasvim inteligentno. Za odsustvo bilo čega, pridržavati se najmanje rfc. Ali za kompatibilnost s Excelom potrebno je uzeti u obzir njegov boravak.

  • između redova - prijenos crlf niza [po mom mišljenju, nije vrijedilo ograničavati dva bajta, tj. Kao CRLF (0 × 0d, 0 × 0A) i CR 0 × 0d]
  • razdjelnici - zarezima, na kraju linije ne bi trebale biti zarez,
  • u posljednjem redu CRLF nije potreban,
  • prvi redak može biti zaglavljeni niz (nije označen u isto vrijeme)
  • prostori koji okružuju zarez-separator se zanemaruju.
  • ako vrijednost sadrži CRLF, CR, LF (String simboli), dvostruki citat ili zarez (separator polja), tada je potreban zaključak vrijednosti u navodnicima. Inače, to je dopušteno.
  • oni. Dopušteni prijevodi linija unutar polja. Ali takve vrijednosti polja moraju biti konfigurirane,
  • ako postoje dvostruki citati unutar kotiranog dijela, koristi specifične citate citata u CSV-u - njihovom dupliciranju.

Ovdje u Opis ABNF opisu formata:

Datoteka \u003d Record * (CRLF Record) Zaglavlje \u003d Naziv * (Naziv zarezima) Snimanje \u003d polje * (Polje zarez) Name \u003d polje polja \u003d (bježi / ne pobjegao) ) Dkive ne-pobjegao \u003d * textdata zarez \u003d% x2c dquote \u003d% x22 lf \u003d% x0a CRLF \u003d CR lf textdata \u003d% x20-21 /% x23-2b /% x2d-7e

Također, prilikom implementacije formata, treba pamtiti da budući da nema poticaja na broj i vrstu stupaca, budući da ne postoji zahtjev za postavljanje naslova, ovdje postoje konvencije koje trebate ne zaboraviti:

  • brojne vrijednosti od brojeva koji nisu priloženi u ponudi mogu se percipirati programom kao numeričkim, zbog čega se informacije mogu izgubiti, na primjer, vodeći nule,
  • broj vrijednosti u svakom redu može se razlikovati i mora se ispravno rukovati ovom situacijom. U nekim situacijama trebate upozoriti korisnika, u drugima - stvoriti dodatne stupce i ispuniti ih prazne vrijednosti, Možete odlučiti da je broj stupca postavljen na naslovu, a možete ih dinamički dodati kao CSV uvoz,
  • Brzi citati kroz "Slash" ne prema standardu, nemojte to učiniti.
  • Budući da ne postoje polja polja, ne postoje zahtjevi za njih. Razdjelnici cijelog i frakcijskih dijelova u različitim zemljama su različiti, a to dovodi do činjenice da je ista CSV, asgenirana primjenom, "shvaćeno" u jednom egzilu, u drugoj. Jer Microsoft Office se fokusira na regionalnu postavke sustava WindowsI može biti bilo što. U Rusiji je naznačeno da je separator zarez
  • Ako CSV nije otvoren putem izbornika "Data", ali izravno, onda Excel ne navodi nikakva pitanja i čini kako se čini ispravnim. Na primjer, polje s vrijednošću od 1,24 on razumije zadanu kao "24. siječnja"
  • Excel ubija nule i aktivira tipove čak i kada je vrijednost naznačena u navodnicima. Nemojte to učiniti, to je pogreška. Ali kako biste zaobišli ovaj problem Excel, možete napraviti mali "hack" - vrijednost za početak od znaka "jednak znak", nakon čega je moguće staviti na Quoves Što treba prenositi bez mijenjanja formata.
  • Excel ima stručnjaka "jednako", koji se u CSV smatra identifikatorom formule. To jest, ako će se sastati u CSV \u003d 2 + 3, ona će se preklopiti dva i tri, a rezultat će biti napisan u ćeliju. Prema standardu, ne bi trebao to učiniti.

Primjer važenja CSV-a, koji se može koristiti za testove:

Prezime, ime, adresa, grad / osoblje, indeks, samo linija Ivanov, Ivan, Lenica 20, Moskva, 08075, "1/3" Tyler, John, 110 terasa, PA, 20121, "1.24" "Petrov" Kul "", Petya, 120 Hughbling St., NJ, 08075, "1.24" Smirnov, Vasya, "7452 ulica" "u blizini trga" "Road", York, 91234, "3-01", Mishi, Lenjingrad, 00123, "03-01" "" "John" "Crna glava" ", Claude", Rock, ", Miami Beach, 00111," 0000 "Sergey,

Točno isti SCSV:

Prezime; Ime; Adresa; Grad Država; indeks; samo red Ivanov; Ivan; Lenjin 20; Moskva; 08075; "1/3" Tyler; John; 110 terasa; GODIŠNJE; 20121; "1.24" Petrov "" Kul "" "; Petya, 120 hambling sv.; NJ; 08075; "1.24" Smirnov; Vasya; "7452 ulica" "blizu trga" "cesta"; York; 91234; "3-01"; Misha; Lenjingrad; 00123; "03-01" "" John "" Crna glava ""; Claude "; stijena;" "; Plaža Miami; 00111; "0000" Sergey ;;

Prva datoteka koja je realistična zarez - odvojena, koja se spašava od strane V.CSV, Excel uopće ne percipira.

Druga datoteka koja prema logici SCSV percipira i dolazi ovdje:

Excel-i uvoz pogrešaka:

  1. Bilo je praznina okolnih razdjelnika
  2. Posljednji stupac zapravo nije prepoznao, unatoč činjenici da su podaci u citatima. Iznimka je niz s "Petrov" - 1.24.
  3. U polju, Excel indeks "spustio" vodeće nule.
  4. u desnom polju posljednje linije, praznine prije Quotes prestali pokazivati \u200b\u200bna specijalist

Ako koristite funkcionalnost uvoza (podaci -\u003e iz datoteke) i nazovite pri uvozu svih polja s tekstom, to će biti sljedeća slika:

S obzirom na to vrste radio, ali sada normalno transferi redova nisu obrađeni i problem ostaje s vodećim nulama, citatima i nepotrebnim prostorima. Da, a korisnici tako otvoreni CSV je izuzetno neugodan.

Postoji učinkovit način kako učiniti Excel ne daju vrste kada ne trebamo. Ali to će biti CSV "posebno za Excel". To se postiže postavljanjem znaka "\u003d" ispred citata svugdje, gdje problem s vrstama može potencijalno. U isto vrijeme uklanjamo dodatne praznine.

Prezime; ime; adresa; grad / država; indeks; samo crta Ivanov; Ivan; Lenjin 20; Moskva; \u003d "08075"; \u003d "1/3" tyler; John; 110 terasa; PA; \u003d "20121"; \u003d "1.24" "Petrov" "Kul" "Blizu trga" "Road"; York; \u003d "91234"; \u003d "3-01"; Misha ;; Lenjingrad; \u003d "00123"; \u003d "03-01" "" John "" Crna glava "; Claude" ; Rock; "" plaža Miami; \u003d "00111"; \u003d "0000" Sergey ;;

A to je ono što se događa ako otvorimo ovu datoteku u Excelu:

Sažetak.

Za generiranje takve CSV-a, koji se može koristiti, korisnik mora biti u mogućnosti napraviti sljedeće postavke prije izvoza:

  1. odaberite kodiranje, U pravilu, važno je UTF-8, UTF-16, Windows-1251, KOI8-R. Najčešće ne postoje druge opcije. Jedan od njih bi trebao ići po defaultu. U slučaju da podaci sadrže znakove koji nemaju analoge u ciljnom kodiranju, morate upozoriti korisnika da će podaci biti slomljeni;
  2. odaberite separator između polja, Opcije - Tabulacija, zarez, točka s zarezom. Prema zadanim postavkama - točku s zarezom. Ne zaboravite da ako se separator unese u tekst, to će biti vrlo teško ući na karticu, to je također simbol za strizu;
  3. odaberite separator između redaka (Crlf 0 × 0d 0 × 0A ili CR 0 × 0d);
  4. odaberite cijeli broj i frakcijski separator za numeričke podatke (točka ili zarez).
  5. odaberite želite li prikazati konopac zaglavlja;
  6. odaberite kako provoditi allotting specialsimeters (osobito redovi i navodni prijevodi). U načelu, možete ih se povući iz standarda i citirati ih kao n i ", ali u ovom slučaju ne zaboravite se umetnuti, ako se sastanu i ne zaboravite to učiniti s opcijom pri izvozu uvoza. No, kompatibilnost će ići u šumu, jer bilo koji RFC standardni parser dizajn ..., "ABC", ... računati za pogrešku;
  7. vrlo idealno - stavite oznaku "za Excel" i uzeti u obzir tamo ne-standardije koje su učinile Microsoft, Na primjer, zamijenite vrijednosti numeričkih polja, "slično datumu", na dizajnu \u003d "<значение поля>«.
  8. odlučite hoće li napustiti "rep" od praznih separatoraako se formira. Na primjer, od 20 polja samo prvi sadrži podatke, a ostali su prazni. Kao rezultat toga, u liniji možete objaviti nakon prvih 19 separatora ili ne instalirati. Za velike količine podataka može spremiti obradu milisekunda i smanjiti veličinu datoteke.

Da biste izgradili dobar i zgodan CSV uvoznik, morate zapamtiti sljedeće:

  1. analiza datoteke treba obaviti pomoću lexems u skladu s gramatikom iznad ili koristite dobro dokazane knjižnice (Excel radi drugačije, jer se problem uvozi);
  2. pružiti korisniku mogućnost odabira kodiranja (Dovoljno 4);
  3. pružiti korisniku mogućnost odabira separatora između polja (zarez, tabeliranje, točka s zarezom);
  4. pružiti korisniku mogućnost odabira separatora između redakaAli osim CR i CRLF varijante, treba osigurati CR ili CRLF. To je zbog činjenice da, na primjer, Excel prilikom izvoza tablice s prijevodima žica unutar stanica izvozi ove retke žica kao CR, a preostali redovi dijeli CRLF. U tom slučaju, kada uvozite datoteku, to je još uvijek, CR ili CRLF;
  5. pružiti korisniku mogućnost odabira separatora između cijelog i djelomičnog dijelova (zarez ili točka);
  6. odlučite se s metodom analize - Najprije čitamo sve u memoriji, zatim obrađuju ili obrađuje niz za niz. U prvom slučaju, možda će vam trebati više sjećanja, u drugom slučaju, pogreška u sredini samo će uzrokovati djelomični uvoz koji može uzrokovati probleme. Preferiranje prve opcije.

Rauf Aliyev,
Zamjenik tehničkog direktora Mail.ru Group

CSV. (Vrijednosti odvojene zarezom) je zajednički format za spremanje tabličnih podataka (numerički i tekst) kao jednostavan tekst. Ovaj format datoteka je popularan i živote zbog činjenice da veliki broj programa i aplikacija razumije CSV, barem kao alternativu format datoteke Za uvoz / izvoz. Štoviše, CSV format omogućuje korisniku da pogleda u datoteku i odmah pronađe problem s podacima, ako ih ima, promijenite CSV separator, pravila citata i tako dalje. To je moguće jer je CSV jednostavan tekst, a čak ni vrlo iskusan korisnik, to će biti u stanju lako razumjeti bez posebnog treninga.

U ovom članku ćemo se naučiti brzo i učinkovite metode Izvoz podataka iz Excela u CSV i naučite kako pretvoriti excel U CSV-u, zadržavajući bez izobličenja svih posebnih i stranih simbola. Tehnike opisane u članku rade u svim verzijama Excel 2013, 2010. i 2007. godine.

Kako pretvoriti Excel datoteku u CSV

Ako želite izvesti Excel datoteku u bilo koju drugu aplikaciju, na primjer, u adresar Outlook ili baza podataka pristupnim podacima, Unaprijed pretvoriti Excel u CSV datoteku, a zatim uvesti datoteku. .csv U drugu prijavu. U nastavku se daje korak po korak vodičKako izvoziti Excel radne knjige u CSV format pomoću programa Excel - " Spremi kao».

Komentar: Svi gore navedeni formati spremaju samo Excel aktivni list.


Izvoz iz Excela u CSV s UTF-8 ili UTF-16 kodiranje

Ako Excel list sadrži sve posebne ili strane simbole (tilde, naglasak i slične) ili hijeroglife, transformacija Excel lista u gore opisanoj CSV metodi neće raditi.

Činjenica je da je tim Spremi kao > CSV. (Spremi kao\u003e CSV) će iskriviti sve znakove osim ASCII (američki standardni kod za razmjenu informacija). I ako postoje upareni citati ili duga crtica na Excel listu (prebačen u Excel, na primjer, od riječ o dokumentima. Prilikom kopiranja / umetanja teksta) - Takvi će simboli biti spontani.

  • UTF-8. - Ovo je kompaktniji kodiranje koje koristi za svaki znak od 1 do 4 bajta. Najčešće se preporučuje da koristite ovaj format kada u datoteci dominiraju ASCII znakovi, jer Većina tih znakova zahtijeva 1 memorijsku bajtu. Još jedna prednost je da kodiranje datoteke UTF-8 koji sadrži samo ASCII znakove, neće se razlikovati od iste ASCII datoteke.
  • Utf-16 Koristi od 2 do 4 bajta za pohranjivanje svakog simbola. Imajte na umu da u svim slučajevima UTF-16 datoteka zahtijeva više prostora u memoriji od datoteke UTF-8. Na primjer, japanski likovi zauzimaju od 3 do 4 bajta u UTF-8 i od 2 do 4 bajta u UTF-16. Dakle, ima smisla koristiti UTF-16 ako podaci sadrže azijske znakove, uključujući japanski, kineski i korejski. Značajni nedostatak ovog kodiranja je da nije u potpunosti kompatibilan s ASCII datotekama i potrebno posebni programi Za prikaz takvih datoteka. Zapamtite ovo ako planirate uvesti rezultirajuće datoteke iz Excel negdje drugdje.

Kako pretvoriti Excel datoteku na CSV UTF-8

Pretpostavimo da imamo Excel list sa stranim simbolima, u našem primjeru je japanska imena.

Za izvoz ovog popisa Excel u CSV datoteku, zadržavajući sve znakove, učinit ćemo sljedeće:


Komentar: Nisu svi jednostavni uređivači teksta u potpunosti podržavaju Unicode znakove, tako da se neki od njih mogu prikazati kao pravokutnici. U većini slučajeva neće utjecati na konačnu datoteku, a jednostavno ne možete obratiti pozornost na to ili odabrati napredniji urednik, na primjer, Notepad ++.

  1. Budući da je u našem tekstu Unicode datoteku, kartica se koristi kao separatori, a želimo ga pretvoriti u CSV (separatori zarezima), a zatim je potrebno zamijeniti simbole kartice za zarez.

Komentar: Ako nema stroge potrebe da biste dobili datoteku s razdjelnicima - zarezima, a vi trebate bilo koju CSV datoteku koju Excel može razumjeti, onda se ovaj korak može preskočiti, jer Microsoft Excel izvrsno razumije datoteke s separatorom.

Komentar: Ako je vaša datoteka namijenjena za uporabu izvan Excel i UTF-8 formata je obvezni zahtjev, nemojte se mijenjati na listu i nemojte ga ponovno spremiti za Excel, jer to može dovesti do problema s kodiranjem čitanja. Ako se neki dio podataka ne prikaže u Excelu, otvorite istu datoteku u NotePadu i napravite ispravke podacima. Ne zaboravite ponovno spremiti datoteku u UTF-8 formatu.

Kako pretvoriti Excel datoteku u CSV UTF-16

Izvoz u datoteku CSV UTF-16 je mnogo brži i lakši nego u UTF-8. Činjenica je da Excel automatski koristi format UTF-16 pri spremanju datoteke kao Tekst Unicode (Unicode Text).

Da biste to učinili, spremite datoteku pomoću alata Spremi kao (Spremi kao) u Excelu, a zatim u sustavu Windows Explorer promijenite proširenje stvorene datoteke .csv, Spreman!

Ako vam je potrebna CSV datoteka s polukolonom ili zarezom kao separatorom, zamijenite sve kartice na zarezima ili zareznim točkama, u Noteadu ili u bilo kojem drugom uređivač teksta na po vašem izboru (ranije u ovom članku detaljne upute, kako je to učinjeno).

Drugi načini za pretvaranje Excel datoteka u CSV

Gornje metode za izvoz podataka iz Excela u CSV (UTF-8 i UTF-16) su univerzalni, tj. Pogodno za rad s bilo kojim posebnim znakovima iu bilo kojoj verziji programa Excel od 2003. do 2013. godine.

Postoje mnogi drugi načini za pretvaranje podataka iz Excel formata na CSV. Za razliku od gore navedenih odluka, ove metode neće rezultirati čistom UTF-8 datotekom (to se ne odnosi na, što može izvoziti Excel datoteke u nekoliko UTF opcija kodiranja). No, u većini slučajeva, rezultirajuća datoteka će sadržavati ispravan skup znakova, koji tada može biti bezbolno pretvoriti u UTF-8 format pomoću bilo kojeg uređivača teksta.

Mi transformiramo Excel datoteku u CSV koristeći Google tablice

Kako se ispostavilo, moguće je jednostavno pretvoriti Excel datoteku u CSV pomoću Google tablice. Pod uvjetom da je Google pogon već instaliran na vašem računalu, izvedite sljedeće 5 jednostavnih koraka:

Savjet: Ako je Excel datoteka relativno mala, onda uštedjeti vrijeme, možete prenijeti podatke na Google tablicu pomoću kopiranja / umetka.


Konačno, otvorite stvorenu CSV datoteku u bilo kojem uređivaču teksta kako biste bili sigurni da su svi znakovi ispravno spremljeni. Nažalost, CSV datoteke stvorene na ovaj način nisu uvijek ispravno prikazane u Excelu.

Spremite datoteku.xlsx kao .xls i zatim pretvorite u CSV datoteku

Ova metoda ne zahtijeva nikakve dodatne komentare, jer je sve jasno iz imena.

Našao sam ovu odluku o jednom od foruma posvećenih Excelu, ne sjećam se što točno. Iskreno, nikada nisam koristio ovu metodu, ali, prema mišljenjima mnogih korisnika, neke posebni simboli su izgubljeni ako spremite izravno .xlsx u .csvali ostaju, ako je prvi .xlsx Spremi kao .xls.i onda kako .csv, poput nas .

Na ovaj ili onaj način, pokušajte s ovom metodom stvaranja CSV datoteka iz Excela, a ako se ispostavilo, to će biti dobro štednje.

Spremite Excel datoteku kao CSV pomoću OpenOffice

OpenOffice je otvoreni aplikacijski paket. izvorni kodTo uključuje zahtjev za rad s tablicama, koji se savršeno popisuje s zadatkom izvoza podataka iz Excel format u CSV-u. Zapravo, ova aplikacija omogućuje pristup veći broj parametara prilikom pretvaranja tablica na CSV datoteke (kodiranje, razdjelnici i tako dalje) od Excela i Google listova.

Samo otvorite Excel datoteku u OpenOffice Calc, kliknite Datoteka > Spremi kao (Datoteka\u003e Spremi kao) i odaberite vrstu datoteke Tekst CSV. (Tekst CSV).

Na sljedeća Shage Predlaže se odabrati vrijednosti parametara Kodiranje (Skupovi znakova) i Separator polja (Terenski delimimac). Naravno, ako želimo stvoriti CSV UTF-8 datoteku s zarezima kao separatori, odaberite UTF-8. I uđite u zarez (,) u odgovarajuća polja. Parametar Separator teksta (Tekstni delimiter) obično su ostavljeni nepromijenjeni - citati ("). Sljedeći klik u redu.

Na isti način za brzu i bezbolnu pretvorbu iz Excela u CSV, možete koristiti drugu aplikaciju - LibeOffice. Slažem se, bilo bi lijepo ako je Microsoft Excel pružio priliku prilagoditi parametre prilikom stvaranja CSV datoteka.

U ovom članku, rekao sam mi metode pretvaranja Excel datoteka u CSV. Ako ste više poznati učinkovite metode Izvoz iz Excela u CSV-u, recite nam o tome u komentarima. Hvala na pažnji!

Csv ( Vrijednosti zarez - vrijednosti odvojene zarezima) je format tekstadizajniran za predstavljanje tabličnih podataka. Na primjer, koristi se za izvoz podataka ako su njihove količine dovoljno velike. Međutim, problem se često javlja: CSV datoteka stvorena ne smije pokazati simbole ruske abecede ili ih iskriviti. Međutim, ovaj se problem lako rješava.

Suština problema je sljedeća. Ako Excel verzija u kojoj korisnik radi nije engleski, može očekivati \u200b\u200bjoš jednu CSV datoteku koja kodira stvorena za izvoz podataka. Naime: kodiranje jezika kojem pripada Excelova verzija. U isto vrijeme, ti simboli koji nisu uključeni u standardni ASCII set mogu se iskriviti.

Problem je riješen sljedećim jednostavnim načinom:

1. Pokrenite Excel.
2. Otvorite "Podatke → s teksta" (u lokaliziranim Excel, stavke izbornika mogu se nazvati inače).
3. Otvorite CSV datoteku i u prozoru čarobnjaka za tekst, instalirajte potreban separator i kodiranje (koristite "UTF-8").

Upute za rješavanje istog problema za Ruski jezik Excel 2007

1. Stvorite novi dokument (knjiga) u Excelu

2. U izborniku "Data / Output" odaberite Uvoz "iz teksta". U prozoru odabira datoteka odaberite CSV datoteku. Excel će automatski pokrenuti tekstualni majstor (uvoz).

3. U postavci "Format datoteke" odaberite "Unicode (UTF-8)":

5. Zatim kliknite Završi. Za pravilan izbor Problemi s kodiranjem s odgovarajućim prikazom ćiriličnih znakova ne bi trebali biti.

I nešto važno i potrebno ...

Naša je stranica bila korisna za vas?

Imam Excel datoteku koja ima neke španjolske znakove (tildes, itd.) Što trebam pretvoriti u CSV datoteku za korištenje kao uvoz datoteku. Međutim, kada spremim i CSV, on iskrivljuje "posebne" španjolski znakovi koji nisu ASCII znakovi. Čini se da se također događa s lijevi i desni citati i duge crtice, koje izgledaju iz izvora koji stvaraju Excel datoteku u Macu.

budući da je CSV samo tekstualna datoteka, siguran sam da može obraditi UTF8 kodiranje, pa pretpostavljam da je to Excel ograničenje, ali ja sam obličje za način da dobijem od Excela u CSV i spremanje znakova osim ASCII.

30 odgovora

Napomena: Budite oprezni s povjerljivim podacima iz Google listova.

nakon uštede u CSV-u pod Excelom naredba Staviti:

ICONV -F CP1250 -T UTF-8 datoteka-kodirano-cp1250.csv\u003e datoteka-kodiran-utf8.csv

(Ne zaboravite zamijeniti CP1250 s kodiranjem).

radi brzo i sjajno velike datoteke, kao što je baza podataka kodova pošte koja se ne može uvesti na GoogleDoc (ograničiti 400.000 stanica).

održati srijeda Windows, Spremite i radite s datotekom, kao i obično, u Excelu, ali onda otvorite spremljenu Excel datoteku u Gnome Gnumeric (besplatno). Spasite gnome gnumeričke tablice kao CSV, koji - za mene u svakom slučaju, sprema ga kao UTF-8 CSV.

jednostavan način za to je: Preuzmite Open Office (), preuzmite proračunsku tablicu i otvorite Excel datoteku (.xls ili.xlsx). Zatim ga samo spremite kao tekstualnu CSV datoteku, a prozor se otvara za spremanje trenutnog formata ili spremanje kao. Format ODF. Odaberite "Spremi trenutni format" i u novom prozoru, odaberite opciju koja radi bolje za vas, u skladu s jezikom na kojem je vaša datoteka napisana. Za španjolski odaberite zapadnu Europu (Windows-1252 / WinLatin 1) i datoteka radi samo dobro. Ako odaberete Unicode (UTF-8), neće raditi s španjolskim znakovima.

Također sam naletio na isti problem, ali za ovo postoji jednostavno rješenje.

  1. otvorite XLSX datoteku u Excel 2016 ili više.
  2. U "spremi kao" odaberite ovu opciju: "(CSV UTF-8 (s separatorima zarezima) *. Csv)"

Radi savršeno, a CSV datoteka je stvorena, koja se može uvesti u bilo koju softver, Uvezio sam ovu CSV datoteku na moju SQLite bazu podataka, a dobro funkcionira sa svim Unicode likovima.

Napisao sam malu skriptu Python, koja može izvesti listove u UTF-8.

vi samo trebate pružiti Excel datoteku kao prvi parametar, a zatim listove koje želite izvesti. Ako plahte nisu osigurane, skripta izvozi sve listove prisutne u Excelovoj datoteci.

#! / Usr / bin / env python # izvoz podatkovnih listova iz XLSX u CSV iz ONYPYXL Import_workBook Uvoz CSV iz OS Uvoz Sys Reload (Sys) Sys.setDefaultoding ("UTF-8") def get_all_shiets: listova \u003d Worksbook \u003d Excel_file, koristite_iteratori \u003d True, Data_only \u003d True) All_Works \u003d WordBook.get_Sheet_names () za radni list_name u All_wordsheets: Sheets.append (radni list) Povratak ploča DEF CSV_From_Excel (Excel_file, plahte): WorkBook_WorkBook (Excel_file, Upotreba_teri) Istina) za radni list u listovima: Ispis ("Izvoz" + RADEAME + "...") Pokušajte: radni list \u003d WorkBook.Geet_by_by_Name (Radcet_name) Osim KeyError: Ispis ("nije mogao pronaći" + radne lit_name) sys.xit (1) Your_csv_file \u003d otvoren (". Pridružite se ()," WB ") WR \u003d CSV.Writer (your_csv_file, citirajući \u003d csv.quote_all) za redak u radnom listu.iter_rows (): LRow \u003d za ćeliju u retku: LRow (stanica. Vrijednost) WR.Writerow (LROW) Ispis ("... učinio") your_csv_file.close () ako ne 2<= len(sys.argv) <= 3: print("Call with " + sys.argv + " "). Plahte! \u003d Nitko i Len (plahte)\u003e 0) csv_from_excel (sys.argv, listovi)