الهيروغليفية في Excele كيفية إصلاح. ماذا لو كان ملف تصدير CSV لا يظهر الأحرف الروسية؟ تغيير الترميز في Excel

مع الحاجة إلى تغيير ترميز النص، غالبا ما يتم مواجهة المستخدمين الذين يعملون المتصفحات والمحررين والنصوص والمعالجات. ومع ذلك، عند العمل في المعالج في الجدول Excel، يمكن أن تحدث مثل هذه الحاجة أيضا، لأن هذا البرنامج يعالج فقط الأرقام، ولكن أيضا النص. دعونا معرفة كيفية تغيير الترميز في Excele.

درس: ترميز في Microsoft Word


ترميز النص - هذه المجموعة من التعبيرات الرقمية الإلكترونية التي يتم تحويلها إلى تلك المفهومة لأحرف المستخدم. هناك العديد من أنواع الترميز، لكل منها قواعد ولغتها الخاصة. مهارة البرنامج للتعرف على لغة محددة وترجمةها إلى أولئك الذين يفهمون علامات شخص عادي (الحروف والأرقام والأحرف الأخرى) يحدد ما إذا كان التطبيق سيكون قادرا على العمل بنص محدد أم لا. ينبغي تخصيص ترميزات النص الشعبي على النحو التالي:

  • Windows-1251؛
  • KOI-8؛
  • ASCII؛
  • ANSI؛
  • UKS-2؛
  • UTF-8 (Unicode).

الاسم الأخير هو الأكثر شيوعا بين الترميزات في العالم، لأنها تعتبر نوعا من المعايير العالمية.

في معظم الأحيان، يتعرف البرنامج نفسه على الترميز والتبديل تلقائيا إليه، ولكن في بعض الحالات يحتاج المستخدم إلى تحديد مظهره. عندها فقط يمكن أن تعمل بشكل صحيح مع الرموز المشفرة.

يحدث أكبر عدد من المشكلات مع فك تشفير الترميز من برنامج Excel عند محاولة فتح ملفات CSV أو تصدير ملفات TXT.وبعد في كثير من الأحيان، بدلا من الحروف العادية عند فتح هذه الملفات من خلال Excel، يمكننا مراقبة رموز غير مفهومة، ما يسمى "krakozhebra". في هذه الحالات، يحتاج المستخدم إلى إجراء معينة من التلاعب من أجل البرنامج للبدء في عرض البيانات بشكل صحيح. هنالك العديد من الطرق لحل هذه المشكلة.

الطريقة الأولى: تغيير الترميز باستخدام المفكرة ++

لسوء الحظ، أداة متكاملة تتيح لك تغيير الترميز بسرعة في أي نوع من النصوص من Excel. لذلك، من الضروري استخدام حلول متعددة الخطوات لهذا الغرض أو اللجوء إلى المساعدة. تطبيقات الطرف الثالثوبعد واحدة من الطرق الأكثر موثوقية هي استخدام محرر النصوص المفكرة ++.


برغم من هذه الطريقة بناء على استخدام برامج الطرف الثالث، فإنه أحد أبسط الخيارات لإعادة ترميز محتويات الملفات ل Excel.

الطريقة 2: تطبيق معالج النص

بالإضافة إلى ذلك، يمكنك إجراء التحويل واستخدام أدوات البرنامج المدمجة، وهي معالجات النص. الغريب هذه الأداة أكثر تعقيدا من التقدم برنامج الجهة الخارجيةالموصوفة في الطريقة السابقة.

الطريقة الثالثة: حفظ ملف في ترميز معين

هناك أيضا موقف عكسي عند عدم فتح الملف مع شاشة البيانات الصحيحة، وحفظها في الترميز المثبت. في Excel، يمكنك إجراء هذه المهمة.


سيتم حفظ المستند على القرص الثابت أو الوسائط القابلة للإزالة في الترميز الذي حددته. ولكن عليك أن تنظر في أن المستندات دائما يتم تخزينها في Excel سيتم حفظها في هذا الترميز. من أجل تغييره، عليك أن تخرج مرة أخرى. "معلمات وثيقة الويب" وتغيير الإعدادات.

هناك طريقة أخرى لتغيير إعدادات ترميز النص المحفوظ.

CSV هو معيار فعلي للاتصال بين أنظمة غير متجانسة، للنقل ومعالجة البيانات الفمانية مع هيكل جدولي "صعب". في العديد من لغات البرمجة النصية، توجد أدوات وأدوات توليد مدمجة، فمن المفهومة جيدا بأنها مبرمجات ومستخدمون عاديون، ومشاكل البيانات نفسها تم اكتشافها جيدا فيها، كما يقولون، العين.

تاريخ هذا التنسيق له 30 سنة على الأقل. ولكن حتى الآن، في عصر مساعدة XML، لا يزال CSV يستخدم لتحميل وتنزيل كميات كبيرة من البيانات. وعلى الرغم من حقيقة أن التنسيق نفسه هو موضح جيدا في RFC، فإن كل منها يفهم ذلك بطريقته الخاصة.

في هذه المقالة، سأحاول تلخيص المعرفة الموجودة حول هذا التنسيق، كما تشير إلى أخطاء نموذجية، وكذلك توضيح المشكلات الموضحة في مثال منحنى استيراد وتصدير استيراد الواردات مايكروسوفت أوفيس. 2007. سأظل أيضا كيفية تجاوز هذه المشكلات (بما في ذلك التحول التلقائي لأنواع Excel في DateTime ورقم) عند فتح. CSV.

ابدأ بحقيقة أن تنسيق CSV يسمى بالفعل ثلاثة تنسيقات نصية مختلفة تختلف الرموز: في الواقع CSV نفسها (القيم المنفصلة بفواصل - القيم مقسمة على الفواصل)، TSV (القيم المفصولة تبويب - القيم مفصولة بعلامات التبويب) و SCSV (القيم المنفصلة الفاصلة المنقوطة - القيم مفصولة من فاصلة منقوطة). في الحياة، قد يتم استدعاء الثلاثة جميع CSV واحد، يتم تحديد رمز الفاصل في أفضل الأحوال عند التصدير أو الاستيراد، وفي كثير من الأحيان هو "مخيط" داخل الكود. هذا يخلق الكثير من المشاكل في محاولة لمعرفة ذلك.

كصور توضيحي، يبدو أننا مهمة تافهة: استيراد في مايكروسوفت أوتلوك. البيانات من الجدول مايكروسوفت اكسل..

يحتوي Microsoft Excel على أدوات تصدير إلى CSV، وفي Microsoft Outlook - الواردات المناسبة. ما يمكن أن يكون أسهل - قدم ملف "المطر" البرنامج البريدي وهل تم القيام به؟ لا يهم كيف.

إنشاء علامة اختبار في Excel:

... ودعنا نحاول تصديرها إلى ثلاثة تنسيقات نصية:

ما الاستنتاج الذي نفعله من هذا؟ .. حقيقة أن Microsoft تستدعي "CSV (فاصلة فاصلة)" هي في الواقع تنسيق بفواصل فاصلة. تنسيق Microsoft هو Windows-1251 بدقة. لذلك، إذا كان لديك أحرف Unicode في Excel، فسوف تظهر في إخراج CSV على علامات الاستفهام. أيضا، أن ترجمات السلاسل هي دائما زوج من الرموز، وحقيقة أن مايكروسوفت تأخذ بغباء يقتبس كل شيء حيث يرى نقطة فاصلة. أيضا أنه إذا لم يكن لديك أحرف Unicode على الإطلاق، فيمكنك حفظها على الملف. أيضا أن Unicode مدعوم فقط بواسطة UTF-16، وليس UTF-8، والتي ستكون منطقية بقوة.

الآن دعونا نرى كيف ينظر النظرة في ذلك. دعونا نحاول استيراد هذه الملفات منه عن طريق تحديد نفس مصادر البيانات. Outlook 2007: ملف -\u003e استيراد وتصدير ... -\u003e استيراد من برنامج أو ملف آخر. بعد ذلك، حدد تنسيق البيانات: "القيم مقسومة حسب الفواصل (Windows)" و "القيم المنفصلة بواسطة علامة التبويب (Windows)".

منتجات Microsoft لا تفهم بعضهما البعض، ليس لديهم فرصة لتمرير ملف نصي البيانات المهيكلة. من أجل أن يعمل كل شيء للعمل، مطلوب "الرقصات ذات الدف" مبرمج.

نتذكر أن Microsoft Excel يمكن أن تعمل مع ملفات نصية واستيراد البيانات من CSV، ولكن في الإصدار 2007 يجعلها غريبة للغاية. على سبيل المثال، إذا قمت ببساطة بفتح الملف من خلال القائمة، فسوف يفتح دون أي تعليق تنسيق، ببساطة كملف نصي، وضعت بالكامل في العمود الأول. إذا قمت بالنقر نقرا مزدوجا فوق CSV، فإن Excel يتلقى أمرا آخر وينتقل CSV كما يجب، دون طرح أسئلة إضافية. الخيار الثالث - إدراج ملف إلى الورقة الحالية. في هذه الواجهة، يمكنك تخصيص فواصل، فورا مشاهدة ما حدث. ولكن شيء واحد هو: إنه يعمل بشكل سيء. على سبيل المثال، لا يفهم Excel التحويلات المعروضة من الخطوط داخل الحقول.

علاوة على ذلك، تعمل نفس وظيفة الحفظ في CSV، الناجمة عن الواجهة وعبر الماكرو، بطرق مختلفة. لا ينظر خيار الماكرو إلى الإعدادات الإقليمية على الإطلاق.

معيار CSV على هذا النحو، لسوء الحظ، لا، ولكن، في الوقت نفسه، هناك ما يسمى. مذكرة. هذا RFC 4180 2005، حيث يوصف كل شيء بذكاء تماما. من أجل غياب أي شيء أكثر، للالتزام بمركز RFC على الأقل. ولكن بالنسبة للتوافق مع Excel، فمن الضروري أن تأخذ في الاعتبار اجتماعياته الاجتماعية.

  • بين الصفوف - نقل سلسلة CRLF [في رأيي، لم يكن الأمر يستحق الحد من قبل اثنين بايت، I.E. مثل CRLF (0 × 0D، 0 × 0A) و CR 0 × 0D]
  • مقسمات - فواصل، في نهاية الخط لا ينبغي أن تكون فاصلة،
  • في الصف الأخير، CRLF غير مطلوب،
  • يمكن أن يكون السطر الأول سلسلة رأس (غير ملحوظ في نفس الوقت)
  • يتم تجاهل المساحات المحيطة بفواصل الفاصلة.
  • إذا كانت القيمة تحتوي على CRLF، CR، LF (رموز السلسلة) أو الاقتباس المزدوج أو الفاصلة (فاصل الحقل)، ثم إبرام القيمة في علامات الاقتباس. خلاف ذلك، يجوز.
  • أولئك. الترجمات المسموح بها من الخطوط داخل الحقل. ولكن يجب تكوين هذه القيم من الحقول،
  • إذا كان هناك اقتباسات مزدوجة داخل الجزء المقتبس، فإنه يستخدم علامات اقتباس محددة في CSV - ازدواجية.

هنا في الترجمة ABNF وصف التنسيق:

ملف \u003d سجل * (سجل CRLF) الرأس \u003d الاسم * (اسم الفاصلة) السجل \u003d الحقل * (فاصلة حقل) اسم \u003d حقل الحقل \u003d (هارب / غير هارب) هربا \u003d dquote * (TextData / Comma / CR / CR / LF / 2DQuote ) dquote غير هارب \u003d * textdata فاصلة \u003d٪ x2c dquote \u003d٪ x22 lf \u003d٪ x0a crlf \u003d cr lf textdata \u003d٪ x20-21 /٪ x23-2b /٪ x2d-7e

أيضا، عند تنفيذ التنسيق، يجب أن نتذكر أنه نظرا لعدم وجود مؤشرات على عدد الأعمدة ونوع الأعمدة، نظرا لعدم وجود شرط لوضع العنوان، فهناك اتفاقيات تحتاج إلى عدم نسيانها:

  • يمكن اعتبار البرنامج قيمة سلسلة من الأرقام غير المرفقة بالاقتباس من خلال رقم رقمي، ولهذا السبب قد تضيع المعلومات، على سبيل المثال، الأصفار الرائدة،
  • قد يختلف عدد القيم في كل صف ويجب التعامل مع هذا الموقف بشكل صحيح. في بعض الحالات، تحتاج إلى تحذير المستخدم، في غيرها - إنشاء أعمدة إضافية وملءها القيم الفارغةوبعد يمكنك أن تقرر أنه يتم تعيين عدد الأعمدة بواسطة العنوان، ويمكنك إضافتها بشكل حيوي، مثل واردات CSV،
  • يقتبس سريع من خلال "خفض" لا وفقا للمعايير، لا تفعل ذلك.
  • نظرا لعدم وجود مجال الحقول، لا توجد متطلبات لهم. تختلف تقسيم الأجزاء الكاملة والكسرية في بلدان مختلفة، وهذا يؤدي إلى حقيقة أن نفس CSV، ممنوحة التطبيق، "مفهومة" في نفي واحد، في الآخر. لأن مايكروسوفت أوفيس يركز على الإقليمية إعدادات ويندوزويمكن أن يكون هناك أي شيء. في روسيا، يشار إلى أن الفاصل فاصلة
  • إذا كانت CSV غير مفتوحة عبر قائمة "البيانات"، ولكن مباشرة، فلا يحدد Excel أي أسئلة، ويفعل كيف يبدو صحيحا. على سبيل المثال، حقل بقيمة 1.24 يفهم الافتراضي بأنه "24 يناير"
  • Excel يقتل الأصفار ويقوم بتشغيل الأنواع حتى عند الإشارة إلى القيمة في علامات اقتباس. لا تفعل ذلك، إنه خطأ. ولكن من أجل تجاوز هذه المشكلة في Excel، يمكنك إنشاء "اختراق" صغيرا - القيمة للبدء من علامة "علامة" متساوية "، وبعد ذلك، من الممكن وضع علامات اقتباس ما يجب إرساله دون تغيير التنسيق.
  • يحتوي Excel على "متساو" متخصص، والذي في CSV يعتبر معرف صيغة. وهذا هو، إذا كان سيجتمع في CSV \u003d 2 + 3، فسوف يضعان اثنين وثلاثة، وسيتم كتابة النتيجة في الخلية. وفقا للمعايير، يجب ألا يفعل ذلك.

مثال على CSV صالح، والتي يمكن استخدامها في الاختبارات:

اللقب، الاسم والعنوان، المدينة / الموظفين، المؤشر، مجرد خط إيفانوف، إيفانوف، لينينا 20، موسكو، 08075، "1/3" Tyler، John، 110 شرفة، PA، 2012، "1.24" "Petrov" كول "" "" "" "" ""، Petya، 120 St. Strbling St.، NJ، 08075، "1.24" Smirnov، فاسيا، "شارع 7452" "بالقرب من المربع" "Road"، York، 91234، "3-01"، Misha، Leningrad، 00123، "03-01" "جون" "رأس أسود" "، كلود"، صخرة، "، ميامي بيتش، 00111،" 0000 "سيرجي،

بالضبط نفس SCSV:

اسم العائلة؛ اسم؛ عنوان؛ المدينة / الدولة؛ فهرس؛ مجرد صف من إيفانوف؛ إيفان؛ لينين 20؛ موسكو؛ 08075؛ "1/3" تايلر؛ جون؛ 110 شرفة؛ السلطة الفلسطينية 20121؛ "1.24" بتروف "" كول "" "؛ بيتيا؛ 120 ش ناشط NJ؛ 08075؛ "1.24" Smirnov؛ فاسيا؛ "7452 شارع" "بالقرب من مربع" الطريق "؛ يورك؛ 91234؛ "3-01"؛ ميشا؛؛ لينينغراد؛ 00123؛ "03-01" "جون" "رأس أسود" "؛ كلود"؛ صخرة؛ ""؛ ميامي بيتش؛ 00111؛ "0000" سيرجي؛

الملف الأول الذي هو مفصوم بفواصل واقعية، يتم حفظه بواسطة V.CSV، Excel لا ينظر إليه على الإطلاق.

الملف الثاني الذي وفقا لمنطق SCSV ينظر إليه ويخرج هنا:

أخطاء استيراد Excel-i:

  1. كانت هناك فجوات تحيط منمق
  2. العمود الأخير لم يتعرف حقا على الرغم من حقيقة أن البيانات في علامات الاقتباس. الاستثناء هو سلسلة مع "بتروف" - 1.24 تم التعرف عليه بشكل صحيح هناك.
  3. في هذا المجال، قام مؤشر Excel "خفض" الأصفار الرائدة.
  4. في المجال المناسب للسطر الأخير، توقف الفجوات قبل اقتباسات الإشارة إلى أخصائي

إذا كنت تستخدم وظيفة الاستيراد (البيانات -\u003e من الملف) واتصل عند استيراد جميع الحقول مع النص، فستكون الصورة التالية:

مع عرض الأنواع، ولكن الآن لا تتم معالجة عمليات النقل بشكل طبيعي للصفوف وتبقى المشكلة مع الأصفار الرائدة والاقتباسات والمساحات غير الضرورية. نعم، والمستخدمين فتح CSV مفتوحة غير مريحة للغاية.

هناك طريقة فعالة لكيفية جعل Excel لا تمنح أنواعا عندما لا نحتاج. ولكن سيكون CSV "خصيصا ل Excel". يتم ذلك عن طريق وضع علامة "\u003d" أمام علامات الاقتباس في كل مكان، حيث يمكن أن تكون المشكلة مع أنواعها. في نفس الوقت نزيل الفجوات الإضافية.

اسم؛ اسم؛ اسم؛ العنوان؛ المدينة / الولاية؛ مؤشر؛ مجرد خط إيفانوف؛ إيفان؛ لينين 20؛ موسكو؛ \u003d "08075"؛ \u003d "1/3" تايلر؛ جون؛ 110 شرفة؛ سنويا؛ \u003d "20121"؛ \u003d "1.24" "petrov" "kul" "؛ بيتر؛ 120 ش حارق؛ \u003d" 08075 "؛ \u003d" 08075 "؛ \u003d" 1.24 "Smirnov؛ Vasya؛" 7452 Street " "بالقرب من المربع" الطريق "" الطريق "؛ يورك؛ \u003d" 91234 "؛ \u003d" 3-01 "؛ ميشا؛؛ لينينغراد؛ \u003d" 00123 "؛ \u003d" 03-01 "" John ""؛ Claude "؛ ؛ صخرة. "" شاطئ ميامي؛ \u003d "00111"؛ \u003d "0000" سيرجي؛

وهذا ما يحدث إذا فتحنا هذا الملف في Excel:

ملخص.

لتوليد مثل هذه CSV، والتي يمكن استخدامها، يجب أن يكون المستخدم قادرا على إجراء الإعدادات التالية قبل التصدير:

  1. اختر ترميزوبعد كقاعدة عامة، من المهم UTF-8، UTF-16، Windows-1251، KOI8-R. في معظم الأحيان، لا توجد خيارات أخرى. يجب أن يستمر أحدهم افتراضيا. في حالة توفر البيانات أحرفا لا تحتوي على نظائرها في الترميز المستهدف، تحتاج إلى تنبيه المستخدم الذي سيتم فيه كسر البيانات؛
  2. حدد فاصل بين الحقولوبعد خيارات - جدول، فاصلة، نقطة مع فاصلة. افتراضيا - نقطة مع فاصلة. لا تنس أنه إذا تم إدخال الفاصل في النص، فسيكون من الصعب للغاية إدخال علامة التبويب، كما أنه رمز غير ثابت؛
  3. حدد فاصل بين الصفوف (CRLF 0 × 0D 0 × 0A أو CR 0 × 0D)؛
  4. حدد فاصل عدد صحيح والكسرية للبيانات الرقمية (النقطة أو الفاصلة).
  5. اختر ما إذا كنت تعرض سلسلة رأس؛
  6. اختر كيفية تنفيذ Klotting SpecialSimeters (وخاصة الصفوف ونقلت الترجمات). من حيث المبدأ، يمكنك التراجع عن المعيار ونقلت عنها ك \\ n و \\ "، ولكن في هذه الحالة، لا تنس إقلاع نفسك \\ n، إذا التقى ولا تنس القيام بذلك بخيار عند تصدير الواردات عند تصدير الواردات. لكن التوافق سوف يذهب إلى الغابة، لأن أي تصميم محلل تحليلي قياسي RFC ...، "ABC \\" "، ... عد لخطأ؛
  7. مثالية للغاية - ضع علامة "للحصول على Excel" وأخذ في الاعتبار هناك تلك غير المسؤوليات التي جعلت Microsoftوبعد على سبيل المثال، استبدل قيم الحقول العددية، "مشابها إلى التاريخ"، على التصميم \u003d "<значение поля>«.
  8. تقرر ما إذا كنت تريد ترك "الذيل" من فواصل فارغةإذا تم تشكيله. على سبيل المثال، من 20 حقلا فقط يحتوي أولا على البيانات، والباقي فارغ. نتيجة لذلك، في السطر، يمكنك إما النشر بعد أول 19 فواصل، أو عدم التثبيت. بالنسبة إلى كميات كبيرة من البيانات، يمكن أن يوفر معالجة مللي ثانية وتقليل حجم الملف.

لبناء مستورد CSV جيد ومريح، يجب أن تتذكر ما يلي:

  1. يجب إجراء تحليل الملف بواسطة Lexems وفقا للقواعد أعلاه أو استخدم مكتبات جاهزة مثبتة جيدا (Excel يعمل بشكل خلاف ذلك، لأن المشكلة مستوردة)؛
  2. تزويد المستخدم بالقدرة على اختيار الترميز (أعلى 4 بما فيه الكفاية)؛
  3. تزويد المستخدم بالقدرة على اختيار فاصل بين الحقول (فاصلة، جدولة، نقطة مع فاصلة)؛
  4. تزويد المستخدم بالقدرة على اختيار فاصل بين الصفوفولكن إلى جانب المتغيرات CR و CRLF، يجب توفير CR أو CRLF. ويرجع ذلك إلى حقيقة أنه على سبيل المثال، على سبيل المثال، يتفوق عند تصدير جدول مع ترجمات السلاسل داخل الخلايا تصدر هذه الصفوف من السلاسل ك CR، وتشارك الصفوف المتبقية CRLF. في هذه الحالة، عند استيراد الملف، لا يزال، CR هناك أو CRLF؛
  5. تزويد المستخدم بالقدرة على اختيار فاصل بين الأجزاء الكاملة والكسرية (فاصلة أو نقطة)؛
  6. اتخاذ قرار مع طريقة التحليل - أولا قرأنا كل شيء في الذاكرة، ثم معالجة أو معالجة سلسلة للحصول على سلسلة. في الحالة الأولى، قد تحتاج إلى مزيد من الذاكرة، في الحالة الثانية، الخطأ في الوسط سيؤدي فقط إلى استيراد جزئي، والتي يمكن أن تسبب مشاكل. تفضيل الخيار الأول.

رؤوف علييف،
نائب المدير الفني Mail.Ru Group

CSV. (القيم المفصولة بفواصل) هي تنسيق شائع لتخزين البيانات الجدولة (الرقمية والنص) كنص بسيط. هذا التنسيق من الملفات شائعا والحياة بسبب حقيقة أن عدد كبير من البرامج والتطبيقات يفهم CSV، على الأقل كبديل تنسيق الملف للاستيراد / التصدير. علاوة على ذلك، يسمح تنسيق CSV للمستخدم بالنظر في الملف وعحثه على الفور عن مشكلة في البيانات، إن وجدت، تغيير فاصل CSV وقواعد الاقتباس وما إلى ذلك. هذا ممكن لأن CSV هو نص بسيط، وليس حتى مستخدم من ذوي الخبرة للغاية، سيكون قادرا على فهمه بسهولة دون تدريب خاص.

في هذه المقالة سنعلمنا بسرعة و طرق فعالة تصدير البيانات من Excel في CSV وتعلم كيفية تحويل ملف اكسل في CSV، الاحتفاظ دون تشويه جميع الرموز الخاصة والأجنبية. تقنيات الموصوفة في المادة تعمل في جميع إصدارات Excel 2013 و 2010 و 2007.

كيفية تحويل ملف Excel إلى CSV

إذا كنت ترغب في تصدير ملف Excel إلى أي تطبيق آخر، على سبيل المثال، في دليل العناوين Outlook أو قاعدة البيانات بيانات الدخول، قبل تحويل Excel إلى ملف CSV، ثم قم باستيراد الملف. .csv. لتطبيق آخر. أدناه يتم إعطاء دليل خطوة بخطوةكيفية تصدير كلمة عمل Excel بتنسيق CSV باستخدام أداة Excel - " حفظ باسم».

تعليق: كل التنسيقات المذكورة أعلاه توفر فقط ورقة نشطة Excel.


تصدير من Excel في CSV مع ترميز UTF-8 أو UTF-16

إذا كانت ورقة Excel تحتوي على أي رموز خاصة أو أجنبية (تيلدة، والتركيز، أو ما شابهها) أو الهيروغليفية، فإن تحول ورقة Excel في طريقة CSV الموضحة أعلاه لن تعمل.

الحقيقة هي أن الفريق حفظ باسم > CSV. (حفظ AS\u003e CSV) سوف يشوه جميع الأحرف باستثناء ASCII (رمز قياسي أمريكي لتبادل المعلومات). وإذا كانت هناك اقتباسات مقترنة أو اندفاعة طويلة في ورقة Excel (نقل إلى Excel، على سبيل المثال، من كلمة وثيقة. عند نسخ / إدخال النص) - ستكون هذه الرموز أيضا عفوية.

  • UTF-8. - هذا هو ترميز أكثر إحكاما يستخدم لكل حرف من 1 إلى 4 بايت. في أغلب الأحيان يوصى باستخدام هذا التنسيق عند تهيمن أحرف ASCII في الملف معظم هذه الشخصيات تتطلب 1 بايت الذاكرة. ميزة أخرى هي أن ترميز ملف UTF-8 الذي يحتوي على أحرف ASCII فقط، لن يختلف عن ملف ASCII نفسه.
  • UTF-16. يستخدم من 2 إلى 4 بايت لتخزين كل رمز. لاحظ أنه في جميع الحالات يتطلب ملف UTF-16 مساحة أكبر في الذاكرة من ملف UTF-8. على سبيل المثال، تحتل الأحرف اليابانية من 3 إلى 4 بايت في UTF-8 ومن 2 إلى 4 بايت في UTF-16. وبالتالي، فإنه من المنطقي استخدام UTF-16 إذا كانت البيانات تحتوي على أحرف آسيوية، بما في ذلك اليابانية والصينية والكورية. عيب كبير لهذا الترميز هو أنه لا يتوافق تماما مع ملفات ASCII والمطلوبة برامج خاصة لعرض هذه الملفات. تذكر هذا إذا كنت تخطط لاستيراد الملفات الناتجة من Excel في مكان آخر.

كيفية تحويل ملف Excel إلى CSV UTF-8

لنفترض أن لدينا ورقة Excel مع رموز أجنبية، في مثالنا هي الأسماء اليابانية.

لتصدير هذه القائمة Excel إلى ملف CSV، مع الحفاظ على جميع الأحرف، سنقوم بما يلي:


تعليق: ليس كل محرري النصوص البسيطة يدعمون بالكامل أحرف Unicode، لذلك يمكن عرض بعضها كمستطيلات. في معظم الحالات، لن يؤثر ذلك على الملف النهائي، ويمكنك ببساطة عدم الاهتمام بهذا أو اختيار محرر أكثر تقدما، على سبيل المثال، Notepad ++.

  1. نظرا لأنه في ملف Unicode Text الخاص بنا، يتم استخدام علامة التبويب كفاصل، ونريد تحويله إلى CSV (فواصل الفاصلة)، فمن الضروري استبدال رموز علامة التبويب للفاصلة.

تعليق: إذا لم يكن هناك حاجة صارمة للحصول على ملف مع محددات - فاصلة، فأنت بحاجة إلى أي ملف CSV الذي يمكن أن يفهمه Excel، ثم يمكن تخطي هذه الخطوة، لأن Microsoft Excel Excellent يفهم الملفات مع فاصل.

تعليق: إذا كان الملف مخصصا للاستخدام خارج تنسيق Excel و UTF-8 هو متطلبات إلزامية، فلا تقم بإجراء أي تغييرات على الورقة ولا تحفظها مرة أخرى إلى Excel، حيث يمكن أن تؤدي إلى مشاكل في ترميز القراءة. إذا لم يتم عرض جزء من البيانات في Excel، فتح نفس الملف في المفكرة وإجراء تصحيحات على البيانات. لا تنس أن تحفظ الملف بتنسيق UTF-8 مرة أخرى.

كيفية تحويل ملف Excel إلى CSV UTF-16

تصدير إلى ملف CSV UTF-16 أسرع بكثير وأسهل مما كانت عليه في UTF-8. والحقيقة هي أن Excel يستخدم تلقائيا تنسيق UTF-16 عند حفظ ملف باسم النص يونيكود (نص يونيكود).

للقيام بذلك، احفظ الملف باستخدام الأداة حفظ باسم (احفظ كما) في Excel ثم في Windows Explorer تغيير امتداد الملف الذي تم إنشاؤه إليه .csv.وبعد مستعد!

إذا كنت بحاجة إلى ملف CSV مع فاصلة منقوطة أو فاصلة منقوطة كفاصل، فاستبدل جميع علامات التبويب في الفواصل أو الفاصلة المنقاطات، على التوالي، في المفكرة أو في أي شيء آخر محرر النص عند اختيارك (سابقا في هذه المقالة تعليمات مفصلة، كيف يتم ذلك).

طرق أخرى لتحويل ملفات Excel في CSV

الأساليب المذكورة أعلاه لتصدير البيانات من Excel في CSV (UTF-8 و UTF-16) هي عالمية، I.E. مناسبة للعمل مع أي شخصيات خاصة وفي أي إصدار من Excel من 2003 إلى 2013.

هناك العديد من الطرق الأخرى لتحويل البيانات من تنسيق Excel إلى CSV. على عكس القرارات المذكورة أعلاه، لن تؤدي هذه الأساليب إلى ملف UTF-8 نظيف (هذا لا يتعلق الأمر، والذي يمكنه تصدير ملفات Excel إلى عدة خيارات ترميز UTF). ولكن في معظم الحالات، سيحتوي الملف الناتج على المجموعة الصحيحة من الأحرف، والتي يمكن بعد ذلك تحويلها بشكل مؤلم إلى تنسيق UTF-8 باستخدام أي محرر نصوص.

نقوم بتحويل ملف Excel في CSV باستخدام طاولات Google

كما اتضح، فمن الممكن ببساطة تحويل ملف Excel إلى CSV باستخدام جداول Google. شريطة أن يتم تثبيت محرك Google بالفعل على جهاز الكمبيوتر الخاص بك، قم بإجراء خطوات 5 بسيطة التالية:

نصيحة: إذا كان ملف Excel صغير نسبيا، فعليك توفير الوقت، يمكنك نقل البيانات إلى جدول Google باستخدام نسخ / إدراج.


أخيرا، افتح ملف CSV الذي تم إنشاؤه في أي محرر نصي للتأكد من حفظ جميع الأحرف بشكل صحيح. لسوء الحظ، لا يتم عرض ملفات CSV التي تم إنشاؤها بهذه الطريقة بشكل صحيح في Excel.

احفظ الملف file.xlsx ك .xls ثم قم بالتحويل إلى ملف CSV

لا تتطلب هذه الطريقة أي تعليقات إضافية، حيث أن كل شيء واضح من الاسم.

لقد وجدت هذا القرار في إحدى المنتديات المخصصة ل Excel، لم أعد أتذكر ما بالضبط. بصراحة، لم أستخدم هذه الطريقة، ولكن وفقا لمراجعات العديد من المستخدمين، بعض رموز خاصة تضيع إذا قمت بالاحفظ مباشرة من .xlsx. في .csv.ولكن البقاء، إذا الأول .xlsx. حفظ باسم .xls.ثم كيف .csv.، مثلنا .

بطريقة أو بأخرى، جرب هذه الطريقة لإنشاء ملفات CSV من Excel، وإذا اتضح، فسيكون ذلك وقتا طويلا لتوفير الوقت.

حفظ ملف Excel ك CSV باستخدام OpenOffice

OpenOffice هو حزمة تطبيق مفتوحة. مصدر الرمزيتضمن ذلك تطبيقا للعمل مع الجداول، والتي تنسق تماما مهمة تصدير البيانات من تنسيق Excel في CSV. في الواقع، يوفر هذا التطبيق الوصول إلى عدد أكبر من المعلمات عند تحويل الجداول إلى ملفات CSV (الترميز والمتقدمين وما إلى ذلك) من أوراق Excel و Google مجتمعة.

ما عليك سوى فتح ملف Excel في OpenOffice Calc، انقر ملف > حفظ باسم (ملف\u003e حفظ باسم) وحدد نوع الملف النص CSV. (النص CSV).

على ال شعار القادم يقترح تحديد قيم المعلمة التشفير (مجموعات الأحرف) و فاصل الحقل (محدد الحقل). بالطبع، إذا أردنا إنشاء ملف CSV UTF-8 مع فواصل كفاصل، فاختر UTF-8. وأدخل الفاصلة (،) في الحقول المقابلة. معامل فاصل النص عادة ما يتم ترك (محدد النص) دون تغيير - اقتباسات ("). انقر فوق التالي نعم.

بنفس الطريقة لتحويل سريع وغير مؤلم من Excel في CSV، يمكنك استخدام تطبيق آخر - LibreOffice. توافق، سيكون من الرائع أن توفر Microsoft Excel الفرصة لتخصيص المعلمات عند إنشاء ملفات CSV.

في هذه المقالة، أخبرتني أساليب تحويل ملفات Excel في CSV. إذا كنت مألوفا أكثر طرق فعالة صادرات من Excel في CSV، أخبرنا عن ذلك في التعليقات. شكرآ لك على أهتمامك!

CSV ( القيم العمعة الفاصلة - القيم المفصولة بفواصل) تنسيق النصمصممة لتمثيل البيانات الجدولة. على سبيل المثال، يتم استخدامه لتصدير البيانات إذا كانت أحجامهم كبيرة بما فيه الكفاية. ومع ذلك، تحدث المشكلة في كثير من الأحيان: قد لا تظهر ملف CSV الذي تم إنشاؤه رموز الأبجدية الروسية أو تشوهها. ومع ذلك، يتم حل هذه المشكلة بسهولة.

جوهر المشكلة هو كما يلي. إذا لم يكن إصدار Excel الذي يعمل فيه المستخدم اللغة الإنجليزية، فيمكنه أن يتوقع ترميز ملف CSV آخر تم إنشاؤه لتصدير البيانات. وهي: ترميز اللغة التي ينتمي إليها إصدار Excel. في الوقت نفسه، يمكن تشويه تلك الرموز غير المدرجة في مجموعة ASCII القياسية.

تم حل المشكلة بالطريقة البسيطة التالية:

1. تشغيل Excel.
2. افتح صفحة "البيانات → من نص" (في Excel المترجمة، يمكن استدعاء عناصر القائمة غير ذلك).
3. افتح ملف CSV الخاص بك وفي نافذة "معالج النص"، قم بتثبيت الفاصل والترميز المطلوب (استخدم "UTF-8").

تعليمات لحل نفس المشكلة ل Excel باللغة الروسية 2007

1. إنشاء مستند جديد (كتاب) في Excel

2. في قائمة "البيانات / الإخراج"، حدد استيراد "من النص". في نافذة اختيار الملفات، حدد ملف CSV الخاص بك. سيقوم Excel تلقائيا بإطلاق نص النص (استيراد).

3. في إعداد "تنسيق الملفات"، حدد "Unicode (UTF-8)":

5. ثم انقر فوق "إنهاء". ل الاختيار الصحيح يجب ألا يكون مشاكل الترميز مع عرض مناسب من الشخصيات السيريلية.

وشيء مهم وضروري ...

كان موقعنا مفيدا لك؟

لدي ملف Excel يحتوي على بعض الأحرف الإسبانية (التبلور، إلخ) ما أحتاج إلى تحويله إلى ملف CSV لاستخدامه كملف استيراد. ومع ذلك، عندما أحفظ كل من CSV، فإنه يشوه الأحرف الإسبانية "الخاصة" التي ليست أحرف ASCII. يبدو أنه يحدث أيضا مع اقتباسات اليسار واليمين والشرطات الطويلة، والتي يبدو أنها تأتي من المستخدم المصدر بإنشاء ملف Excel في Mac.

نظرا لأن CSV هو مجرد ملف نصي، فأنا متأكد من أنه يمكنه معالجة ترميز UTF8، لذلك أفترض أن هذا تقييد Excel، لكنني أبحث عن وسيلة للوصول إلى Excel في CSV وحفظ الأحرف غير ASCII.

30 ردود

ملاحظة: كن حذرا مع بيانات سرية من أوراق Google.

بعد الحفظ في CSV تحت Excel في سطر الأوامر وضع:

ICONV -F -F CP1250 -T UTF-8 ملف engoded-cp1250.csv\u003e ملف مشفرة-utf8.csv

(لا تنسى استبدال CP1250 بترميزك).

يعمل بسرعة وكبيرة ل ملفات كبيرة، مثل قاعدة بيانات رموز البريد التي لا يمكن استيرادها إلى Googledocs (حد 400.000 خلايا).

الحفاظ الأربعاء ويندوز، حفظ وتعمل مع الملف، كالعادة، في Excel، ولكن ثم افتح ملف Excel المحفوظ في Gnome Genumeric (مجانا). احفظ جدول Gnome Gnumeric ك CSV، والتي - بالنسبة لي في أي حال، يحفظها باسم UTF-8 CSV.

طريقة بسيطة للقيام بذلك هي: قم بتنزيل Open Office ()، قم بتنزيل جدول البيانات وفتح ملف Excel (.xls Or.xlsx). ثم قم فقط بحفظه كملف CSV نصي، وفتحت النافذة لحفظ التنسيق الحالي أو حفظ باسم. تنسيق ODF. حدد "حفظ التنسيق الحالي" وفي نافذة جديدة، حدد الخيار الذي يعمل بشكل أفضل لك، وفقا للغة التي يتم فيها كتابة الملف الخاص بك. بالنسبة للإسبانية، حدد أوروبا الغربية (Windows-1252 / WINLATIN 1) والملف يعمل بشكل جيد فقط. إذا اخترت Unicode (UTF-8)، فلن يعمل مع الأحرف الإسبانية.

ركضت أيضا في نفس المشكلة، ولكن لهذا هناك حل بسيط.

  1. افتح ملف XLSX في Excel 2016 أو أعلى.
  2. في "حفظ باسم" حدد هذا الخيار: "(CSV UTF-8 (مع فواصل الفواصل) *. CSV)"

إنه يعمل بشكل مثالي، ويتم إنشاء ملف CSV، والذي يمكن استيراده إلى أي البرمجياتوبعد استوردت ملف CSV هذا إلى قاعدة بيانات SQLite الخاصة بي، ويعمل بشكل جيد مع جميع أحرف Unicode.

كتبت رسالة نصية صغيرة بيثون، والتي يمكن تصدير الأوراق في UTF-8.

تحتاج فقط إلى توفير ملف Excel كمعلمة الأولى، ثم الأوراق التي تريد تصديرها. إذا لم يتم توفير الأوراق، يقوم البرنامج النصي بتصدير جميع الأوراق الموجودة في ملف Excel.

#! / usr / bin / env python # صفائح البيانات من xlsx إلى csv من openpyxl استيراد load_workbook استيراد csv من نظام التشغيل OS استيراد SYS (SYS) SYSSETEDEFALTENCODING ("UTF-8") def get_all_shets: sheets \u003d مصنف \u003d load_workbook ( excel_file، use_itartators \u003d true، data_only \u003d true) all_worksheets \u003d workbook.get_shet_names () for nameet_name في all_workshets: sheets.append (norcount_file_from_excel (excel_file، sheets): مصنف \u003d load_workbook (excel_file، use_iterators \u003d true، data_only \u003d TRUE) ل Name_name_name: طباعة ("تصدير" + NameET_NAME + "...") TRY: ورقة العمل \u003d WorkBook.get_shet_by_name (Necket_name) باستثناء KeyError: Print ("تعذر العثور على" + Worksnet_name) SYS.EXIT (1) your_csv_file \u003d Open (". الانضمام ()،" WB ") WR \u003d CSV.Writer (Your_CSV_File، نقلا عن CSV.Quote_All) للصف في ورقة العمل.iter_Rows (): Lrow \u003d للخلية في الصف: Lrow. إلحاق (خلية. قيمة) Wr.Writerow (Lrow) طباعة ("... تم") Your_csv_file.close () إن لم يكن 2<= len(sys.argv) <= 3: print("Call with " + sys.argv + " ") sys.exit (1) آخر: الأوراق \u003d إذا كان Len (sys.argv) \u003d\u003d 3: ورقة \u003d قائمة (sys.argv.split ("، ") آخر: أوراق \u003d get_all_shets (sys.argv) صفائح! \u003d لا شيء ولين (ورقة)\u003e 0) csv_from_excel (sys.argv، ورقة)