ToolDeck

เครื่องมือ CSV ออนไลน์ฟรีของ ToolDeck ช่วยให้คุณแยกวิเคราะห์ แปลง และประมวลผลข้อมูล CSV ได้โดยตรงในเบราว์เซอร์ — ไม่ต้องอัปโหลดไฟล์ ไม่ต้องมีบัญชี แปลง CSV เป็น JSON สำหรับอาร์เรย์ที่พร้อมใช้กับ API, JSON เป็น CSV สำหรับการส่งออกที่เหมาะกับสเปรดชีต, CSV เป็น Markdown สำหรับตารางในเอกสาร, CSV เป็น HTML สำหรับมาร์กอัปตารางที่ฝังได้ และ CSV เป็น SQL สำหรับคำสั่ง INSERT ฐานข้อมูล ตัวแยกวิเคราะห์ทั้งหมดเป็นไปตาม RFC 4180: ฟิลด์ที่มีเครื่องหมายอ้าง เครื่องหมายจุลภาคที่ฝังอยู่ และตัวคั่นที่หลากหลายได้รับการจัดการอย่างถูกต้อง

The ตัวแปลง CSV เป็น JSON และ ตัวแปลง JSON เป็น CSV รองรับการแปลงแบบไป-กลับที่พบบ่อยที่สุด ตัวจัดรูปแบบ CSV ทำความสะอาดปัญหาตัวคั่นและการอ้างอิงก่อนที่คุณจะส่งข้อมูลไปยังเครื่องมืออื่น และ CSV เป็น SQL สร้างคำสั่ง INSERT และสคีมา CREATE TABLE ที่พร้อมสำหรับเอนจินฐานข้อมูลที่รองรับ — การประมวลผลทั้งหมดเกิดขึ้นในเบราว์เซอร์ของคุณ ไม่ต้องอัปโหลดไฟล์ ไม่ต้องมีบัญชี

เครื่องมือ CSV คืออะไร?

CSV (Comma-Separated Values) คือหนึ่งในรูปแบบการแลกเปลี่ยนข้อมูลที่เก่าแก่และได้รับการรองรับอย่างกว้างขวางที่สุด โดยจัดเก็บข้อมูลตารางเป็นข้อความธรรมดา: แต่ละบรรทัดคือหนึ่งระเบียน และฟิลด์ภายในระเบียนถูกคั่นด้วยตัวคั่น (โดยทั่วไปคือเครื่องหมายจุลภาค แต่ยังรวมถึงแท็บ เครื่องหมายเซมิโคลอน หรือไปป์) RFC 4180 กำหนดไวยากรณ์อย่างเป็นทางการ รวมถึงกฎสำหรับการอ้างอิงฟิลด์ที่มีตัวคั่น การขึ้นบรรทัดใหม่ หรืออักขระเครื่องหมายคำพูด

แม้จะเรียบง่าย แต่ CSV ดิบนั้นใช้งานยากในการพัฒนาสมัยใหม่ Web API คาดหวัง JSON เฟรมเวิร์กฟรอนต์เอนด์เชื่อมโยงกับออบเจ็กต์และอาร์เรย์ ไม่ใช่แถวและคอลัมน์ ฐานข้อมูลเอกสารอย่าง MongoDB และ Elasticsearch รับ JSON โดยตรง แม้แต่ฐานข้อมูลเชิงสัมพันธ์ก็มักได้ประโยชน์จากขั้นตอน JSON ระหว่างกลางเพื่อตรวจสอบประเภทคอลัมน์และจับฟิลด์ที่ไม่ตรงกันก่อนการนำเข้าจำนวนมาก เครื่องมือ CSV เชื่อมช่องว่างนี้ด้วยการแปลงข้อมูลตารางแบบแบนเป็นรูปแบบโครงสร้างที่โค้ดสามารถใช้งานได้โดยตรง

คุณต้องการเครื่องมือ CSV เมื่อจัดการกับการส่งออกสเปรดชีต การดัมป์ฐานข้อมูล พอร์ทัลข้อมูลเปิดของรัฐบาล แพลตฟอร์มการวิเคราะห์อย่าง Google Analytics หรือ Mixpanel และไปป์ไลน์ ETL ใดก็ตามที่ส่งออกข้อความคั่น แทนที่จะเขียนสคริปต์แยกวิเคราะห์แบบครั้งเดียว ตัวแปลงบนเบราว์เซอร์ให้ผลลัพธ์ทันทีพร้อมการจัดการกรณีขอบเขตที่ถูกต้อง เช่น ฟิลด์ที่มีเครื่องหมายอ้าง การขึ้นบรรทัดใหม่ที่ฝังอยู่ และตัวคั่นที่หลากหลาย เมื่อคุณได้รับการส่งออกแบบครั้งเดียวจากลูกค้า ต้องการตรวจสอบการแมปคอลัมน์ก่อนเขียนการย้ายข้อมูล หรือต้องการตรวจสอบข้อมูลจากผู้จำหน่ายโดยไม่ต้องตั้งค่าสภาพแวดล้อมในเครื่อง ตัวแปลงบนเบราว์เซอร์เร็วกว่าโซลูชันที่ใช้สคริปต์

ทำไมต้องใช้เครื่องมือ CSV บน ToolDeck?

เครื่องมือ CSV ของ ToolDeck แยกวิเคราะห์ข้อมูลของคุณทั้งหมดในเบราว์เซอร์โดยใช้ JavaScript ไม่มีไฟล์ออกจากเครื่องของคุณ ไม่มี backend ประมวลผลข้อมูลของคุณ และไม่มีขีดจำกัดอัตราที่ทำให้ช้าลง เครื่องมือทุกชิ้นทำงานกับเบราว์เซอร์สมัยใหม่ทุกรุ่น — ไม่ต้องใช้ส่วนขยาย ปลั๊กอิน หรือการกำหนดค่าใดๆ ผลลัพธ์คือการประมวลผล CSV ที่รวดเร็วและเป็นส่วนตัวที่ทำงานได้ทุกที่ที่มีเบราว์เซอร์

🔒
ความเป็นส่วนตัวโดยค่าเริ่มต้น
การแยกวิเคราะห์และการแปลงทั้งหมดเกิดขึ้นในแท็บเบราว์เซอร์ของคุณ ข้อมูล CSV ของคุณ ซึ่งอาจมีข้อมูลลูกค้า ข้อมูลทางการเงิน หรือตัวชี้วัดภายใน จะไม่ถูกส่งไปยังเซิร์ฟเวอร์ระยะไกล
📐
รองรับ RFC 4180
ตัวแยกวิเคราะห์เป็นไปตามข้อกำหนด RFC 4180 สำหรับ CSV ฟิลด์ที่มีเครื่องหมายอ้าง เครื่องหมายจุลภาคที่ฝังอยู่ เครื่องหมายคำพูดที่ Escape แล้ว และการสิ้นสุดบรรทัด CRLF ได้รับการจัดการอย่างถูกต้องทั้งหมด
🔍
การตรวจจับตัวคั่นอัตโนมัติ
วางข้อมูลที่คั่นด้วยเครื่องหมายจุลภาค แท็บ เซมิโคลอน หรือไปป์ เครื่องมือจะระบุตัวคั่นโดยอัตโนมัติ หรือคุณสามารถกำหนดเองสำหรับกรณีพิเศษได้
ไม่ต้องติดตั้ง ไม่ต้องสมัคร
เปิดหน้าและวางข้อมูลของคุณ ไม่มี CLI ที่ต้องติดตั้ง ไม่มีแพ็กเกจที่ต้องเพิ่มในโปรเจกต์ และไม่มีบัญชีที่ต้องสร้าง ผลลัพธ์พร้อมภายในไม่กี่มิลลิวินาที

กรณีการใช้งานเครื่องมือ CSV

การแปลง CSV เกิดขึ้นในทุกขั้นตอนของการพัฒนาซอฟต์แวร์ — การสร้างต้นแบบ API การเพาะข้อมูลฐานข้อมูล การดีบักไปป์ไลน์ ETL นี่คือหกสถานการณ์จริงที่ตัวแปลงบนเบราว์เซอร์ประหยัดเวลาเมื่อเทียบกับการเขียนสคริปต์แบบครั้งเดียว

การสร้างต้นแบบ API
แปลงการส่งออกสเปรดชีตเป็นอาร์เรย์ JSON เพื่อใช้เป็นข้อมูล API จำลอง ทีมฟรอนต์เอนด์สามารถเริ่มสร้างคอมโพเนนต์ได้ก่อนที่ backend จะพร้อม
การเพาะข้อมูลฐานข้อมูล
แปลงดัมป์ข้อมูล CSV เป็น JSON fixtures สำหรับการเพาะฐานข้อมูลพัฒนา ORM อย่าง Prisma, Sequelize และ TypeORM รับไฟล์ JSON สำหรับการเพาะข้อมูล
การดีบักไปป์ไลน์ข้อมูล
เมื่อขั้นตอน ETL ส่งออก CSV ที่ไม่คาดคิด ให้แปลงเป็น JSON เพื่อตรวจสอบ โครงสร้างคีย์-ค่าของ JSON ทำให้ง่ายต่อการระบุฟิลด์ที่ขาดหายหรือคอลัมน์ที่ไม่ตรงกัน
เมทริกซ์การทดสอบ QA
กรณีทดสอบที่ใช้สเปรดชีตสามารถแปลงเป็นอาร์เรย์ JSON สำหรับการทดสอบแบบขับเคลื่อนด้วยข้อมูลกับ Jest, pytest หรือการทดสอบแบบกำหนดพารามิเตอร์ของ Playwright
การประมวลผลการส่งออกการวิเคราะห์
Google Analytics, Mixpanel และ Amplitude ส่งออกข้อมูลเป็น CSV การแปลงเป็น JSON ช่วยให้คุณกรอง รวม และแสดงผลข้อมูลนั้นด้วยไลบรารีแผนภูมิ JavaScript
การสำรวจข้อมูลเปิด
พอร์ทัลของรัฐบาลและชุดข้อมูล Kaggle มักเผยแพร่เป็น CSV การแปลงเป็น JSON ทำให้ง่ายต่อการโหลดข้อมูลเข้าสู่แดชบอร์ดฟรอนต์เอนด์หรือโน้ตบุ๊ก

ตารางอ้างอิงตัวคั่น CSV

ไฟล์ CSV ใช้ตัวคั่นที่แตกต่างกันขึ้นอยู่กับซอฟต์แวร์ที่สร้างและการตั้งค่าภาษาของผู้ใช้ ตารางด้านล่างแสดงตัวคั่นมาตรฐานสี่ตัว แหล่งที่มาทั่วไป และเมื่อใดที่คุณน่าจะพบแต่ละตัว

ตัวคั่นอักขระแหล่งที่มาทั่วไปหมายเหตุ
เครื่องหมายจุลภาค,Excel (US/UK), Google Sheets, ไลบรารีโปรแกรมส่วนใหญ่ตัวคั่นเริ่มต้นตาม RFC 4180 เกิดปัญหาเมื่อข้อมูลมีเครื่องหมายจุลภาค (ต้องใช้การอ้างอิง)
แท็บ\tการส่งออกฐานข้อมูล, Excel (บันทึกเป็น .txt), การวางจากคลิปบอร์ดสเปรดชีตมักเรียกว่า TSV (Tab-Separated Values) แทบไม่ปรากฏในค่าฟิลด์ จึงแทบไม่จำเป็นต้องอ้างอิง
เซมิโคลอน;Excel (ภาษายุโรป: DE, FR, IT, ES), LibreOffice Calcใช้ในภาษาที่เครื่องหมายจุลภาคเป็นตัวคั่นทศนิยม (1.234,56) เป็นสาเหตุทั่วไปของความล้มเหลวในการแยกวิเคราะห์เมื่อตัวแยกวิเคราะห์ถือว่าใช้เครื่องหมายจุลภาค
ไปป์|การส่งออก Mainframe, ฟีดข้อมูลธนาคาร/การเงิน, เวชระเบียน HL7เลือกใช้เมื่อทั้งเครื่องหมายจุลภาคและเซมิโคลอนปรากฏในค่าข้อมูล พบน้อยในการพัฒนาเว็บแต่เป็นมาตรฐานในการแลกเปลี่ยนข้อมูลองค์กร

CSV เทียบกับ JSON: การเปรียบเทียบโครงสร้าง

CSV และ JSON แสดงข้อมูลแตกต่างกัน การเข้าใจความแตกต่างเหล่านี้อธิบายว่าทำไมการแปลงจึงไม่สูญเสียข้อมูลเสมอไป และทำไมการตัดสินใจบางอย่าง (การอนุมานประเภท การแมปส่วนหัว การจัดการ null) จึงมีความสำคัญ

คุณสมบัติCSVJSON
โมเดลข้อมูลตารางแบบแบน (แถวและคอลัมน์)ต้นไม้ (ออบเจ็กต์และอาร์เรย์ที่ซ้อนกัน)
ระบบประเภทไม่มี (ค่าทั้งหมดเป็นสตริง)String, number, boolean, null, object, array
การซ้อนไม่รองรับความลึกไม่จำกัด
สคีมาโดยนัย (แถวส่วนหัวเป็นทางเลือกตาม RFC 4180)อธิบายตัวเอง (คีย์อยู่ในบรรทัด)
คอมเมนต์ไม่ได้มาตรฐาน (บางเครื่องมือใช้ #)ไม่รองรับ (ECMA-404)
ขนาดไฟล์กระชับ (ไม่ซ้ำคีย์ในแต่ละแถว)ใหญ่กว่า (คีย์ซ้ำในทุกออบเจ็กต์)
การสตรีมทีละบรรทัด (เหมาะสำหรับการสตรีม)ต้องใช้ NDJSON หรือ JSON Streaming สำหรับการประมวลผลทีละบรรทัด

สำหรับข้อมูลตารางที่มีคอลัมน์สม่ำเสมอ CSV มีประสิทธิภาพด้านพื้นที่มากกว่าเนื่องจากไม่ซ้ำคีย์ในแต่ละแถว สำหรับข้อมูลที่มีฟิลด์หลากหลาย โครงสร้างซ้อนกัน หรือค่าที่มีประเภท JSON เป็นตัวเลือกที่ดีกว่า เมื่อแปลงจาก CSV เป็น JSON ไฟล์ผลลัพธ์จะใหญ่ขึ้นเนื่องจากแต่ละออบเจ็กต์ซ้ำชื่อส่วนหัวทั้งหมดเป็นคีย์พร็อพเพอร์ตี้

วิธีเลือกเครื่องมือ CSV ที่เหมาะสม

เลือกเครื่องมือที่ตรงกับทิศทางการแปลงข้อมูลของคุณ เครื่องมือแต่ละชิ้นประมวลผลข้อมูลทั้งหมดในเบราว์เซอร์ ตรวจจับตัวคั่นอัตโนมัติ จัดการฟิลด์ที่มีเครื่องหมายอ้างตาม RFC 4180 และให้คุณคัดลอกหรือดาวน์โหลดผลลัพธ์ได้ทันที — ไม่ต้องติดตั้ง

  1. 1
    หากคุณต้องการ แปลงไฟล์ CSV หรือข้อมูลคลิปบอร์ดเป็นอาร์เรย์ JSON ของออบเจ็กต์ตัวแปลง CSV เป็น JSON
  2. 2
    หากคุณต้องการ แปลงอาร์เรย์ JSON เป็นรูปแบบ CSV สำหรับนำเข้าสเปรดชีตหรือส่งออกข้อมูลตัวแปลง JSON เป็น CSV
  3. 3
    หากคุณต้องการ สร้างตาราง Markdown สำหรับเอกสาร README หรือหน้า wikiCSV เป็น Markdown
  4. 4
    หากคุณต้องการ สร้างตาราง HTML ที่มีองค์ประกอบ thead และ tbody พร้อมฝังในหน้าเว็บCSV เป็นตาราง HTML
  5. 5
    หากคุณต้องการ ทำให้ตัวคั่นสม่ำเสมอ ตัดช่องว่าง หรือมาตรฐานการอ้างอิงในไฟล์ CSVตัวจัดรูปแบบ CSV
  6. 6
    หากคุณต้องการ สร้างคำสั่ง INSERT หรือสคีมา CREATE TABLE จากไฟล์ CSVCSV เป็น SQL

เครื่องมือทุกชิ้นด้านบนตรวจจับตัวคั่นอัตโนมัติ จัดการการอ้างอิงตาม RFC 4180 และให้คุณดาวน์โหลดผลลัพธ์เป็นไฟล์ได้ หาก CSV ต้นทางของคุณมีตัวคั่นที่ไม่สม่ำเสมอ ช่องว่างพิเศษ หรือการอ้างอิงที่ไม่สมดุล ให้รันผ่านตัวจัดรูปแบบ CSV ก่อน — การทำความสะอาดข้อมูลก่อนการแปลงป้องกันผลลัพธ์ที่ผิดรูปแบบและประหยัดเวลาการดีบักภายหลัง หากเวิร์กโฟลว์ของคุณเกี่ยวข้องกับการแปลงระหว่าง JSON และ YAML เป็นขั้นตอนกลาง ให้ดูหมวดหมู่เครื่องมือ YAML ด้วย สำหรับการตรวจสอบหรือจัดรูปแบบผลลัพธ์ JSON เครื่องมือ JSON Formatter และ JSON Validator อยู่ห่างแค่คลิกเดียว

คำถามที่พบบ่อย

RFC 4180 คืออะไร และมีความสำคัญอย่างไรต่อการแยกวิเคราะห์ CSV?
RFC 4180 คือข้อกำหนดอย่างเป็นทางการสำหรับรูปแบบ CSV ที่เผยแพร่โดย IETF กำหนดกฎสำหรับการอ้างอิงฟิลด์ (เครื่องหมายคำพูดคู่รอบฟิลด์ที่มีเครื่องหมายจุลภาค การขึ้นบรรทัดใหม่ หรือเครื่องหมายคำพูด) การสิ้นสุดบรรทัด (CRLF) และแถวส่วนหัว ตัวแยกวิเคราะห์ที่เป็นไปตาม RFC 4180 จัดการกรณีขอบเขตได้อย่างถูกต้อง ตัวแยกวิเคราะห์ที่ไม่เป็นไปตามอาจแบ่งฟิลด์ที่มีเครื่องหมายอ้างโดยไม่ส่งสัญญาณหรือตัดการขึ้นบรรทัดใหม่ที่ฝังอยู่
ฉันจะแปลง CSV เป็น JSON ใน JavaScript โดยไม่ใช้ไลบรารีได้อย่างไร?
แยกข้อความด้วยการขึ้นบรรทัดใหม่ ดึงบรรทัดแรกเป็นส่วนหัว จากนั้น map แต่ละบรรทัดถัดไปเป็นออบเจ็กต์โดยใช้ส่วนหัวเป็นคีย์ สำหรับการใช้งานจริง วิธีนี้จะล้มเหลวกับฟิลด์ที่มีเครื่องหมายอ้างซึ่งมีเครื่องหมายจุลภาคหรือการขึ้นบรรทัดใหม่ ใช้ไลบรารีอย่าง Papa Parse หรือตัวแปลง CSV เป็น JSON ของ ToolDeck ซึ่งจัดการกรณีขอบเขตของ RFC 4180 ได้
ไฟล์ CSV สามารถมีข้อมูลซ้อนกันได้หรือไม่?
ไม่ได้ CSV เป็นรูปแบบแบนที่ไม่รองรับการซ้อนกันโดยกำเนิด มีวิธีแก้ปัญหาบางอย่าง เช่น ส่วนหัวแบบ dot-notation (address.city) ค่าเซลล์ที่เข้ารหัสเป็น JSON หรือไฟล์ CSV หลายไฟล์ที่เกี่ยวข้องกัน หากข้อมูลของคุณมีโครงสร้างซ้อนกัน JSON, YAML หรือ XML เป็นตัวเลือกรูปแบบที่ดีกว่า
ทำไม Excel จึงส่งออก CSV ด้วยเซมิโคลอนแทนเครื่องหมายจุลภาค?
ในภาษายุโรป เครื่องหมายจุลภาคเป็นตัวคั่นทศนิยม (1.234,56) ดังนั้น Excel จึงใช้เซมิโคลอนเป็นตัวคั่น CSV แทน ซึ่งเป็นสาเหตุทั่วไปของข้อผิดพลาดในการแยกวิเคราะห์เมื่อโค้ดถือว่าใช้การคั่นด้วยเครื่องหมายจุลภาค ตัวคั่นเฉพาะถูกควบคุมโดยการตั้งค่า Windows List separator ใน Regional Options ซึ่งค่าเริ่มต้นเป็นเซมิโคลอนเมื่อตัวคั่นทศนิยมเป็นเครื่องหมายจุลภาค ซึ่งหมายความว่าไฟล์ที่ส่งออกจาก Excel ภาษาฝรั่งเศสและ Excel ภาษาสหรัฐอเมริกาอาจมีตัวคั่นที่แตกต่างกันแม้จะมีนามสกุล .csv เหมือนกัน ควรตรวจสอบหรือตรวจจับตัวคั่นอัตโนมัติก่อนแยกวิเคราะห์ไฟล์ CSV ที่ไม่ทราบแหล่งที่มา
มีจำนวนคอลัมน์สูงสุดในไฟล์ CSV หรือไม่?
RFC 4180 ไม่ได้กำหนดขีดจำกัดคอลัมน์ ขีดจำกัดในทางปฏิบัติขึ้นอยู่กับแอปพลิเคชันที่รับข้อมูล Excel รองรับ 16,384 คอลัมน์ (2^14) ตัวแยกวิเคราะห์ CSV ส่วนใหญ่ใน Python, JavaScript และ Go ไม่มีขีดจำกัดคอลัมน์ในตัว เครื่องมือบนเบราว์เซอร์ถูกจำกัดโดยหน่วยความจำที่มีอยู่ ซึ่งโดยทั่วไปรองรับหลายพันคอลัมน์โดยไม่มีปัญหา
ความแตกต่างระหว่าง CSV และ TSV คืออะไร?
TSV (Tab-Separated Values) ใช้อักขระแท็บเป็นตัวคั่นฟิลด์แทนเครื่องหมายจุลภาค ไฟล์ TSV มีนามสกุล .tsv เนื่องจากอักขระแท็บแทบไม่ปรากฏในค่าข้อมูล ไฟล์ TSV จึงต้องการการอ้างอิงน้อยกว่า CSV เครื่องมือฐานข้อมูล ซอฟต์แวร์ชีวสารสนเทศ และการวางจากคลิปบอร์ดสเปรดชีตมักสร้าง TSV
ฉันจะจัดการไฟล์ CSV ที่มีความยาวแถวไม่สม่ำเสมอได้อย่างไร?
ความยาวแถวที่ไม่สม่ำเสมอ (ragged CSV) มักบ่งชี้ถึงตัวคั่นที่ไม่ได้ Escape หรือเครื่องหมายคำพูดที่ขาดหายในข้อมูลต้นทาง ตัวแยกวิเคราะห์ส่วนใหญ่จัดการด้วยการเพิ่มค่าว่างในแถวสั้นและตัดแถวยาวให้ตรงกับจำนวนส่วนหัว หากความไม่สม่ำเสมอสม่ำเสมอ ให้ตรวจสอบว่าไฟล์ใช้ตัวคั่นที่ต่างจากที่คาดหวังหรือมีตัวคั่นต่อท้ายในแต่ละบรรทัด ตัวอย่างเช่น ไฟล์ที่ส่งออกด้วยเซมิโคลอนที่ตัวแยกวิเคราะห์แบบเครื่องหมายจุลภาคอ่านจะสร้างแถวคอลัมน์เดียวสำหรับแต่ละบรรทัด — ทุกระเบียนดูเหมือนมีฟิลด์เดียวแทนที่จะเป็นหกฟิลด์ขึ้นไปตามที่คาดหวัง การรันผ่านตัวจัดรูปแบบ CSV ก่อนจะเผยให้เห็นความไม่ตรงกันทันที
การแปลง CSV เป็น JSON รักษาประเภทข้อมูลไว้หรือไม่?
CSV ไม่มีระบบประเภท ค่าทั้งหมดเป็นสตริง เมื่อแปลงเป็น JSON ค่าจะยังคงเป็นสตริงเว้นแต่ตัวแปลงจะอนุมานประเภทอย่างชัดเจน ตัวแปลงบางตัวตรวจจับสตริงตัวเลขและส่งออกตัวเลข JSON แต่อาจทำให้ข้อมูลสูญหาย (เลขศูนย์นำหน้าในรหัสไปรษณีย์ หมายเลขโทรศัพท์) ตัวแปลงของ ToolDeck เก็บค่าเป็นสตริงโดยค่าเริ่มต้นเพื่อหลีกเลี่ยงปัญหานี้