CSV
5 tools
ToolDeck の無料オンライン CSV ツールを使えば、ブラウザ上で CSV データの解析・変換・加工が直接行えます — ファイルのアップロード不要、アカウント登録不要。CSV を JSON に変換して API 対応の構造化配列を生成したり、JSON を CSV に変換してスプレッドシート用エクスポートを作成したり、CSV を Markdown に変換してドキュメントテーブルを生成したり、CSV を HTML に変換して埋め込み可能なテーブルマークアップを作成したり、CSV を SQL に変換してデータベースの INSERT 文を生成したりできます。すべてのパーサーは RFC 4180 に準拠しており、クォートされたフィールド、フィールド内のカンマ、混在する区切り文字も正しく処理されます。
The CSV→JSON コンバーター と JSON→CSV コンバーター は最も一般的な双方向変換を処理します。CSV フォーマッター は区切り文字やクォートの問題を他のツールに渡す前に修正し、CSV→SQL 変換 はあらゆる対応データベースエンジンで使用可能な INSERT 文と CREATE TABLE スキーマを生成します — すべての処理はブラウザ内で実行され、ファイルのアップロードもアカウント登録も不要です。
CSV ツールとは?
CSV(Comma-Separated Values)は、最も古くから広くサポートされているデータ交換フォーマットの一つです。表形式のデータをプレーンテキストとして保存します。各行がレコードであり、レコード内のフィールドは区切り文字(通常はカンマですが、タブ、セミコロン、パイプも使用されます)で分割されます。RFC 4180 は正式な文法を定義しており、区切り文字・改行・ダブルクォートを含むフィールドのクォートルールも規定しています。
そのシンプルさにもかかわらず、生の CSV は現代の開発では扱いにくい面があります。Web API は JSON を期待します。フロントエンドフレームワークは行と列ではなくオブジェクトと配列にバインドします。MongoDB や Elasticsearch などのドキュメントデータベースは JSON をネイティブに取り込みます。リレーショナルデータベースでさえ、一括インポートの前に列の型を検証して不整合なフィールドを検出するための中間 JSON ステップが役立つことが多くあります。CSV ツールはフラットな表形式データをコードが直接利用できる構造化フォーマットに変換することで、このギャップを埋めます。
スプレッドシートのエクスポート、データベースダンプ、政府のオープンデータポータル、Google Analytics や Mixpanel などのアナリティクスプラットフォーム、区切り文字付きテキストを出力する ETL パイプラインを扱う場合に CSV ツールが必要になります。その都度パースのスクリプトを書く代わりに、ブラウザベースのコンバーターを使えば、クォートされたフィールド・埋め込まれた改行・混在する区切り文字などのエッジケースを正しく処理しながら即座に結果が得られます。クライアントから一回限りのエクスポートを受け取った場合、マイグレーションを書く前にカラムマッピングを確認したい場合、またはローカル環境を構築せずにベンダーのフィードをすばやく確認したい場合、ブラウザコンバーターはあらゆるスクリプト方式より迅速です。
ToolDeck の CSV ツールを使う理由
ToolDeck の CSV ツールは JavaScript を使用してブラウザ内でデータをすべて解析します。ファイルがマシンの外に出ることはなく、バックエンドが入力を処理することもなく、レート制限によって処理が遅くなることもありません。すべてのツールはモダンブラウザで動作します — 拡張機能、プラグイン、設定は一切不要です。結果として、ブラウザが動作するあらゆる環境で高速かつプライベートな CSV 処理が実現できます。
CSV ツールのユースケース
CSV 変換はソフトウェア開発のあらゆる段階で必要になります — API のプロトタイピング、データベースのシーディング、ETL パイプラインのデバッグなど。ここでは、その都度スクリプトを書く場合と比較してブラウザベースのコンバーターが時間を節約できる 6 つの具体的なシナリオを紹介します。
CSV 区切り文字リファレンス
CSV ファイルは、作成したソフトウェアやユーザーのロケールによって異なる区切り文字を使用します。以下の表は 4 つの標準的な区切り文字、その一般的なソース、および各区切り文字が登場する場面を一覧にしています。
| 区切り文字 | 文字 | 一般的なソース | 備考 |
|---|---|---|---|
| カンマ | , | Excel(US/UK)、Google Sheets、ほとんどのプログラミングライブラリ | RFC 4180 のデフォルト区切り文字。データにカンマが含まれる場合に問題が生じる(クォートが必要)。 |
| タブ | \t | データベースエクスポート、Excel(.txt として保存)、スプレッドシートからのクリップボード貼り付け | TSV(Tab-Separated Values)とも呼ばれる。フィールド値内に登場することがほとんどないため、クォートが必要になることはまれ。 |
| セミコロン | ; | Excel(欧州ロケール:DE、FR、IT、ES)、LibreOffice Calc | 小数点にカンマを使うロケール(1.234,56)で使用される。パーサーがカンマを前提にしている場合、解析エラーの一般的な原因となる。 |
| パイプ | | | メインフレームエクスポート、銀行・金融データフィード、HL7 医療記録 | データ値にカンマとセミコロンの両方が含まれる場合に選択される。Web 開発ではまれだが、エンタープライズのデータ交換では標準的。 |
CSV vs JSON:構造的比較
CSV と JSON はデータを異なる形式で表現します。この違いを理解することで、変換が常に無損失ではない理由と、型推論・ヘッダーマッピング・null 値の処理などの決定が重要な理由が明確になります。
| 特徴 | CSV | JSON |
|---|---|---|
| データモデル | フラットなテーブル(行と列) | ツリー構造(ネストされたオブジェクトと配列) |
| 型システム | なし(すべての値は文字列) | 文字列、数値、ブーリアン、null、オブジェクト、配列 |
| ネスト | 非対応 | 任意の深さ |
| スキーマ | 暗黙的(RFC 4180 ではヘッダー行は任意) | 自己記述型(キーがインライン) |
| コメント | 標準化されていない(# を使うツールもある) | 非対応(ECMA-404) |
| ファイルサイズ | コンパクト(行ごとにキーを繰り返さない) | 大きい(すべてのオブジェクトでキーが繰り返される) |
| ストリーミング | 行ごと(ストリーミングに自然) | 行ごとには NDJSON または JSON Streaming が必要 |
均一な列を持つ表形式データの場合、CSV は行ごとにキーを繰り返さないため、よりスペース効率が高くなります。フィールドが変動するデータ、ネスト構造、型付きの値の場合は JSON の方が適切な選択です。CSV から JSON に変換すると、各オブジェクトがすべてのヘッダー名をプロパティキーとして繰り返すため、出力ファイルは大きくなります。
適切な CSV ツールの選び方
データ変換の方向に合ったツールを選んでください。各ツールはブラウザ内でデータをすべて処理し、区切り文字を自動検出し、RFC 4180 のクォートされたフィールドを処理し、結果をすぐにコピーまたはダウンロードできます — インストール不要。
- 1
- 2
- 3
- 4
- 5
- 6
上記のすべてのツールは区切り文字を自動検出し、RFC 4180 のクォートを処理し、結果をファイルとしてダウンロードできます。ソース CSV に不整合な区切り文字、余分な空白、バランスの崩れたクォートがある場合は、まず CSV フォーマッターを通してください — 変換前に入力を整理することで、不正な出力を防ぎ、後工程でのデバッグ時間を節約できます。JSON と YAML の間の変換を中間ステップとして含むワークフローがある場合は、YAML ツールカテゴリも確認してください。JSON 出力の検証やフォーマットには、JSON フォーマッターと JSON バリデーターが 1 クリックで利用できます。