SQL Server - BULK INSERT
ナビゲーションに移動
検索に移動
概要
BULK INSERT
文は、SQL Serverで大量のデータを高速にテーブルに取り込むための機能である。
通常のINSERT文と比較して、効率的にデータを取り込むことができる。
-- 使用例
BULK INSERT TargetTable
FROM 'C:\Data\source.txt'
WITH
(
FIELDTERMINATOR = ',',
ROWTERMINATOR = '\n'
);
重要な特徴として、BULK INSERT文はトランザクションログへの書き込みを最小限に抑えることで高速な処理を実現している。
これは、大量データの取り込み時に大きな効果を発揮する。
データソースとしては、カンマ区切り (CSV) や タブ区切り (TSV) 等の形式のテキストファイルが使用できる。
FIELDTERMINATOR
オプションは列の区切り文字、ROWTERMINATOR
オプションは行の区切り文字を指定する。
パフォーマンスに影響を与える重要な要素として、以下に示すような設定がある。
WITH
(
BATCHSIZE = 1000,
TABLOCK,
CHECK_CONSTRAINTS = OFF,
FIRE_TRIGGERS = OFF
)
これらのオプションを適切に設定することにより、パフォーマンスを向上させることができる。
特に、TABLOCK
オプションは、テーブルレベルでのロックを取得することにより、行レベルのロックによるオーバーヘッドを避けることができる。
※注意
BULK INSERT文を使用する場合は、ファイルに対する適切なアクセス権限が必要となる。
また、データファイルの形式とテーブルのスキーマが正確に一致している必要がある。
エラーハンドリングについては、ERRORFILE
オプションを使用することにより、取り込みに失敗した行を別ファイルに出力して後から確認することができる。
WITH
(
ERRORFILE = 'C:\Errors\error.txt',
MAXERRORS = 10
)
BULK INSERT文は、大量データの取り込みに非常に効果的なツールであるが、適切な設定と事前準備が重要となる。
BULK INSERTの例
下記は、CSVファイル(カンマ区切り)をインポートする際の例である。
- 文字コードがShift-JISの場合
BULK INSERT T_Table
FROM 'D:\UnicodeFile.txt'
WITH (
DATAFILETYPE = 'char',
FIELDTERMINATOR = ','
);
GO
- 文字コードがUNICODEの場合 (SQL Server 2014 R2以前)
- ただし、SQL Server 2014 R2以前では、下記のクエリを実行しても UTF-8形式のファイルは取り込めない。
- (UTF-8固有の文字が無いUTF-8形式のファイルはインポートできる)
BULK INSERT T_Table
FROM 'D:\UnicodeFile.txt'
WITH (
DATAFILETYPE = 'widechar',
FIELDTERMINATOR = ','
);
GO
- 文字コードがUTF-8の場合 (SQL Server 2014 R2以降)
- SQL Server 2014 R2以降では、UTF-8形式のファイルをインポートすることが出来る。
BULK INSERT T_Table
FROM 'D:\UnicodeFile.txt'
WITH (
DATAFILETYPE = 'char',
CODEPAGE = '65001',
FIELDTERMINATOR = ','
);
GO