加载 csv 发表于 2018-11-12 阅读 3698回复 2

windows平台的csv文件在linux系统加载出现一条错误数据不...

windows平台的csv文件在linux系统中进行加载出现,始终有一条错误数据

回答 (2)

grander
发表于2018-11-12 15:42
csv 文件头保留着UTF-8文件的Unicode签名BOM(Byte Order Mark)
[root@node1 dispatch_server]# head -10 buyer02.csv |cat -A
M-oM-;M-?"BUYER_ID","MONEY_TOTAL"^M$
注:微软在自己的UTF-8格式的文本文件之前加上了EF BB BF三个字节, windows上面的notepad等程序就是根据这三个字节来确定一个文本文件是ASCII的还是UTF-8, 然而其它平台上并没有对UTF-8文本文件做个这样的标记。

grander
发表于2018-11-12 15:45
通过以下命令去掉csv文件头的BOM标记
sed -i 's/\xEF\xBB\xBF//' buyer02.csv
再进行数据加载,数据能够正常加载入库

撰写回答

您需要登录后才可以回帖 登录 | 立即注册