爬虫数据储存—CSV文件
爬虫数据储存—CSV文件
一、什么是CSV文件
逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。
二、CSV文件特点:
1.以.csv作为结尾。
2.一般以逗号作为分隔符,当然也可以不是逗号。
3.每一行代表一个数据,以指定的分隔符分隔。
4.可以有表头,也可以没有表头。
比如,下面的就是一个CSV文件:
三、为什么使用CSV文件?
当我们在linux上操作数据库导出数据时,一般我们会将数据导出为csv格式数据,方便我们在windows上检查数据。另外,csv格式数据也可使用excel进行打开。
四、注意事项
当我们使用csv文件存储数据时,一定要注意被存储的数据的格式,如果时一些中文片段,里面包含有一些逗号,此时分隔符如果还设置为逗号,再次读取此CSV文件时就会乱掉。