python 导出商品详情到 csv 时数据错乱的解决方法
使用 python 从网站爬取商品详情并导出到 csv 文件时,可能会遇到商品详情数据溢出到下一行或多行的问题。这是什么原因造成的,如何解决呢?
原因:
csv 文件通过以逗号分隔字段来存储数据。如果商品详情包含引号 (“),就会与 csv 中作为分隔符的引号混淆,导致数据错乱。
立即学习“Python免费学习笔记(深入)”;
解决方案:
要解决此问题,需要对商品详情中的引号进行转义。换句话说,将每个出现的引号 (” “) 替换为两个引号 (” “)。
代码示例:
# 打开 csv 文件并写入头信息 writer = csv.writer(open('商品详情.csv', 'w'), delimiter=',') writer.writerow(['商品id', '名称', '详情']) # 循环遍历商品列表 for product in products: # 将详情按行分割 detAIls = product.detail.split('n') # 将每个详情中的引号转义 details = [detail.replace('"', '""') for detail in details] # 写入 csv 文件 writer.writerow([product.id, product.name, 'n'.join(details)])
登录后复制
其他注意事项:
- 如果 csv 文件无法正确识别 utf-8 编码,可以在写入文件时添加 bom 头(字节顺序标记):
writer = csv.writer(open('商品详情.csv', 'w', encoding='utf-8-sig'), delimiter=',')
登录后复制
- 确保导出的 csv 文件不会包含额外的空行或空白字符。这些字符也会导致数据错乱。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
【小浪云服务商 - 服务器12元起 - 挂机宝5元起】
THE END
暂无评论内容