Python 导出商品详情到 CSV 时数据错乱,如何解决?

Python 导出商品详情到 CSV 时数据错乱,如何解决?

python 导出商品详情到 csv 时数据错乱的解决方法

使用 python 从网站爬取商品详情并导出到 csv 文件时,可能会遇到商品详情数据溢出到下一行或多行的问题。这是什么原因造成的,如何解决呢?

原因:

csv 文件通过以逗号分隔字段来存储数据。如果商品详情包含引号 (“),就会与 csv 中作为分隔符的引号混淆,导致数据错乱。

立即学习Python免费学习笔记(深入)”;

解决方案:

要解决此问题,需要对商品详情中的引号进行转义。换句话说,将每个出现的引号 (” “) 替换为两个引号 (” “)。

代码示例:

# 打开 csv 文件并写入头信息 writer = csv.writer(open('商品详情.csv', 'w'), delimiter=',') writer.writerow(['商品id', '名称', '详情'])  # 循环遍历商品列表 for product in products:     # 将详情按行分割     detAIls = product.detail.split('n')     # 将每个详情中的引号转义     details = [detail.replace('"', '""') for detail in details]     # 写入 csv 文件     writer.writerow([product.id, product.name, 'n'.join(details)])
登录后复制

其他注意事项:

  • 如果 csv 文件无法正确识别 utf-8 编码,可以在写入文件时添加 bom 头(字节顺序标记):
writer = csv.writer(open('商品详情.csv', 'w', encoding='utf-8-sig'), delimiter=',')
登录后复制
  • 确保导出的 csv 文件不会包含额外的空行或空白字符。这些字符也会导致数据错乱。

© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容