我经常使用 pd.read_csv() 加载 csv 文件,而且它们通常具有不同数据类型的列。
这很好,因为我可以将字典传递给 dtype 参数,其中所有列都使用它们各自的数据类型映射出来。我发现的问题是,有时这些 csv 文件有很多列,并且生成的字典非常长。
很多时候,字典看起来像这样:
df_dtype = {
'A' : str,
'B' : str,
'C' : int
}
但是当 df 很长时,字典开始看起来像这样:
df_dtype = {
'A' : str,
'B' : str,
'C' : int,
'D' : str,
'E' : str,
'F' : int,
'G' : str,
'H' : str,
'I' : int,
'J' : str,
'K' : str,
'L' : int,
'M' : str,
'N' : str,
'O' : int,
'P' : str,
'Q' : str,
'R' : int,
'S' : str,
'T' : str,
'U' : int,
'V' : str,
'W' : str,
'X' : int,
'Y' : str,
'Z' : str
}
这很丑陋,并且使代码的可读性降低。
这样做的最佳做法是什么?我应该将字典作为目录中的单独文件吗?有没有更漂亮的格式化方式?
慕的地10843
相关分类