猿问

“解压”pandas 数据框的最快方法

希望标题没有误导。我像往常一样在 pandas 数据框中加载 Excel 文件


df = pd.read_excel('complete.xlsx')

这就是里面的东西(通常已经订购了 - 这是一个非常小的样品)


df

Out[21]: 

    Country       City First Name  Last Name  Ref

0   England     London       John      Smith   34

1   England     London       Bill       Owen  332

2   England   Brighton        Max      Crowe   25

3   England   Brighton      Steve      Grant   55

4    France      Paris     Roland      Tomas   44

5    France      Paris    Anatole     Donnet  534

6    France       Lyon     Paulin     Botrel  234

7     Spain     Madrid      Oriol  Abarquero   34

8     Spain     Madrid    Alberto    Olloqui  534

9     Spain  Barcelona      Ander     Moreno  254

10    Spain  Barcelona      Cesar     Aranda  222

我需要做的是自动导出数据,为每个国家创建一个 sqlite 数据库(即“England.sqlite”),其中将包含每个城市(即伦敦和布莱顿)的表,每个表都有相关人员信息。


sqlite 不是问题,我只是想弄清楚如何以最快速和“Pythonic 的方式”“解压”数据框


谢谢


慕侠2389804
浏览 93回答 1
1回答

芜湖不芜

您可以按DataFrame.groupby对象循环:for i, subdf in df.groupby('Country'):     print (i)     print (subdf)     #processing
随时随地看视频慕课网APP
我要回答