猿问

python 如何抽取多个指定样本的数据?


现有数据如下(真实情况大概几十万行):


比如有另个文件p.txt,里面有一列数,如下:
“8240004146789610
8240004356417597
……
8240004146757344”
我需要抽取数据中第四列为p.txt中的数,该有什么快速的方法吗(方法不限定于pandas)?
其实就是个抽样过程,抽指定的样本,第四列为指定文件里的数。

现在的想法是在p.txt里循环,然后用pandas读取原始数据,第四列==循环的数就提取出来,是否有更快捷的方法?


慕哥9229398
浏览 1300回答 2
2回答

开满天机

可以考虑用pandas的apply,减去p.txt循环和后继矩阵拼接的步骤。即读取p.txt里的数据转成一个list例如P,然后用pandas读取原始数据,执行:

侃侃无极

可以考虑用pandas的apply,减去p.txt循环和后继矩阵拼接的步骤。即读取p.txt里的数据转成一个list例如P,然后用pandas读取原始数据,执行:
随时随地看视频慕课网APP

相关分类

Python
我要回答