猿问

如何从用户输入中提取数据帧行

data = {'Sample':['S1', 'S1', 'S1' ,'S1' ,'S2' ,'S2' ,'S3' ,'S3', 'S4', 'Negative', 'Positive', 'Negative',

                 'S1', 'S1', 'S1' ,'S2' ,'S2' ,'S2' ,'S3' ,'S4', 'S4', 'Positive', 'Positive', 'Negative'], 

       'Location':['A1', 'A2', 'A3' ,'A4' ,'A5' ,'A6' ,'A7' ,'A8', 'A9', 'A10', 'A11', 'A12',

                   'B1', 'B2', 'B3' ,'B4' ,'B5' ,'B6' ,'B7' ,'B8', 'B9', 'B10', 'B11', 'B12'],

    'Repeat Number':['1', '2', '3' ,'4' ,'1' ,'2' ,'1' ,'2', '1', '1', '1', '2',

                  '1', '2', '3' ,'1' ,'2' ,'3' ,'1' ,'1', '2', '1', '2', '1',],

   'Identifier' :['asd01', 'asd02', 'asd03', 'asd04', 'asd05', 'asd06', 'asd07', 'asd08', 'asd09'

                 ,'asd10' ,'asd11' ,'asd12' ,'asd13' ,'asd14' ,'asd15', 'asd16', 'asd17', 'asd18',

                 'asd19', 'asd20', 'asd21', 'asd22', 'asd23', 'asd24']}

df1 = pd.DataFrame(data) 


在上图中,位置组 A 中有 4 个 S1,它们是重复的,因为它们位于同一位置组 A 中。对于位置 B,有 3 个 S1 并且它们是重复的,因为它们位于同一位置组 B 中。所以它们是给定重复编号(1,2,3,...)。


对于上面的示例代码,我想为自己提取行,并在为“样本”、“位置”提供用户输入时重复该行。


例如,如果我为“样本”输入 Negative,为“Location”输入 A,则理想结果将如下所示:


data = {'Sample':[ 'Negative', 'Negative'], 

       'Location':[ 'A10',  'A12'],

    'Repeat Number':[ '1', '2'],

   'Identifier' : ['asd10' ,'asd12']}

另外,我想知道如何在行选择后仅提取标识符。


我尝试使用 df.loc[] 但我不知道如何进行用户输入,因为输入包含字符串


森栏
浏览 141回答 4
4回答

三国纷争

使用下面的代码,您将能够从数据框中提取数据:sample = input('Enter Sample: ')location = input('Enter Location: ')df.loc[(df['Sample'] == sample) & (df['Location'].str.contains(location))]这是上面代码的输出:Enter Sample: S2Enter Location: B    Sample  Location    Repeat Number   Identifier15  S2  B4  1   asd1616  S2  B5  2   asd1717  S2  B6  3   asd18

交互式爱情

只需链接您的条件和使用即可to_dict("list"):print (df.loc[df["Sample"].eq("Negative")&df["Location"].str.contains("A")].to_dict("list"))#{'Sample': ['Negative', 'Negative'], 'Location': ['A10', 'A12'], 'Repeat Number': ['1', '2'], 'Identifier': ['asd10', 'asd12']}

精慕HU

以下内容会起作用。我相信在这种情况str.startswith下比str.contains:import pandas as pddata = {    'Sample': [        'S1', 'S1', 'S1', 'S1', 'S2', 'S2', 'S3', 'S3', 'S4', 'Negative', 'Positive', 'Negative',        'S1', 'S1', 'S1', 'S2', 'S2', 'S2', 'S3', 'S4', 'S4', 'Positive', 'Positive', 'Negative'    ],    'Location': [        'A1', 'A2', 'A3', 'A4', 'A5', 'A6', 'A7', 'A8', 'A9', 'A10', 'A11', 'A12',        'B1', 'B2', 'B3', 'B4', 'B5', 'B6', 'B7', 'B8', 'B9', 'B10', 'B11', 'B12'    ],    'Repeat Number': [        '1', '2', '3', '4', '1', '2', '1', '2', '1', '1', '1', '2',        '1', '2', '3', '1', '2', '3', '1', '1', '2', '1', '2', '1'    ],    'Identifier': [        'asd01', 'asd02', 'asd03', 'asd04', 'asd05', 'asd06', 'asd07', 'asd08', 'asd09',        'asd10', 'asd11', 'asd12', 'asd13', 'asd14', 'asd15', 'asd16', 'asd17', 'asd18',        'asd19', 'asd20', 'asd21', 'asd22', 'asd23', 'asd24'    ]}location_start = 'A'sample_result = 'Negative'df1 = pd.DataFrame(data)# filter on the two criteriadf2 = df1[df1['Location'].str.startswith(location_start, na=False) & (df1['Sample'] == sample_result)]print(df2)      Sample Location Repeat Number Identifier9   Negative      A10             1      asd1011  Negative      A12             2      asd12

海绵宝宝撒

尝试这个:df[(df.Sample=='Negative') & (df.Location.str.startswith('A'))]
随时随地看视频慕课网APP

相关分类

Python
我要回答