如何在python中测试两组之间的相关性？

from scipy.stats import pearsonrdf_full = df1.merge(df2,how='left')full_correlation = pearsonr(df_full['BSL'],df_full['Accidents'])print('Correlation coefficient:',full_correlation[0])print('P-value:',full_correlation[1])输出：(-0.2934597230564072, 0.3811116115819819)Correlation coefficient: -0.2934597230564072P-value: 0.3811116115819819编辑：您想要每小时的相关性，但在数学上这是不可能的，因为您每小时只有 1 个 xy 值。因此，输出将充满 NaN。这是代码，但是输出无效：df_corr = df_full.groupby('Datetime')['BSL','Accidents'].corr().drop(columns='BSL').drop('Accidents',level=1).rename(columns={'Accidents':'Correlation'})print(df_corr)输出：              CorrelationDatetime                 7        BSL          NaN8        BSL          NaN9        BSL          NaN10       BSL          NaN11       BSL          NaN12       BSL          NaN13       BSL          NaN14       BSL          NaN15       BSL          NaN16       BSL          NaN17       BSL          NaN

如何在python中测试两组之间的相关性？

3回答