读取下载的数据。把数据集都进来命名df
lable属于预测目标,‘TARGET’就是特征的名字。在df中把因变量TARGET取出来命名为lable
删除掉一些不需要的值。把ID,TARGET这两列去掉重新赋值为df
数据获取与读取1
https://www.kaggle.com/c/santander-customer-satisfaction
下载trans.csv的地址
数据的读取
数据 诊断
1.数据获取:Kaggle
Santander银行希望对满意和不满意的用户进行分类。背景是它存在一些潜在的不满意的用户,但无法提前知道。假如我们能提前知道的话,就可以提前为他们做好服务。我们需要通过它提供的用户的行为特征和问卷调查得出的因变量来构建一个模型,使用这个模型来尽早找到不满意的用户。这就是Kaggle比赛的背景。
1. 数据读取:
##0.Read Data##
df = pd.read_csv("./data/train.csv") # 将数据文件读到内存中
label = df['TARGET'] # 将数据集中TARGET列赋值给label
df = df.drop(['ID','TARGET'],axis=1) # 删除数据集中ID、TARGET两列
##0.Read Data##
df = pd.read_csv("./data/train.csv")
label = df['TARGET']
df = df.drop(['ID','TARGET'],axis=1)
数据获取与读取
1.数据获取:kaggle
2.数据读取
数据链接:http://www.kaggle.com/c/santander-customer-satisfaction
数据的诊断:
数据的获取与读取:
数据的获取:Kaggle.
数据的读取:
数据的链接:https://www.kaggle.com/c/santander-customer-satisfaction
公式的提供:Santander(提供不满意用户,使用调查对因变量分析进而建立模型获取不满意
数据的诊断:
数据的获取与读取:
数据的获取:Kaggle.
数据的读取:
数据的链接:https://www.kaggle.com/c/santander-customer-satisfaction
公式的提供:Santander(提供不满意用户,使用调查对因变量分析进而建立模型获取不满意客户)
下面进行一个数据的读取:
##0.Read Data##
df =pd.read_csv("./data/train. csv") #获取要读取的文件格式并命名为df;
#csv是第一行代码读取的格式;./data/train. csv这个路径也是可以根据自己保存的不同进行更改的。
label = df ['TARGET'] #将要预测的目标名称赋值给lable;
#要预测的目标label,TARGET是要预测目标的名字
df=df.drop( ['ID, 'TARGET'], axis=1) #将不需要的列给删除掉;
#将不需要的变量删掉,axis=1表示轴=1; (['ID, 'TARGET'], axis=1)表示删除ID和TARGET这两列。
数据的读取
数据获取Kaggle
数据的读取