我应该如何构建我的 tensorflow 数据集以将其输入自定义 RNN 估计器

我正在尝试使用自定义估算器RNN 来估算我网站上的客户是否会根据他们的点击行为购买商品。所以数据集看起来像:


session_id  page_type   event            since_previous_click (s)   will_buy

1           search      SelectCountry    null                        0

1           search      SelectCountry    2                           0

1           search      SortResults      4                           0

1           product     SelectColor      20                          0

2           search      SelectCountry    null                        1

2           search      SortResults      10                          1

2           product     SelectSize       5                           1

2           product     SelectColor      23                          1

2           inmarket    EnterName        8                           1

2           inmarket    Booked           34                          1

所以“will_buy”是标签,page_type、event和since_previous_click是输入特征。然而,我的问题是我不知道如何构建我的输入数据集。我知道维度应该是 [#data points, #time steps, #features],其中应该填充时间步长的数量,因为它们的长度不同。但是我无法从张量(或 numpy 数组)构造这个 3D 对象,因为有多个 dtypes(字符串和 int32)。有什么帮助吗?


慕无忌1623718
浏览 134回答 1
1回答

呼啦一阵风

将页面类型和事件转换为单热向量。那么你所有的数据都将是 int32。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python