神经网络的 DNA 数据输入，一种热编码

增加 2 倍而不是增加 4 倍是因为每个系列中只有 2 个类别。（在您的示例中，第一行中的 A 和 G，第二行中的 G 和 C，第三行中的 T 和 C，依此类推）下面的示例将更好地理解附加列的数量In [38]: df = pd.DataFrame({'A': ['a', 'b', 'a'], 'B': ['b', 'a', 'c'], 'C': [1, 2, 3]})                                                                       In [39]: df                                                                                                                                                    Out[39]:    A  B  C0  a  b  11  b  a  22  a  c  3In [40]: pd.get_dummies(df)                                                                                                                                    Out[40]:    C  A_a  A_b  B_a  B_b  B_c0  1    1    0    0    1    01  2    0    1    1    0    02  3    1    0    0    0    1

神经网络的 DNA 数据输入，一种热编码

1回答