我有一个包含一个分类变量和多个连续变量的数据集,如下所示:
A B C
2.0 1.0 foo
2.2 1.2 bar
1.0 1.5 foo
我想计算:
Pr(C='foo'| A=2.0) # column A
Pr(C='foo'| A=1.0) # column A
Pr(C='bar'| A=2.2) # column A
Pr(C='foo'| B=1.0) # column B
Pr(C='bar'| B=1.2) # column B
解决这个问题的正确方法是什么?将 A 和 B 中的值分组到括号中或计算 A 和 B 中的每个随机变量是否有效?谢谢!
相关分类