本人用的hive,可以理解为关系型数据库,现在的需求是,有一塔数据,数据中都有手机号,我需要看看这一沓数据中有哪些是数据里已经有了的。
目前我的做法是,先取一条,然后按照手机号遍历整张表,然后下一条,遍历,下一条,遍历。。。。。。
我觉得此法即使加了索引效率也很低,求一个效率高的sql,或者思路
慕码人2483693
相关分类