具体问题是这样的:某个网站,uid和注册时间是正相关且单调,比如uid[1001-1100]是2016年6月6日注册的,uid[1101-1200]是2016年6月7日注册的。示例如果已知uid1000对应2016.6.5,uid1001和1100对应2016.6.6,uid1101对应2016.6.7,那么可以判定uid1001到1100都对应2016.6.6想要获取某个uid的注册时间,只能爬取一次https://domain.com/user/:uid我现在想获取每个uid对应的注册时间,那么要怎样设计uid生成策略,才能使得爬取的次数尽量少呢?假设总共经过了1000天,每天平均有100个新用户注册(具体数量完全随机),爬取次数大概能减少到哪个数量级?
扬帆大鱼
相关分类