分类
准证

PR申请大数据分析

数据分析基于380个样本,样本时间跨度从2010年到2017年。
【结论更新】
概率这个东西,本来就是多个样本的统计,体现一般规律,但很难从单个个体来决断总体的分布情况。所以有人说没什么意义的,你们自己高兴就好。
这两张图,给的就是申请者一个宏观心理预期,就像买彩票样的。

被拒的,大概率都会拒得比较早,大多在4个月的时候被拒。所以那些4个月还没有被拒的,你成功的机会要多一点点。
被批准的,大概率会比较晚一点,大多数在5个月的时候被批准。
再看被批准概率/被拒概率 (S/F ratio),申请8个月这个比例达到最大。虽然ICA说一般6个月会有结果,如果你的申请拖了6个月还没消息的,不要着急,成功可能离你更近了。

数据是从统计表里得到的,由于原始统计表做得比较粗糙,对申请者的申请条件没有仔细分类。对原始数据里的申请条件文本重新分类是一项很繁琐费时的事情,所以目前只有申请时间这一条信息是最有价值的了。各位仁者见仁,智者见智,请尊重别人的劳动成果,别乱喷。


一年要批2w个pr,7年就是14w个,你只有380个数据,连采样都不足,还敢说是大数据,搞笑了。


不要乱喷,请尊重一下别人的劳动成果好吧?一年批准2万个,又不是所有人都会把结果提交到统计表中。380个数据已经是所有的了,至少在统计上还是有些指导意义的。


有一定的参考意义,但是不大。
样本太少,样本的条件不详。


拖的时间越长,被批准的概率越低,申请失败的概率也越低。

没读懂这句话。。。。。。。


等待解读


没有什么意义啊,只是用申请时间,根本不能说明什么,还不如说只有50%几率,批准或被拒。


我勒个去。。。

就一个条件????只看申请时间????

兄弟你这个真不是大数据分析。。。


充其量只能算是一条变量的批准率


1.本来数据量和面就小。
2.只参照时间函数就更难借鉴。
3.再加上pr的每年的条件变化,
所以参考价值很低。
其实很简单,头三个月或五个月,不够初始条件的肯定拒了,条件没问题的一定批了。剩下纠结的时间长过五个月的,必然有批有拒,50% 上下


原始数据中只有这条是最可靠的,结论已更新。


结论已更新。


NONONONO, 超过五个月的,被拒的概率比被批准的概率要低。并不是一半一半。


这是刻舟求剑啊。
2010年到2017年,政策变化了N次。
2010年到2012年左右,基本上居住3年工资满4000,就肯定能批了。而且当时的等待时间普遍是4个月左右。偶尔有超过半年的。
之后越来越难,现在月薪7000,居住5年以上都很难批。现在外国人条件压线的等批准都要10个月,甚至更久。
你就看MOM就知道了,2010年,EP线只有2600,而且只要是有EP就可以带直系亲属,现在带家属的线是6000,涨了一倍还多。说明新加坡政府对外国人要求是越来越高了,所以你这个统计完全没有意义。因为各个时期标准都不一致。


我讲的是总体分布,你使劲强调个体差异。统计的意义就是包含了个体差异体现出的总体特征。照你的逻辑,即使统计2017年这一年的数据也是没有意义的了,因为年头和年尾可能概率也不一样。

你硬要讲阶段政策不一样性也是可以,如果子阶段数据量多,同样可以分阶段进行统计,但那是子阶段的总体特征。


纯从分析的角度回复一下

这个S/F,我的感觉只是把第一张图里两个数除一下,到底有什么意义很难讲,或者说,这个metric没有很大实际应用上的价值。

与其显示当前月S/F,不如计算>N个月的S/(S+F),这个数表示,如果N个月了还没有消息,那么批准的可能性是多少。


你要算大于N个月的胜算,简单算t = N 这条直线与曲线之间所围成的面积即可。

S/F 当然有意义,相比一个胜算和败算五五开的事情和一个胜算败算七三开的事情,你更愿意做哪个呢?


这种数据本来就不适合整体统计。
整体统计是保证一个标准的前提下,但这些数据标准根本就不统一。
比如,统计人能举起多少公斤的东西。
找了一个小孩,从他出生开始统计,2岁能举1千克,20岁能举30千克,60岁能举15千克,80岁能举5千克。
最后按你的计算方式,结论是人能举12.6千克的东西。这个数据完全没意义。
因为在2岁阶段和80岁阶段,他百分之100不可能举到12.6千克的东西。所以这么统计对于个体来说完全没有意义。
正确做法应该是找n个两岁小孩统计一下在2岁这个条件下,人能举多少东西。N个20岁的人能举多少东西,以此类推。
这样数据才有意义,才可以对比目标的条件,推算出目标应该能举多少东西。

换到PR申请条件这里,2岁相当于2010年(相对松),20岁相当于2017年(相对严)。
2010年的时候,等4个月的基本都批了。
而2017年,等10个月也只是个正常等待时间。
你却把各种变化的条件统一起来算。就算算出来平均等待时间是6个月,那对这对2017年的申请也没有意义啊,因为你可以看一下2017年,几乎没有人是6个月之内批的(除了家属)。而2010年,几乎就没有人等半年以上的(无论批还是拒)。

而且照我的逻辑,如果2017年按照同一个标准审批,那就是有意义的。我并没有说单纯统计2017年没意义吧。


看了有点乱,请问下 x轴 y轴分别代表什么


y 是时间,0-14个月
x 是百分比,(未论证,不确定)


顶一个,大兄弟。
我之前想通过ML,feature engineering,把数据feed进去,训练一个模型。
可惜数据量真是不够


统计学上是不是有一个公式可以用在数据量太少的情况?


以前曾3次申请都被拒 而且都是等了快10个月 不一定的


只有一个变量,对审批的官员是一种耻辱,他们要做的就是把申请材料放在那里,等时间到了,就批或者拒


:)EP PR群里最不缺少一些键盘侠 但凡有人出了一些干货 总要喷的 楼主 习惯了就好 以后不用做这么多了


:)lz我支持你 第4个月的时候是最危险的时候 身边朋友秒拒都是第4个月 5-6个月是批准最多的时候 如果过了半年多没消息 不在第一批批准之内 就是条件在考虑当中 这类朋友上诉或者提高一点条件 下次批准机率非常大


分析的很透彻


发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注