以色列的支持者这几天密集的宣称宣称:联合国悄无声息的修改了加沙死亡人数。在联合国官网上5月6日公布的数据中:大于9500名妇女死亡,大于14500名儿童死亡。 5月6日的报道 而在5月8日的报道中,这一数字明显的下降,分别只有4969名妇女和7797名儿童死亡,下降比例高达50% 5月8日的报道 于是乎以色列的支持者们开始将这一变化当成证据来指责联合国操纵加沙死亡数据。当然加沙的支持者们要么是真傻要么是真坏要么两者兼备。事实上联合国并未做任何死亡数据的修改,而只是增加一个分类——确定身份。 所谓确定身份是指的在死亡记录上有明确的身份ID和死亡时间信息。这一部分在4月30日(确认身份滞后)只有24,686人。后面的4969名妇女和7797名儿童死亡也只是可以确认身份的死亡名单,还有一半的数据是无法确认死亡者的身份——往往是因为这些尸体被发现后已经面目全非并且没有可以辨认或亲属认领,这在战争环境是非常常见的时期。 这是一个非常清晰的图表,但是犹太人包括以色列外交部都在宣称联合国篡改数据,这大概是本着能骗一个是一个的态度吧。 以色列外交部称联合国修改死亡数据 事实上,联合国统计的变化是源自加沙卫生部门,其在5月4日称有21,720名受害者有完整的数据,而11,371名受害者的数据不完整(在包括身份ID ,年龄,死亡日期等字段至少有一个字段是缺失的)。 加沙卫生部门5月4日的公告 犹太人一直努力诋毁加沙死亡数据我在《人间地狱,加沙死亡破30000,哈马斯公布的平民死亡数据可靠吗?》曾引用《柳叶刀》的研究来表明加沙卫生部门的死亡数据是高质量的。但犹太复国者一直在努力诋毁这些数据,其中最具欺骗性的是宾夕法尼亚大学沃顿商学院统计与数据科学教授亚伯拉罕·怀纳(Abraham Wyner)在2024年3月6日发表的一篇题为《加沙卫生部如何伪造伤亡数字》的帖子,其对加沙卫生部报告的伤亡人数的统计分析“高度暗示,报告这些数字的过程与现实无关或松散”。 在他的文章中有这么一个图表: “加沙卫生部如何伪造伤亡数字”中的图表 图表中数据间的系数为 R2 = 0.999,怀纳将其描述为揭示了“在此期间伤亡人数极其有规律的增加”,并从中得出结论,“这种规律性几乎可以肯定不是真实的”。这是明显欺负以色列支持者缺乏数学常识。因为他这个图标是每日累积死亡数据。由于累计数比增长量大的多,所以累计数是永远的呈现线性回归。 上一图表数据集改用每条死亡数据呈现 如果改用每天死亡的数字,R2 迅速就变为0.233,变得不怎么有规律,况且亚伯拉罕·怀纳只用了15天的数字集,如何把他放在全集里对比更为明显 上面的图是累积死亡数字,下面图是每日死亡数字,红线内是怀纳引用的数据 此上图可以看出,即便每天死亡数字的方差再大,对累积数的R2值几乎都是没有影响,这应该是统计学大一的知识,很难想象统计与数据科学教授会犯这样低级错误。 《加沙卫生部如何伪造伤亡数字》文中其他结论也是有着同样的问题,比如他关于“在男性被杀的日子里报告了更多的女性伤亡”,如果放在全数据集里去观察,结论几乎相反 红点是怀纳引用数据集,蓝色是全集 再比如他文中称妇女和儿童的死亡毫不相关,R2为0.00787,实际上全集数据R2为0.3244,呈现弱关联。 红色是怀纳的数据集,蓝色是全集。 还有怀纳忽略了加沙的人口统计数据,错误地认为不分青红皂白的轰炸不会导致70%的伤亡是妇女和儿童。 简单的数学与此相矛盾:如果儿童占50%,成年人平均分配,妇女和儿童将占人口的75%左右。这个甚至不需要大一的统计学水准,小学高年级即可胜任。 亚伯拉罕·怀纳的那篇文章是充分体现了“流氓不可怕,就怕流氓有文化” 但好在不单单流氓才有文化