投稿:兔子
(兔子:我最开始拿到这个题,思考之后发现是无解的。为了有一个实际操作解,已经修改了原题)
相信大家都看过一张gif:“一个黑色的裸女轮廓在旋转”,一些人能看出来是在顺时针旋转,另一些人看的结果是逆时针旋转。如果没看过可以google一下“Sihouette Illusion”。文章后面一般跟着分析:看出顺时针旋转左脑发达,看出逆时针旋转右脑发达,等等。
假设,有这么一组图片,以这个黑色裸女为例。一部分人声称他左脑发达,看出来顺时针旋转。另一部分人宣称他右脑发达,看到的是逆时针旋转。但问题是中间还藏了一类人,他们并没有左脑发达或者右脑发达,他们只是随口胡说。我现在根据他们对旋转裸女的“顺时针还是逆时针”的 回答,分成了左脑人和右脑人两类。
如果我没有脑波仪检测之类的仪器,只能以他们的说话为准,那么我分类出来“左脑人/右脑人”实际上是不准确的:其中一些人是真的能看出来,还有一些人只是骗子。所以我想检测出来这些骗子。
但是我不能以我主观为标准。我看这个裸女是顺时针旋转,这个人说是逆时针,所以他说谎。这个不合理。要以图片为准。他说他能看出来顺时针旋转,结果新给一个图片,其他所有左脑人都能看出来,但是这次他没看出来,所以他撒谎了。这个才合理。
但问题仍然没有解决:说不定这个图片本身就有问题呢?不管左脑还是右脑,都看她是顺时针旋转的。必须使用无偏差图片。即,这张图片,真・左脑人一致认为是顺时针,真・右脑人一致认为是逆时针。这样这张图片才被认为是中立的,可以拿来检测左脑人和右脑人。
但问题是:现在左脑人和右脑人的队伍中都有一些骗子,分不清谁是真・左脑人/右脑人。
似乎本题陷入了循环论证:要使用中立的图片来鉴别左脑人/右脑人。而中立的图片需要左脑人和右脑人的共同认证才能拿来用。
唯一可以确认的是:左脑人/右脑人确实有一套思维模式,使得他们对于中立的图片输入,呈现两极的输出;对于非中立的图片,给出一致输出。而骗子对于中立图片以0.5的概率随机输出(而且他会记得自己说的话,你无法用“过一阵再拿出同样的图片,他忘了说错话了”来区分骗子),对于非中立图片给出一致输出。
你现在有一堆不知是否中立的图片,一群人,可否设计一套方法,划分出人群中的左脑人/右脑人/骗子?
兔子:此题无解。因为骗子是按概率输出的,只要骗子数量足够多,那么在有限次测试内,总有骗子给出的答案和真・左脑人一模一样,虽然概率很小但是不为0。修改提问如下:
是否可以设计一种方法,划分3类人群。使得对于左脑人群,原假设“此群中所有人都是左脑人”成立概率超过95%。即对立假设:“此左脑人群中包含骗子”的概率<5%
TL,NR 版本:
现在有一组数据集,里面的数据分为2类:M类和N类。
还有一堆程序集,虽然由各式各样的语言写成,但是总体来说分为ABC,3种算法。
当M类数据输入A类算法时输出0,B类算法输出1,C类算法以0.5概率输出0或1.
当N类数据输入ABC类算法时,会得到一致的输出0或1.
M类数据与N数据的区别就是:M类输入AB算法分别得到不同的0,1;N类数据会得到一致的0或1.
请设计一个方法,将程序集分为ABC3类,使A,B两类“本类不包含C类成员”的原假设成立概率>95%