未解决的统计学问题
未解决的统计学问题,根据约翰·图基(John Tukey)的说法,[1]识别问题的困难远远比解决问题的困难更能拖延统计数据。戴维·科克斯(David Cox)给出了一份“一两个悬而未决统计学的问题”(实际上是22个)的清单。[2]
推理和检验
- 如何检测和纠正测量误差,特别是在系统误差中(图基称这种情况为不舒服的科学)。
- Graybill-Deal估计器经常被用来估计具有未知和可能存在不平等方差的两个正常种群的共同平均值。尽管这个估计器通常是无偏差的,但它的可接受的决策规则仍有待证明。[3]
- 元分析。虽然独立的P值可以用费雪方法结合起来,但仍在开发技术来处理谐波平均p值的情况。
- Behrens-Fisher问题。尤里·林尼克在1966年表明,当方差未知且可能不相等时,没有一致性最强的测试来检验两个平均值的差异。也就是说,没有一个精确检验(意思是说,如果均值实际上是相等的,就没有一个能以概率正好是α拒绝零假设的检验),同时对所有的变异值(因此是多余参数)都是最有力的。虽然有许多近似的解决方案(如韦尔奇的t检验),但这个问题仍然吸引着人们的注意[4] 作为统计学的经典问题之一。
- 多重比较谬误。有各种方法来调整P值,以补偿假设的同时或顺序分析。 特别值得关注的是如何同时控制总体错误率,保持统计能力,并将测试之间的依赖性纳入调整。当同时测试的数量非常大时,这些问题尤其重要,在分析DNA微阵列的数据时,这种情况越来越多。
- 贝叶斯统计。有人提出了一份贝叶斯统计学的开放性问题清单。[5]
实验设计
- 由于拉丁方阵的理论是实验设计的基石,解决拉丁方阵的问题可以立即适用于实验设计。
更具哲学性质的问题
注释
- ^ Tukey, John W. Unsolved Problems of Experimental Statistics. Journal of the American Statistical Association. 1954, 49 (268): 706–731. JSTOR 2281535. doi:10.2307/2281535.
- ^ Cox, D. R. Present Position and Potential Developments: Some Personal Views: Design of Experiments and Regression. Journal of the Royal Statistical Society. Series A (General). 1984, 147 (2): 306–315. JSTOR 2981685. doi:10.2307/2981685.
- ^ Pal, Nabendu; Lim, Wooi K. A note on second-order admissibility of the Graybill-Deal estimator of a common mean of several normal populations. Journal of Statistical Planning and Inference. 1997, 63: 71–78. doi:10.1016/S0378-3758(96)00202-9.
- ^ Fraser, D.A.S.; Rousseau, J. Studentization and deriving accurate p-values (PDF). Biometrika. 2008, 95: 1–16. doi:10.1093/biomet/asm093.
- ^ Jordan, M. I. What are the open problems in Bayesian statistics? (PDF). The ISBA Bulletin. 2011, 18 (1): 1–5.
- ^ Zabell, S. L. Predicting the unpredictable. Synthese. 1992, 90 (2): 205. S2CID 9416747. doi:10.1007/bf00485351.
参考文献
- Linnik, Jurii. Statistical Problems with Nuisance Parameters. American Mathematical Society. 1968. ISBN 0-8218-1570-9.
- Sawilowsky, Shlomo S. Fermat, Schubert, Einstein, and Behrens–Fisher: The Probable Difference Between Two Means When σ1 ≠ σ2. Journal of Modern Applied Statistical Methods. 2002, 1 (2). doi:10.22237/jmasm/1036109940 .