¿Cuál es la historia de la distribución t?

Según el artículo Distribución t de Student – Wikipedia:

En estadística, la distribución t fue derivada por primera vez como una distribución posterior en 1876 por Helmert y Lüroth. La distribución t también apareció en una forma más general como distribución de Pearson Tipo IV en el artículo de Karl Pearson de 1895.

En la literatura en inglés, la distribución toma su nombre del artículo de 1908 de William Sealy Gosset en Biometrika bajo el seudónimo ” Estudiante “.

Gosset trabajó en la fábrica de cerveza Guinness en Dublín, Irlanda, y estaba interesado en los problemas de las muestras pequeñas, por ejemplo, las propiedades químicas de la cebada, donde los tamaños de las muestras podrían ser tan pocos como 3. Una versión del origen del seudónimo es que Gosset el empleador prefería que el personal usara seudónimos al publicar artículos científicos en lugar de su nombre real, por lo que usó el nombre ” Estudiante ” para ocultar su identidad. Otra versión es que Guinness no quería que sus competidores supieran que estaban usando la prueba t para determinar la calidad de la materia prima.

El artículo de Gosset se refiere a la distribución como la “distribución de frecuencia de las desviaciones estándar de las muestras extraídas de una población normal”. Se hizo conocido a través del trabajo de Ronald Fisher, quien llamó a la distribución “Distribución del estudiante ” y representó el valor de la prueba con la letra t .

Algunos detalles más sobre William Sealy Gosset y su descubrimiento de la distribución t:

Como empleado de Guinness, un negocio agroquímico progresivo, Gosset aplicó su conocimiento estadístico, tanto en la cervecería como en la granja, a la selección de las variedades de cebada de mejor rendimiento. Gosset adquirió ese conocimiento por estudio, ensayo y error, y al pasar dos períodos en 1906-1907 en el laboratorio biométrico de Karl Pearson. Gosset y Pearson tenían una buena relación. Pearson ayudó a Gosset con las matemáticas de sus documentos, incluidos los de 1908, pero tuvo poca apreciación de su importancia. Los documentos abordaron la preocupación del cervecero con pequeñas muestras; los biometristas como Pearson, por otro lado, típicamente tenían cientos de observaciones y no veían urgencia en desarrollar métodos de muestras pequeñas.

Otro investigador de Guinness había publicado previamente un artículo que contenía secretos comerciales de la cervecería Guinness. Para evitar una mayor divulgación de información confidencial, Guinness prohibió a sus empleados publicar documentos independientemente de la información contenida. Sin embargo, después de suplicar a la cervecería y explicar que sus conclusiones matemáticas y filosóficas no eran de utilidad práctica para los cerveceros de la competencia, se le permitió publicarlas, pero bajo un seudónimo (“Estudiante”), para evitar dificultades con el resto del personal. Por lo tanto, su logro más notable ahora se llama distribución t de Student, en lugar de Gosset.

Gosset tenía casi todos sus artículos, incluido El probable error de una media publicada en el diario de Pearson Biometrika bajo el seudónimo de Estudiante .

Adicionalmente :

Inventó la prueba t para manejar pequeñas muestras para el control de calidad en la elaboración de cerveza. Gosset descubrió la forma de la distribución t mediante una combinación de trabajo matemático y empírico con números aleatorios, una aplicación temprana del método de Monte-Carlo.

Fuente: biografía de Gosset