Estatística
Na Galipedia, a wikipedia en galego.
A Estatística é a ponla das Matemáticas que describe os fenómenos onde non hai un componente absoluto, é decir, trata coa aleatoriedade dos resultados da experiencia cotián e os seus modelos son maiormente estocásticos. A estatística axuda a tódalas demáis ciencias a xerar modelos matemáticos "xerais" onde se teña considerado un compoñente aleatorio.
A estatística como ciencia "utiliza conxuntos de datos numéricos para obter inferencias baseadas no cálculo de probabilidades".
A Estatística ten como base a Análise de Datos ou Estatística Descritiva e o Cálculo de Probabilidades. Ambas surxen de xeito separado para uniren por unha parte os métodos e por outra os modelos de xeito que conforman a Estatística tal e como a coñecemos na actualidade.
Unha das ramas máis interesantes da estatística é a inferencia estatística, que permite inferir ou prever tendencias ou "describir" resultados dun fenómeno ou experimento estudado a partires dun modelo xeral de dito fenómeno. Porén, tamén se usa para o traballo e a simplificación de grandes cantidades de datos: o uso de grandes poboacións ou corpus de datos poden obrigar a un uso de resultados que dean unha visión xeral do conxunto e axuden a tomar decisións con rapidez. Por exemplo, mentres os diferentes puntos medidos nunha topografía teñen unha certa individualidade que non se pode reducir, a xenética de poboacións, a dialectoloxía ou a lingüística de corpus aplicada a Galicia fai necesario o uso de simplificadores estatísticos coma a media, a mediana, a desviación típica, a regresión, etc.
As súas subdivisións dependen da disciplina á cal se enfoque posto que, coma especialidade matemática que é, resulta ser unha ciencia auxiliar en cuanto ás suas aplicacións.
A estatística clásica opera do modo seguiente:
- Plantéxase un problema en estudio.
- Realízase unha mostraxe consistente na recolección de datos referentes ó fenómeno ou variable que desexamos estudiar.
- Proponse un modelo de probabilidade, e estímanse os parámetros mediante estatísticos a partir dos datos de mostreo.
- Valídase o modelo comparándoo co que sucede na realidade. Utilízanse métodos estatísticos coñecidos como test de hipótesis e proba de significación
- Utilízase o modelo validado para tomar decisións ou predecir acontecementos futuros.
Índice |
[editar] Historia
O coñecimento da historia dunha disciplina é importante, polo menos en tres aspectos:
- comprendermos o seu estado actual de desenvolvemento e a relación entre as suas partes
- comprendermos a sua terminoloxia, xa que o nome de unha técnica ou un método está sempre asociado ás suas orixes históricas
- prever o seu desenvolvemento futuro.
A Estatística Actual é o resultado da confluencia de duas disciplinas: Cáculo de Probabilidades e Estatística. Entendida esta última como a Aritmética do Estado foi de quen proporcionou o nome, derivado do étimo latino status, á Estatística actual.
- Calculo de probabilidades. A abondosa presenza do oso astrágalo de ovella e cervo nas exacavacions arqueoloxicas máis antiguas parece confirmar que os xogos de azar teñen unha antigüidade de máis de 40.000 anos, e a utilización do astrágalo en culturas máis recentes, Grecia, Exipto e Roma ten sido amplamente documentada. Nas pirámides temos achado pinturas que mostran xogos de azar, xa na primeira dinastia (3.500 A.C.) e Herodoto refire-se á popularidade e difusión na sua época dos xogos de azar, estes usaron-se por diversas culturas tamén en cerimonias relixiosas.
En civilizacións antigas, o azar explicábase mediante a vontade divina. Os oráculos, sacerdotes e pitonisas na Grecia e Roma usaban a configuración resultante de botar catro dados para predicir o futuro e revelar a vontade favorábel ou desfavorábel dos deusas. Prácticas semellantes aparecen en culturas distantes como a xudía, tibetana ou india. Esta actitude máxica a respecto do azar maniféstase igualmente en (Piaget)
O Renacemento supón un novo enfoque global de considerarmos o mundo. Neste sentido, hai unha reconsideración dos experimentos aleatorios, e os matemáticos italianos de comezos de século XVI, empezan a interpretar os resultados de experimentos aleatorios simples. Cabe destacar, entre outros, Cardano, Galileo e Tartaglia.
O desenvolvemento da análise matemática dos xogos de azar prodúcese de vagar durante os séculos XVI e XVII con Pascal e Fermat e o Chevalier de Meré estudando dar resposta a aparición dos resultados en distintos xogos de azar, daquela moi populares. O cálculo de probabilidades consolídase como disciplina independente no período que vai desde a segunda metade do século XVII até comezos do XVIII.
Durante o século XVIII o cálculo de probabilidades se espalla por problemas físicos e actuariais (en seguros marítimos). Neste período cabe destacar a aplicación a problemas físicos e astronómicos que aparecen ligados ao contraste empírico da Teoría de Newton. Newton estableceu unha teoría común para explicar fenómenos que tiñan sido obxecto de estudos fragmentarios e incompletos. Tamén durante este século e parte do XIX as investigacións físicas e astronómicas dan pulo ao desenvolvemento dos primeiros métodos estatísticos. O primerio problema foi o Tratamento de Erros de medida, desenvólvese un método para estimar unha cantidade descoñecida a partir dun conxunto de medidas do seu valor que presentan un erro experimental (Bernouilli), tamén se desenvolve un teste para determinar se pode aceptarse a hipótese de aleatoriedade no ordenamento das órbitas dos planetas. Por outra banda Pierre Simón máis coñecido como Marqués de Laplace, introduce a primeira definición explícita de probabilidade. E elabóranse modelos para predicir valores dunha variable a partir doutras posibelmente relacionadas con elas, a regresión.
A segunda contribución fundamental a este período é debida a Gauss quen resolve de modo xeral o problema de estimación de modelos estatísticos con aplicación en Astronomía.
Durante a primeria metade do século XIX os matemáticos-astrónomos continúan a ampliar a Teoría de erros. Caben destacar entre outros investigadores: Bravais, Pierce e Newcomb. Máis os avanzos en Teoría de Erros teñen pouca influencia en outros campos fora da Física ou Astronomía, en particular tenñen pouca influencia nunha disciplina cuxo campo de estudo é a Análise Cuantitativa de datos demográficos, sociais e económicos e que se coñecía desde o século XVII co nome de Estatístia.
[editar] A estatística até o século XIX.
Desde a antigüidade, os Estdos teñen recollido información sobre a poboación e riquza que existía nos seus dominios. Os censos romanos, os Inventarios de Carlomagno, etc., poden considerarse precedentes da institucionalización da recollida de datos demográficos e econóimcos polos Estados Modernos, principalmente por razóns fiscais. Esta aritmética política ou Estatística Descritiva evolúe durante os séculos XVII e XVIII tomando progresivamente un carácter más cuantitativo.
O primeiro intento de aplicar un razonamento propriamente estatístico, no sentido actual do termo, a datos demográficos é debido a Graunt (1662). Graunt intenta estimar a poboación inglesa da súa época, e foi quen de, a partir dunha mostra, estimar por primeira vez taxas de mortalidade por idades e deducir a frecuencia de nacimentos de homes e mulleres, entre outras análises delmográficas relevantes.
As primeiras táboas completas de mortalidade foron publicadas por Edmund Halley en 1693, que estudou o problema dos seguros de vida. Durante o século XVIII hai un rápido crecimento dos seguros (sobre todo marítimos) na Inglaterra, e aplícanse as técnicas demográficas de Graunt e Petty para facer os primeiros censos oficiais. O primeiro censo que se coñece foi debido ao Virrey D. Pedro de la Fasca, en Perú. Na Europa o primeiro censo faise en Irlanda en 1703 e en España, o primeiro faise en 1787 ao abeiro do Conde de Floridablanca.
A comezos do século XIX pode afirmar-se que a cuase totalidade dos estados europeus recollen informaicón oficial meidante censos de datos demográficos, económicos, climáticos, etc. Paralelamente surxen as Axencias Oficiais de Estatística. En 1834 creouse a Royal Statistical Society en Londres e máis tarde a American Statistical Association. En España a Lei da Función Estatística Pública regula o ordenamento Estatístico Oficial na Administración do Estado. Na Galiza é o IGE, Instituto Galego de Estatística quen se encaga de elaborar os produtos estatísticos para fins da Comunidade Autónoma Galega. Xa nas Comunicades Europeas, de máis recente creación, o Eurostat se encarga da estatística para fins comunitarios
Durante o século XVIII e a maior parte do XIX , a Estatística evolúe como ciéncia separada do Cálculo de Probabilidades e a Teoría de Erros ainda que aparecen os primeiros autores A. De Moivre e Deparcieux que aplican o cálculo de probabilidades a datos demográficos e Condorcet e Laplace a problemas de aritmética política. Unha contribucion importante cara a dita síntese é debida a A. Quetelet (1846),que sostén a importáncia do cálculo de probabilidades para o estudo de datos humanos. Quetelet demonstrou que a estatura dos reclutas dun reemprazo seguía unha distribución normal, e introduce o conceito de “home medio”. Non obstante había aínda obstáculos de índole lingüística e de conceptos por eliminar. A unión entre ambas as correntes ven a producirse a comezos do século XIX, favorecida en gran parte, polos novos problemas teóricos e metodolóxicos que formulaba a contrastación empírica da Teoría de Darwin.
[editar] O nacimento da Estatistica actual
Do mesmo xeito que Newton é importante Estatística en cuanto aos seus estudos na Física e Astronomía, Darwin en Bioloxía introduce novidades como: a variabilidade, a selección mediante a loita pola existencia, o conceito de poboación composta por unidades elementares. Para resolver estes problemas Francis Galton (1822-1911), curman de Darwin, utiliza os métodos estatísticos aplicados polos demógrafos os modelos probabilísticos existentes para explicar aspectos de evolución das especies. Galton tamén introduce o conceito de regresión comparando estaturas de pais e fillos.
A contribución de Galton influe grandemente en Weldon, Pearson, Fisher ou Edgeworth, investigadores todos na área de influencia da Bioloxía. Precisamente o primeiro departamento de Estatística no sentido actual é fundado por Galton quen tamén apoia a aparición da revista Biométrica.
Para Weldon a resolución dos problemas de evolución anmal é esencialmente estatístico. Xa que logo "debemos coñecer, entre outros: a) A percentaxe de animais que mostran un certo grau de anormalidade a respeito de un carácter. b) O grau de anormalidade de outros organos que acompaña ás anormalidades de un órgano dado. c) A diferenza entre a taxa de mortalidade en animais con diferentes graus de anormlaidade a respeito de un órgano. d) A anormalidade dos desdendentes en termos de anormalidade dos pais e viceversa"
Isto nos indica o enfoque metodolóxico que desde entón se adopta na investigación biolóxica utilizando o método estatístico. Por isto moitos dos métodos estatísticos actuais foron desenvolvidos a partir de problemas biolóxicos por biólogos. As técnicas foron posteriormente normalizadas e depuradas polos matemáticos para dar lugar ao que corresponde o corpo actual da ciencia Estatística
[editar] A expansion da Estatística no século XX
Os métodos estatísticos comezan a popularizar-se a partir de este século, con etapas de maior ou menor avanzo. Aparecen o Control da Cualidade na Enxeñaría, o Deseño de Experimentos en Agronomía, os Métodos Factoriais en Psicoloxía, os Métodos Multivariantes nas Ciencias Sociais, etc. De xeito que hoxe en día a estatística regula a nosa vida: IPC, Fondos Europeus, etc. Pero, en xeral, os métodos que aparecen para dar solución a problemas de unha disciplina concreta permiten ser utilizados en outros campos diferentes. Aparecen así, disciplinas de Estatística Aplicada con nomes mistos entre a disciplina de aplicación e a estatística, como; Econometría, Dasometría, Sociometría, Bioestadística, etc.
Durante a II Guerra Mundial, e aplicados a problemas militares, aparecen os problemas de Optimización e Xestión de recursos que dan lugar ás técnicas de Investigación Operacional. E máis recentemente coa irrupción dos ordenadores persoais a Estatística está a viver un grau de desenvolvmemento e aplicación extraordinaria, coa aparición de grandes Bases de Datos e potentes programas informáticos de Software Estatístico que permiten o seu tratamento e explotación.
[editar] Disciplinas
En función do área na cal se enfoque, pódese considerar:
- Estatística política
- Estatística indus
- Estatística social
- Estatística económica
- Bioestatística
- Física estatística
- Estatística cuántica
- Estatística multivariante
[editar] Persoas importantes na estatística
- Peter Armitage
- M. S. Bartlett
- Thomas Bayes
- Allan Birnbaum
- David Blackwell
- Chester Bliss
- Ladislaus Bortkiewicz
- Pafnuty Chebyshev
- Alexey Chervonenkis
- Richard Threlkeld Cox
- Gertrude Cox
- Harald Cramér (Sweden, 1893 - 1985)
- Sam Creery
- Philip Dawid
- Mike Dugas
- David B Duncan
- Bruno de Finetti
- W. Edwards Deming
- Persi Diaconis
- (Sir) Richard Doll
- Francis Ysidro Edgeworth
- A. K. Erlang
- Sir Ronald Fisher
- John Fox
- Carl Gauss
- Sir Francis Galton
- Seymour Geisser
- Corrado Gini
- I. J. Good
- William Sealey Gosset (coñecido como "Student")
- Major Greenwood
- Emil Julius Gumbel
- Pierre Gy
- Austin Bradford Hill
- Harold Hotelling
- Edwin Thompson Jaynes
- Harold Jeffreys
- David Kendall
- (Sir) Maurice Kendall
- Andrey Nikolaevich Kolmogorov
- Dennis V. Lindley
- Alfred J. Lotka
- Aleksandr Lyapunov
- Prasanta Chandra Mahalanobis
- Claus Moser
- Florence Nightingale
- Blaise Pascal
- Egon Pearson
- Karl Pearson
- Adolphe Quetelet
- C.R. Rao
- Herbert Robbins
- Leonard Jimmie Savage
- Walter A. Shewhart
- Jeff Sagarin
- Henry Scheffé
- George W. Snedecor
- Charles Spearman
- Genichi Taguchi
- Pafnuty Tchebycheff, ver Pafnuty Chebyshev
- Thorvald Thiele
- John Tukey
- Vladimir Vapnik (Russia, ~1935 - )
- Abraham Wald
- Chris Wallace (1933-2004)
- Samuel Stanley Wilks
- Herman Wold
- Frank Yates
- G. Udny Yule
[editar] Enlaces externos
[editar] Organizacións internacionais
- Statlib: Data, Software and News from the Statistics Community (Carnegie Mellon)
- International Statistical Institute
- The Probability Web
[editar] Software estatístico
- R Project for Statistical Computing (free software)
- Statistics Online Computational Resource (UCLA)
- Root Analysis Framework (CERN)
- Multidimensional Scaling Software
- Software for interactive graphical analyses
- Website Analytics and Monitoring
- EPIDAT 3.1(Dirección Xeral de Saúde Pública de Galicia)
[editar] Véxase tamén
- Probabilidade
- Axiomas de probabilidade
- Distribución de probabilidade
- Función de probabilidade
- Función característica
- Inferencia bayesiana