class: center, middle, inverse, title-slide .title[ # Estatística e Informática ] .subtitle[ ## Aula 10 - Estimação e Intervalo de Confiança ] .author[ ### Alan Rodrigo Panosso
alan.panosso@unesp.br
] .institute[ ### Departamento de Ciências Exatas FCAV/UNESP ] .date[ ### (09-05-2024) ] --- class: middle, center, inverse # Estimação --- ### Parâmetro e Estatística **Parâmetro**: é uma medida usada para descrever uma característica da população. **Estatística** ou **Estimador**: é qualquer função de uma amostra aleatória (fórmula ou expressão), construída com o propósito de servir como instrumento para descrever alguma característica da amostra e para fazer *inferência* a respeito da característica na população. Resumo | Parâmetro | Estatística ---|:---:|:---: Média | `\(\mu\)` | `\(\bar{x}=\frac{1}{n} \sum \limits_{i=1}^n x_i\)` Variância | `\(\sigma^2\)`| `\(s^2 = \frac{1}{n-1} \sum \limits_{i=1}^n {(x_i - \mu)^2}\)` Proporção | `\(\pi\)` | `\(\hat{p}= \frac{X}{n}\)` O valor numérico da estatística ou estimador de um parâmetro, calculado para uma amostra observada, é chamado de **estimativa desse parâmetro**. A diferença entre estatística e estimativa é que a **estatística** é uma variável aleatória, e a estimativa é um particular valor dessa variável aleatória. --- ## Acurácia A acurácia mede quão próximo o valor estimado está do valor real, ou seja, é a habilidade do estimador de estimar o valor real. ## Precisão A Precisão mede quão próximas estimativas individuais estão umas das outras, ou seja é a habilidade do estimador de estimar valores similares de maneira consistente. -- <img src="https://raw.githubusercontent.com/arpanosso/estatinfo/master/slides/img/acuracia_precisao.png" width="100%" style="display: block; margin: auto;" /> --- ## Propriedades de um bom estimador **1) Consistência**: é uma propriedade por meio da qual a acurácia de uma estimativa aumenta quando o tamanho da amostra aumenta. Assim dado um parâmetro populacional `\(\theta\)` e sendo `\(\hat{\theta}\)` o estimador desse parâmetro. As condições suficientes para um estimador ser consistente são: `$$\lim_{n \to \infty}E(\hat{\theta}) = \theta$$` `$$\lim_{n \to \infty}Var(\hat{\theta}) = 0$$` ### Exemplo `$$E(\bar{X}) = \mu \text{ e } Var(\bar{X})= \frac{Var(X)}{n}$$` --- ## Propriedades de um bom estimador **2) Não viciado ou não viesado**: O estimador `\(\hat{\theta}\)` como uma variável aleatória, tem uma certa distribuição em repetidas amostras de tamanho `\(n\)`. Não viciado é uma propriedade que assegura que, em média, o estimador é correto: O **estimador** é chamado **não viciado** ou **imparcial** se seu valor esperado ou médio for igual ao verdadeiro valor do parâmetro, ou seja: `$$E(\hat{\theta}) = \theta$$` Entretanto, se `\(E(\hat{\theta}) = \theta + b(\theta)\)` com `\(b(\theta) \neq 0\)`, o estimador é **viciado** e a quantidade `\(b(\theta)\)` é chamada vício ou viés. --- ### Exemplos de Estimadores Estes estimadores nada mais são do que as próprias definições dos respectivos parâmetros, mas aplicadas à amostra: `\(E(\bar{X})=\mu\)` e `\(E(\hat{p}) = p\)` Por sua vez, para a variância o estimador populacional `\(\sigma^2 = \frac{1}{n} \sum \limits_{i=1}^n (x -\bar{x})^2\)` é viciado, pois, podemos demonstrar que: `\(E(\hat{\sigma}^2)=\frac{n-1}{n}\sigma^2 = \sigma^2 - \frac{1}{n}\sigma^2\)` onde o viés `\(b(\sigma^2) = -\frac{1}{n} \sigma^2\)`. Abaixo segue o estimador não viciado para variância: `\(s^2 = \frac{1}{n-1} \sum \limits_{i=1}^n (x -\bar{x})^2\)` No entanto, para `\(n \to \infty\)`, têm-se para ambos os estimadores convergem para `\(\sigma^2\)`, ou seja, `\(\hat{\sigma}^2\)` e `\(s^2\)` são assintoticamente não viciados. --- class: middle, inverse, center # Acesse o Link para estudarmos essas Propriedades ## https://arpanosso.shinyapps.io/estatinfo/ --- class: middle, center, inverse # Estimativa por Ponto e por Intervalo --- ### Estimativa por ponto É a estimativa de um parâmetro populacional dada por um único valor para a estatística, exemplo: `$$\hat{X} = \mu$$` esse procedimento não permite julgar qual a possível magnitude do erro que se está cometendo. **Exemplo**: O diâmetro a altura do peito de árvores de Eucalipto tem uma média de `\(105 \;cm\)`, --- ### Estimativa por intervalo É a estimativa de um parâmetro populacional baseada na distribuição amostral do estimador pontual, dada por dois valores `\(a\)` e `\(b\)` `\((a < b)\)`, entre os quais se considera que o parâmetro esteja contido. Essas estimativas indicam a sua precisão ou acurácia, por isto são preferíveis às estimativas por ponto. A declaração da precisão de uma estimativa por intervalo denomina-se grau de confiança ou **nível de confiança**, daí a denominação de **Intervalo de Confiança**. **Exemplo**: O diâmetro a altura do peito de árvores de Eucalipto tem uma média de `\(105 \pm 0,05\;cm\)`, --- class: middle, center, inverse # Estimativa por Intervalo de Confiança --- ### Estimativa por intervalo de confiança Um intervalo de confiança para `\(\theta\)` é um intervalo construído a partir das observações da amostra, de modo que ele inclui o verdadeiro e desconhecido valor de `\(\theta\)`, **com uma específica e alta probabilidade** denotada por `\(1 - \alpha\)`, é tipicamente tomada como: `$$NC = P(a \le \theta \le b) = 1-\alpha$$` Então, o intervalo `\(] a, b [\)` é chamado intervalo com `\(100 \cdot (1 - \alpha)\%\)` de confiança para o parâmetro `\(\theta\)`, onde: `\(1 ‑ \alpha\)` é o **nível de confiança** associado ao intervalo `\(a\)` e `\(b\)` são os **limites de confiança**, inferior e superior, respectivamente, do intervalo. Onde temos a seguinte relação: Nível de Confiança (NC) | Nível de significância `\((\alpha)\)` :---:|:---: `\(0,90\)` | `\(0,10\)` `\(0,95\)` | `\(0,05\)` `\(0,99\)` | `\(0,01\)` --- class: middle, center, inverse # Intervalo de Confiança para a Média Populacional `\((\mu)\)` --- ## Precisamos definir 4 casos: #### (a) Caso em que amostras são grandes `\((n \geq 30)\)` e `\(\sigma\)` conhecido; #### (b) Caso em que amostras são grandes `\((n \geq 30)\)` e `\(\sigma\)` desconhecido; #### (c) Caso em que as amostras são pequenas `\((n < 30)\)` `\(\sigma\)` conhecido; #### (d) Caso em que as amostras são pequenas `\((n < 30)\)` e `\(\sigma\)` desconhecido. --- ### (a) Caso em que amostras são grandes `\((n \geq 30)\)` e `\(\sigma\)` conhecido. O desenvolvimento de intervalos de confiança para `\(\mu\)` é baseado na distribuição amostral de `\(\bar{X}\)` se o tamanho da amostra `\((n)\)` é grande: `$$Z = \frac{\bar{X}- \mu}{\frac{\sigma}{\sqrt{n}}} \cong N(0,1)$$` <img src="https://raw.githubusercontent.com/arpanosso/estatinfo/master/slides/img/ic_01.png" width="30%" style="display: block; margin: auto;" /> onde: `\(a = \bar{X} - z_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}\)` e `\(b = \bar{x} + z_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}\)` $$ `\begin{cases} \frac{\sigma}{\sqrt{n}} = \sigma_{\bar{X}} = \text{erro padrão da média} \\ z_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} = \text{erro da estimativa da média} \end{cases}` $$ --- ### Exemplo Se `\(1 - \alpha = 0,95\)` nesse caso `\(\alpha = 0,05\)` <img src="https://raw.githubusercontent.com/arpanosso/estatinfo/master/slides/img/ic_02.png" width="100%" style="display: block; margin: auto;" /> --- [Tabela - Normal Padrão](https://github.com/arpanosso/estatinfo/raw/master/docs/TabelaNormalPadrao.pdf) <img src="https://raw.githubusercontent.com/arpanosso/estatinfo/master/slides/img/ic_03.png" width="75%" style="display: block; margin: auto;" /> --- Esta expressão, deve ser interpretada do seguinte modo: construídos todos os intervalos da forma `\(\bar{X} \pm 1,96 \sigma_{\bar{X}}\)`, `\(95\%\)` deles conterão `\(\mu\)`. Lembrando que `\(\mu\)` não é uma variável aleatória, mas um parâmetro, isto é, não é o mesmo que dizer que `\(\mu\)` tem `\(95\%\)` de probabilidade de estar entre os limites indicados. <img src="https://raw.githubusercontent.com/arpanosso/estatinfo/master/slides/img/ic_04.png" width="95%" style="display: block; margin: auto;" /> --- Então, denotamos o intervalo de confiança como: `$$IC(\mu;1-\alpha) = ]\bar{x}-z_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}};\bar{x}+z_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}[$$` ### Exemplo Considerando uma amostra de `\(100\)` animais da raça Nelore, onde o peso médio a desmama é `\(171,70 \;kg\)`, encontre um IC de `\(95\%\)` para `\(\mu\)`, supondo que o desvio padrão da população `\((\sigma)\)` seja igual a `\(7,79\;kg\)`. -- $$IC(\mu;95\%) = ]171,70 \pm 1,96 \frac{7,79}{\sqrt{100}} $$ `$$IC(\mu;95\%) = ]170,17\;kg; 173,23\;kg [$$` --- ### (b) Caso em que amostras são grandes `\((n \geq 30)\)` e `\(\sigma\)` desconhecido. Como `\(n\)` é grande, a substituição de `\(\sigma\)` pelo desvio padrão amostral `\((s)\)` não afeta apreciavelmente a estimativa de `\(IC\)`, assim, temos que: `$$IC(\mu;1-\alpha) = ]\bar{x}-z_{\frac{\alpha}{2}} \frac{s}{\sqrt{n}};\bar{x}+z_{\frac{\alpha}{2}} \frac{s}{\sqrt{n}}[$$` --- ### (c) Caso em que as amostras são pequenas `\((n < 30)\)` e `\(\sigma\)` conhecido. Se `\(X_1, X_2, \cdots, X_n\)` é uma amostra aleatória de uma população com distribuição normal `\(N (\mu, \sigma^2)\)`, a média amostral `\(\bar{X}\)` é exatamente distribuída como `\(N (\mu, \frac{\sigma^2}{n} )\)`. Sendo `\(\sigma\)` conhecido, o `\(IC (\mu : 1–\alpha)\)` é dado por: `$$IC(\mu;1-\alpha) = ]\bar{x}-z_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}};\bar{x}+z_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}[$$` --- ### (d) Caso em que as amostras são pequenas `\((n < 30)\)` e `\(\sigma\)` desconhecido. Fato que ocorre na maioria dos casos, uma aproximação intuitiva é substituir `\(\sigma\)` por `\(s\)` considerar a razão: `$$t = \frac{\bar{x} - \mu}{\frac{s}{\sqrt{n}}}$$` Essa substituição causa uma considerável diferença se a amostra for pequena. A notação `\(t\)` é requerida porque `\(s\)` aumenta a variância de `\(t\)` para um valor maior do que um `\((1)\)`, de modo que a razão não é padronizada. A distribuição da razão `\(t\)` é conhecida como **distribuição `\(t\)` - Student** com parâmetro `\(r = n – 1\)` graus de liberdade. --- #### Distribuição t de Student [Tabela - Distribuição t-Student](https://github.com/arpanosso/estatinfo/raw/master/docs/Tabela_tdeStudent.pdf) <img src="https://raw.githubusercontent.com/arpanosso/estatinfo/master/slides/img/ic_05.png" width="100%" style="display: block; margin: auto;" /> --- ### Distribuição t de Student As distribuições `\(t\)` são simétricas em torno de zero mas têm caudas mais espalhadas do que a distribuição `\(N(0, 1)\)`. Entretanto, com o aumento de `\(r\)`, a distribuição `\(t\)` se aproxima da distribuição `\(N(0, 1)\)`, pois `\(Var(t)\)` tende à unidade `\((1)\)`. `$$\begin{cases} E(t) = 0 \\ Var(t) = \frac{r}{r-2} = \frac{n-1}{n-3}\end{cases}$$` Pode-se concluir da distribuição `\(t\)`, que `$$P(-t_{\frac{\alpha}{2}} \le \frac{\bar{x}-\mu}{\frac{s}{\sqrt{n}}} \le +t_{\frac{\alpha}{2}}) = 1 - \alpha$$` em que `\(t_{\alpha \\2}\)` é obtido na tabela da distribuição `\(t\)` com `\(r = n – 1\)` graus de liberdade, ou seja: `$$IC(\mu;1-\alpha) = ]\bar{x}-t_{\frac{\alpha}{2}} \frac{s}{\sqrt{n}};\bar{x}+t_{\frac{\alpha}{2}} \frac{s}{\sqrt{n}}[$$` --- ### Exercício Uma amostra de `\(10\)` cães sofrendo de uma determinada doença apresentou um tempo de sobrevivência médio de `\(46,9\)` meses e o desvio padrão de `\(43,3\)` meses. Determinar os limites de confiança de `\(90\%\)` para `\(\mu\)`. -- <img src="https://raw.githubusercontent.com/arpanosso/estatinfo/master/slides/img/ic_06.png" width="80%" style="display: block; margin: auto;" /> --- class: middle, center, inverse # Intervalo de Confiança para a Proporção --- Fazendo uso do fato que, para `\(n\)` grande, a distribuição binomial pode ser aproximada com a normal: `$$Z = \frac{x - n.p}{\sqrt{n.p.q}} = \frac{\hat{p}-p}{\sqrt{\frac{\hat{p} \hat{q}}{n}}} \tilde{ }N(0,1)$$` Temos: `$$P \left(-z_{\frac{\alpha} {2}} \le \frac{x- np}{\sqrt{np(1-p)}} \le +z_{\frac{\alpha}{2}} \right) = 1 - \alpha$$` Substituindo `\(p\)`, visto que é desconhecido, por seu estimador `\(\hat{p}\)` dentro das raízes, obtêm-se: `$$IC(\hat{p};1-\alpha) = \left]\hat{p}-z_{\frac{\alpha}{2}} \sqrt{\frac{\hat{p}\hat{q}}{n}};\hat{p}+z_{\frac{\alpha}{2}} \sqrt{\frac{\hat{p}\hat{q}}{n}} \right[$$` --- ### Exemplo Suponha que em `\(n = 400\)` animais são administrados uma droga, obtendo `\(X = 320\)` sucessos, ou seja, `\(80\%\)` dos animais melhoraram. A partir destes dados, obtenha um `\(IC\)` para `\(p\)`, com `\(1 - \alpha = 0,90\)`. <img src="https://raw.githubusercontent.com/arpanosso/estatinfo/master/slides/img/ic_07.png" width="85%" style="display: block; margin: auto;" /> --- ### Exemplo Suponha que em `\(n = 400\)` animais doentes são administrados uma droga, obtendo `\(X = 320\)` sucessos, ou seja, `\(80\%\)` dos animais melhoraram. A partir destes dados, obtenha um `\(IC\)` para `\(p\)`, com `\(1 - \alpha = 0,90\)`. <img src="https://raw.githubusercontent.com/arpanosso/estatinfo/master/slides/img/ic_08.png" width="80%" style="display: block; margin: auto;" />