← Blog · 10 Aug 2019 · 4 min de leitura

Quais são as principais diferenças entre estimativas, predição e previsão?

“Estimativa” é a estimativa de parâmetros. É quando seu interesse está nas variáveis preditoras (os X’s) e como elas se relacionam com Y.

“Predição” é a estimativa de respostas. Seu interesse é principalmente na resposta; você não se importa como o modelo foi construído. Estas são muitas vezes caixas pretas.

“Previsão” é apenas “previsão” para pessoas que fazem séries temporais. Obviamente, é em referência ao futuro, utilizando modelos probabilísticos a partir de dados realizados no passado.

Um pouco de história:

Muitos estatísticos tradicionais (muitos mesmo) trabalham estimativas (valores de p …). Esta é provavelmente a influência da academia, onde os pesquisadores realmente estão interessados em determinar a relação entre X e Y e perguntando se é real ou não. Em contraste, a previsão é geralmente muito mais importante em modelos aplicados - os métodos de mineração de dados são tipicamente fortemente focados na previsão, onde apenas os resultados importam. Dessa forma, você raramente vê um valor p discutido e as métricas de validação cruzada (por exemplo, precisão em relação às respostas Y) são de maior preocupação.

No contexto de modelos de efeitos fixos vs. aleatórios:

“Estimativas” referem-se a efeitos fixos, enquanto “previsões” referem-se a efeitos aleatórios.

O forecasting é o processo de fazer previsões do futuro com base em dados passados e presentes e, mais comumente, pela análise de tendências. Um exemplo comum pode ser a estimativa de alguma variável de interesse em uma data futura especificada. Predição é um termo semelhante, mas mais geral. Ambos podem se referir a métodos estatísticos formais que empregam séries temporais, dados transversais ou longitudinais ou, alternativamente, a métodos de julgamento menos formais. O uso pode diferir entre áreas de aplicação: por exemplo, em hidrologia, os termos “previsão” e “previsão” são às vezes reservados para estimativas de valores em determinados momentos futuros, enquanto o termo “previsão” é usado para estimativas mais gerais, como o número de vezes que as inundações ocorrerão durante um longo período.

Risco e incerteza são centrais para previsão e previsão; Geralmente, considera-se boa prática indicar o grau de incerteza associado às previsões. Em qualquer caso, os dados devem estar atualizados para que a previsão seja a mais precisa possível. Em alguns casos, os dados usados para prever a variável de interesse são previstos

Monte Carlo (com Boot strapping (reamostragem))

A modelagem matemática ajuda as pessoas em todos os tipos de áreas a responder perguntas sobre prováveis resultados no mundo real. Como eles extrapolam os resultados de um teste de drogas para uma população mais ampla, por exemplo? Mesmo com uma observação limitada do throughput, o método de Monte Carlo (com Bootstrapping) pode nos ajudar ter uma visão mais ampliada do cenário em que estamos trabalhando.

O método faz uso dos dados do mundo real que coletamos para criar resultados futuros razoáveis e prováveis. Em vez de assumir um tempo throughput consistente, ele cria um intervalo de milhares de possibilidades e com isso para proporcionar um intervalo de previsões de entrega prováveis, onde é possível avaliar níveis de riscos das faixas de probabilidade oferecidas.

Em poucas palavras, podemos resumir o processo da seguinte forma:

1. Faça uma observação do throughput de uma equipe ao longo de vários períodos (dias, semanas, sprints, releases, etc.)

Apenas 4-5 períodos são suficientes para começar. Fica melhor com algo em torno de 15 períodos. Bom mesmo é a partir de 30 períodos. E a partir destes 30 períodos, tome como amostra sempre os últimos 30 períodos.

2. Gere amostras aleatórias desses dados, utilizando reamostragem (Bootstrap), para ter um intervalo simulado com uma distribuição probabilística, baseada em milhares de itens entregues por períodos para a equipe.

3. Utilizando um histograma, observe a distribuição das amostras geradas com aqueles itens de throughput simulados para construir uma simulação do projeto.

Algumas notas

O método de Simulação de Monte Carlo é uma maneira muito útil de prever projetos. Para fechar o post, aqui estão algumas observações e notas a considerar antes de tentar por si mesmo.

É um bom indicador da linha do tempo, mas depende de um bom backlog.
As histórias não precisam ser estimadas para o tamanho individualmente, mas você deve ter certeza de que o número de histórias é certo
Equipes gostam. Monte Carlo retira sua propriedade (culpa / vergonha) da previsão, mas eles também gostam de compará-lo com o que eles pensavam que o cronograma seria

Fontes:

WHEELWRIGHT, Steve; MAKRIDAKIS, Spyros. Forecasting Methods for Managers. 1974.

TALEB, Nassim Nicholas. Black swans and the domains of statistics. The American Statistician, v. 61, n. 3, p. 198-200, 2007.

Chernick, M. R. 1999. Bootstrap Methods: A Practitioner’s Guide, New York: John Wiley & Sons.

Efron, B. e R.J. Tibshirani. 1993. An Introduction to the Bootstrap, London, Chapaman and Hall