Pós-Graduação em Estatística Aplicada

Confira todas as informações sobre o seu curso de interesse.

  • Designed by Jannoon028 / Freepik

  • Designed by ijeab / Freepik

  • Designed by Jannoon028 / Freepik

INFORMAÇÕES ADICIONAIS

Hoje em dia, em todos os ambientes de negócios (empresas de serviços ou indústrias), ou mesmo nos serviços públicos, a estatística se faz presente como um instrumento de apoio na descrição e análise dos dados, sejam eles relativos à saúde das pessoas ou saúde pública, a processos ou produtos da empresa, ou dados mercadológicos. Profissionais das mais diversas áreas, trabalhando nos mais diversos setores, lidam com dados diariamente, e deles precisam extrair informações e conhecimento relevantes. Precisam validar os testes realizados, ou precisam fazer previsões dentro de certo grau de confiança. Precisam controlar a qualidade dos seus produtos ou processos. 

O curso de pós-graduação em Estatística Aplicada se propõe a capacitar o profissional no uso e aplicação dos principais métodos e técnicas de análise estatística, habilitando-o a aplicar este conhecimento no seu ambiente de trabalho.


Profissionais das mais diversas áreas que enfrentam crescente necessidade de uso de técnicas estatística para a análise de dados relativos aos processos, produtos ou mercados onde atuam. São exemplos analistas de marketing, economistas, administradores, atuários, engenheiros, profissionais diversos da área da saúde (tais como médicos, biomédicos, enfermeiros, radiologistas, fonoaudiólogos, psicólogos), advogados, comerciários, compradores, estatísticos, analistas diversos, operadores logísticos, geólogos, biólogos, etc.


Matriz Curricular

Estrutura do Curso:

Cada módulo é composto de horas aula e horas trabalho.

As horas aula compreendem a exposição do conteúdo proposto através de aulas e materiais complementares e as horas trabalho consistem na realização de exercícios práticos guiados.

As horas de trabalho desenvolvidas nos módulos dão subsídios para desenvolvimento do projeto final que será validado como trabalho de conclusão de curso. 

 

Programa do Curso:

Módulo

Conteúdo

I

Estatística Descritiva, lógica de programação e R

II

Introdução à probabilidade

III

Inferência Estatística

IV

Análise de regressão, multivariada e séries temporais

V

Aplicações Avançadas - Introdução a Ciência dos Dados e Python

VI

Projeto Final

 

 

MÓDULO I - ESTATÍSTICA DESCRITIVA, LÓGICA DE PROGRAMAÇÃO e R

Inicialmente faremos uma breve introdução histórica da estatística, sobre o que é a estatística hoje, seu papel e suas estratégias de análise. Em seguida, voltaremos nossas atenções para o tema central da disciplina, que é uma das mais importantes partes da estatística, a chamada “Estatística Descritiva”. Discutiremos o que são dados, população e amostra, coleta dos dados, como organizá-los, como criar sumários (também chamados de resumos). Para isso, serão introduzidos conceitos centrais da estatística. Finalmente, abordaremos a mais relevante forma de entendimento e interpretação dos dados por nós seres humanos, que é aquela de visualização dos dados por meio de gráficos. Por vezes, gráficos são usados para gerar (motivar) hipóteses sobre o comportamento do fenômeno estudado. Outras vezes, são úteis na comprovação dessas hipóteses. E, quase sempre, são usados para comunicar os resultados das análises. Todos principais gráficos da estatística, usados para qualquer desses propósitos, serão cuidadosamente apresentados e discutidos. Essa é uma forma tradicional de se introduzir o aluno ao aprendizado da estatística, e por isso a forma aqui adotada.

Neste módulo também estudaremos lógica de programação, passando pela construção de algoritmos, variáveis e seus tipos, funções e ainda veremos elementos de programação orientada à objetos como classes e métodos. A principal linguagem que utilizaremos é R, uma linguagem de programação de software livre e gratuita.

 

MÓDULO II - INTRODUÇÃO À PROBABILIDADE 

Muitas vezes a estatística é definida como a ciência que estuda dados. Mas quase todas ciências tratam de dados, dos seus próprios dados. Mas estatística trata dos dados de qualquer das outras ciências. Isto já a distingue das outras ciências. Mas há outro ponto muito importante, que faz notável essa distinção da estatística como uma ciência ímpar. Ela se especializou no estudo de dados que representam fenômenos aleatórios, onde há incertezas, desconhecimento ou comportamento intrinsicamente não determinístico. E isso existe em todo lugar. Para isso, a estatística lança mão de uma área da matemática chamada de probabilidade. Aqui, na “Introdução à Probabilidade”, veremos o que são experimentos aleatórios, eventos e espaços amostrais. Definiremos probabilidade, estudaremos suas propriedades e as suas principais regras. Finalmente, abordaremos algo de enorme importância para a estatística, que são as distribuições de probabilidade. Todas principais distribuições serão apresentadas e interpretadas, assim como um dos mais famosos teoremas do mundo, e talvez o mais usado: O Teorema do Limite Central. Você aprenderá sobre seus poderes, e onde e quando usá-lo.

 

MODULO III-  INFERÊNCIA ESTATÍSTICA

Um dos ramos que melhor representa a estatística é “Inferência Estatística”. É na inferência estatística que realmente se desvendam os mistérios e as maravilhas da forma tão genuína do pensamento e da alma de um estatístico. Não é fácil para nós, seres humanos comuns, entrarmos nesse mundo, pois é diferente. Nós lhe ajudaremos nessa missão, em duas etapas. Definiremos população e amostra. Discutiremos sobre estimação pontual e estimação intervalar. Mostraremos como calcular vários tipos de intervalos de confiança. Falaremos sobre tamanho de amostras e como gerenciar esses tamanhos para atender suas necessidades, porém dentro das suas possibilidades – amostras sempre custam algo, às vezes muito. Discutiremos um pouco sobre técnicas de amostragem e muito sobre os cuidados que se deve ter nas amostragens. Encerraremos essa jornada apresentando vários testes: Testes Qui-Quadrado, testes de normalidade, testes de dependência e alguns dos principais testes não paramétricos. 

Além disso será abordada a hipótese estatística, um conceito central da estatística, e de enorme importância. Veremos teste de hipótese para uma amostra, tipos de erros, potência do teste e curva característica de operação. Prosseguiremos para teste de significância para a média, teste de significância para a variância e teste de significância para a proporção. Abordaremos teste de hipótese para duas amostras, para a média, a variância e a proporção. Apresentaremos o conceito de fatores na estatística, a assim poderemos discutir análise de variância – ANOVA – para experimentos com um único fator e experimentos com dois ou mais fatores. 

 

MODULO IV - ANÁLISE DE REGRESSÃO, MULTIVARIADA E SÉRIES TEMPORAIS

Análise de regressão nasceu através das inquietas e interessantes investigações de Francis Galton, um primo de Charles Darwin. O Galton cunhou este termo, de uma forma muito curiosa e engenhosa, e ele – o termo – acabou por se estabelecer na história da estatística, e isso mesmo quando se refere a métodos que não são exatamente de regressão. Daremos início discutindo coeficiente de correlação de Pearson para duas variáveis contínuas, e teste de hipótese para a existência de correlação entre essas duas variáveis. Voltaremos ao tema de diagramas de dispersão, para então introduzir o modelo de regressão linear simples, e vários conceitos relevantes para a avaliação da qualidade do ajuste do modelo aos dados analisados. Veremos transformações de variáveis, e quão úteis podem ser para dar enorme flexibilidade ao modelo de regressão linear simples. Abordaremos o modelo de regressão linear múltipla e, aumentando ainda a flexibilidade desses modelos, introduziremos variáveis mudas (dummy variables). Finalizaremos com um poderoso e versátil método de classificação, historicamente discutido no âmbito dos métodos de análise de regressão, a chamada Regressão Logística.

A análise multivariada, ou multivariável, nasceu devido à crescente capacidade do ser humano de observar os fenômenos à sua volta e coletar dados, não só de uma ou de duas variáveis, mas de três ou mais. Nessa situação, tudo fica mais delicado e complexo, mas é assim mesmo o mundo que nos cerca, e a nossa curiosidade nos compele a investigar e enfrentar essas situações, mesmo que mais delicadas e mais complexas. Para isso, os estatísticos inventaram técnicas chamadas de análise multivariada, às vezes chamadas de exploratórias, pois frequentemente usadas em etapas iniciais da investigação. Faremos uma introdução explicando o que vem a ser análise multivariável, tipos de variáveis, e exemplos de dados multivariáveis. Discutiremos covariâncias, correlações e distâncias. Falaremos sobre a função de densidade de probabilidade normal multivariada e técnicas de visualização de dados multivariados.

Como muito frequentemente observamos fenômenos naturais ou sociais coletando dados dentro de certos intervalos fixos de tempo, elas – as séries temporais – estão muito presentes em quase todas áreas de conhecimento ou atividade humana. Introduziremos séries temporais fornecendo vários exemplos e mostrando quão ricas e diversas são. Discutiremos sobre o processo de predição, quando queremos usar dos dados já coletados para prever algo no futuro. Para isso normalmente usam-se das etapas: Definição do problema, coleta de dados, análise dos dados, seleção e ajuste do modelo, validação do modelo, predição, monitoração da qualidade da predição. Definiremos algumas propriedades e funções relevantes para a análise de séries temporais, e técnicas de ajuste de tendência e de sazonalidade. E como modelar a série temporal assume um papel central, seja para entender o comportamento do fenômeno estudado, seja para predição, discutiremos os mais comuns modelos de séries temporais, para então finalizar com uma visão geral, de caráter informativo, sobre outros modelos mais sofisticados. 

 

MÓDULO V - APLICAÇÕES AVANÇADAS – INTRODUÇÃO A CIÊNCIA DOS DADOS e PHYTON

Neste módulo apresentaremos a Ciência dos Dados, uma nova área de estudos que utiliza a estatística em conjunto com métodos computacionais e algoritmos de inteligência artificial e machine learning.  Serão realizadas aplicações práticas abrangendo as técnicas necessárias à realização de um projeto típico em ciência dos dados como: extração e tratamento de dados, algoritmos de machine learning e técnicas de visualização. Este módulo será realizado utilizando a linguagem de programação python, devido à sua ampla utilização nessa nova ciência.

 

MÓDULO VI PROJETO FINAL

Neste módulo de conclusão daremos a oportunidade para o estudante desenvolver um projeto utilizando os conceitos e ferramentas desenvolvidos ao longo do curso aplicado a sua área de atuação profissional.