Conteúdo

Probabilidade? geralmente o ponto de partida nos estudos das 3 áreas propostas em probabilidade/estatística: ESTATÍSTICA DESCRITIVA, ESTATÍSTICA INFERENCIAL E PROBABILIDADE, que basicamente é a extensão da ocorrência de eventos. Quando um evento ocorre como lançar uma bola, escolher uma carta do baralho, etc., então deve haver alguma probabilidade associada a esse evento.

Em termos de matemática, a probabilidade se refere à proporção dos resultados desejados em relação ao número total de resultados possíveis. Existem três abordagens para a teoria da probabilidade:

0 é a menor probabilidade permitida e 1 é a maior probabilidade permitida

Axioma 1

O evento certo é o evento “algum resultado ocorre”. Por exemplo, ao rodar um dado, o evento certo é “Um de 1, 2, 3, 4, 5, 6 aparecerá.

Axioma 2

A probabilidade da união de eventos mutuamente exclusivos é a soma das probabilidades dos eventos individuais. Exemplo: o dado aparece 1” e “o dado aparece 4” são mutuamente excludentes, assumindo que estamos falando sobre o mesmo lance do mesmo dado

Axioma 3

Terminologias importantes pra você entender o “dialeto”:

Se houver um total de p resultados possíveis associados a um experimento aleatório e q deles são resultados favoráveis ​​ao evento A, então a probabilidade do evento A é denotada por P(A) e é dada por:

P(A) = q / p

Falando em um dado, qual a probabilidade de o jogarmos e encontrarmos o número 6?

P(6) = 1 / 6 = 0.16%(aproximadamente)

Em suma…

Distribuições de Probabilidade

Até agora, aprendemos o básico da probabilidade que um cientista de dados deve saber.

Todo cientista de dados que passou um tempo avaliando dados e realizando feature engineering deve ter encontrado os seguintes termos:
Distribuição gaussiana, distribuição normal, distribuição binomial, distribuição de Poisson, distribuição exponencial e assim por diante.

Esta seção irá explicar o que são essas distribuições de probabilidade.

Uma variável aleatória tem uma distribuição de probabilidade. O que isso significa é que a distribuição de uma variável aleatória X é a coleção de probabilidades para todos os subconjuntos de X.

Em primeiro lugar, conhecer a distribuição de probabilidade de uma variável aleatória é uma ferramenta extremamente poderosa porque pode ajudá-lo a estimar os movimentos de uma variável.

Além disso, várias variáveis ​​aleatórias podem ter a mesma distribuição de probabilidade. Isso é interessante porque se houver duas variáveis ​​aleatórias que podemos medir (observar) que têm a mesma distribuição, podemos usar a primeira variável para entender o comportamento da outra variável e considerá-la como uma proxima da outra. Podemos, portanto, construir modelos preditivos muito superiores entendendo os “bastidores”.

Se registrarmos os resultados de uma variável aleatória junto com suas probabilidades, podemos construir uma distribuição de probabilidade.

Assim que tivermos o conjunto possível de resultados, podemos calcular suas probabilidades e, em seguida, calcular as distribuições das probabilidades. A partir da distribuição de probabilidade, podemos calcular uma função de distribuição de probabilidade.

Por este motivo é aconselhável termos nosso conjunto de dados “balanceados” para não enviesar nossas predições. Dependendo do algoritmo e definição do problema, poderemos sim ter dados desbalanceados.

Uma distribuição de probabilidade tem sua própria forma, comportamento e propriedades. Explicarei as distribuições mais comumente usadas em projetos de ciência de dados.

DISTRIBUIÇÃO UNIFORME

DISTRIBUIÇÃO NORMAL(GAUSSIANA)

DISTRIBUIÇÃO DE BERNOULLI/BINOMIAL

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

nove + dezoito =