um classificador é um modelo de aprendizagem de máquina que é usado para discriminar diferentes objetos com base em certas características.
princípio do Classificador ingênuo de Bayes:
um classificador de Bayes ingênuo é um modelo probabilístico de aprendizagem de máquina que é usado para a tarefa de classificação. The crux of the classifier is based on the Bayes theorem.,
Teorema de Bayes:
Usando o teorema de Bayes, podemos encontrar a probabilidade de Um acontecimento, dado que B ocorreu. Aqui, B é a evidência e A é a hipótese. A suposição feita aqui é que os predictors/recursos são independentes. Esta é a presença de uma característica particular não afeta a outra. Por isso é chamado de ingênuo.
exemplo:
tomemos um exemplo para obter uma intuição melhor., Considere o problema de jogar golfe. O conjunto de dados é representado como abaixo.
Podemos classificar se o dia é adequado para jogar golfe, dadas as características do dia. As colunas representam estas características e as linhas representam entradas individuais. Se tomarmos a primeira linha do conjunto de dados, podemos observar que não é adequado para jogar golfe se a perspectiva é chuvosa, temperatura é quente, umidade é alta e não é ventoso., Nós fazemos duas suposições aqui, uma como indicado acima nós consideramos que estes predictores são independentes. Isto é, se a temperatura é quente, não significa necessariamente que a umidade é alta. Outra suposição feita aqui é que todos os predictores têm um efeito igual no resultado. Ou seja, o dia em que o vento não tem mais importância em decidir jogar golfe ou não.,
de Acordo com este exemplo, o teorema de Bayes pode ser reescrito como:
A variável y é a variável de classe(jogar golfe), o que representa, se ele é adequado para jogar golfe, ou não, dadas as condições. A variável X representa os parâmetros / características.,
X é dado como
Aqui x_1,x_2….x_n representam os recursos, I. E. Eles podem ser mapeados para perspectivas, temperatura, umidade e vento., Substituindo-se X e expansão usando a regra da cadeia obtemos,
Agora, você pode obter os valores para cada um olhando para o conjunto de dados e substituir na equação. Para todas as entradas no conjunto de dados, o denominador não muda, ele permanece estático. Por conseguinte, o denominador pode ser removido e pode ser introduzida uma proporcionalidade.,
No nosso caso, a variável de classe(y) tem apenas dois resultados, sim ou não. Pode haver casos em que a classificação pode ser multivariada. Portanto, precisamos encontrar a classe y com a máxima probabilidade.,
Usando a função acima, podemos obter a classe, dadas as previsões.
tipos de classificador ingênuo de Bayes:
isto é usado principalmente para problemas de classificação de documentos, ou seja, se um documento pertence à categoria de esportes, política, tecnologia, etc. As características / predictores utilizados pelo classificador são a frequência das palavras presentes no documento.,
Bernoulli Naive Bayes:
This is similar to the multinomial naive bayes but the predictors are boolean variables. Os parâmetros que usamos para predizer a variável classe tomam apenas valores sim ou não, por exemplo, se uma palavra ocorre no texto ou não.
Bayes ingênuos Gaussianos:
quando os predictores assumem um valor contínuo e não são discretos, assumimos que estes valores são amostrados a partir de uma distribuição gaussiana.,
Since the way the values are present in the dataset changes, the formula for conditional probability changes to,
Conclusion:
Naive Bayes algorithms are mostly used in sentiment analysis, spam filtering, recommendation systems etc., Eles são rápidos e fáceis de implementar, mas sua maior desvantagem é que a exigência de preditores para ser independente. Na maioria dos casos da vida real, os predictores são dependentes, o que dificulta o desempenho do Classificador.