Classificatore Naive Bayes

Un classificatore è un modello di apprendimento automatico che viene utilizzato per discriminare oggetti diversi in base a determinate funzionalità.

Principio del classificatore Naive Bayes:

Un classificatore Naive Bayes è un modello probabilistico di apprendimento automatico utilizzato per l’attività di classificazione. Il punto cruciale del classificatore è basato sul teorema di Bayes.,

il Teorema di Bayes:

Utilizzando il teorema di Bayes, siamo in grado di trovare la probabilità di accadimento, dato che B si è verificato. Qui, B è l’evidenza e A è l’ipotesi. L’ipotesi fatta qui è che i predittori / caratteristiche siano indipendenti. Cioè la presenza di una particolare caratteristica non influisce sull’altra. Quindi è chiamato ingenuo.

Esempio:

Facciamo un esempio per ottenere una migliore intuizione., Considera il problema di giocare a golf. Il set di dati è rappresentato come di seguito.

Noi classifichiamo se il giorno è adatto per giocare a golf, date le caratteristiche della giornata. Le colonne rappresentano queste caratteristiche e le righe rappresentano singole voci. Se prendiamo la prima fila del set di dati, possiamo osservare che non è adatto per giocare a golf se le prospettive sono piovose, la temperatura è calda, l’umidità è alta e non è ventosa., Facciamo due ipotesi qui, uno come detto sopra consideriamo che questi predittori sono indipendenti. Cioè, se la temperatura è calda, non significa necessariamente che l’umidità sia alta. Un’altra ipotesi fatta qui è che tutti i predittori hanno un effetto uguale sul risultato. Cioè, il giorno essendo ventoso non ha più importanza nel decidere di giocare a golf o no.,

in Base a questo esempio, il teorema di Bayes può essere riscritta come:

La variabile y è la variabile di classe(giocare a golf), che rappresenta, se è adatto a giocare a golf o non date le condizioni. Variabile X rappresentano i parametri / caratteristiche.,

X è dato come,

Qui x_1,x_2….x_n rappresentano le caratteristiche, cioè possono essere mappati a outlook, temperatura, umidità e vento., Sostituendo X e in espansione, utilizzando la catena regola che abbiamo,

Ora, è possibile ottenere i valori per ogni esaminando il set di dati e la loro sostituzione nell’equazione. Per tutte le voci nel set di dati, il denominatore non cambia, rimane statico. Pertanto, il denominatore può essere rimosso e può essere introdotta una proporzionalità.,

Nel nostro caso, la variabile di classe(y) ha solo due risultati, sì o no. Potrebbero esserci casi in cui la classificazione potrebbe essere multivariata. Pertanto, abbiamo bisogno di trovare la classe y con la massima probabilità.,

Utilizzando la funzione di cui sopra, siamo in grado di ottenere la classe, dato che i predittori.

Tipi di classificatore Naive Bayes:

Questo è principalmente usato per il problema di classificazione dei documenti, cioè se un documento appartiene alla categoria di sport, politica, tecnologia ecc. Le caratteristiche / predittori utilizzati dal classificatore sono la frequenza delle parole presenti nel documento.,

Bernoulli Naive Bayes:

Questo è simile al multinomiale naive bayes ma i predittori sono variabili booleane. I parametri che usiamo per prevedere la variabile di classe occupano solo i valori sì o no, ad esempio se una parola si verifica nel testo o meno.

Gaussian Naive Bayes:

Quando i predittori assumono un valore continuo e non sono discreti, assumiamo che questi valori siano campionati da una distribuzione gaussiana.,

Gaussian Distribution(Normal Distribution)

Since the way the values are present in the dataset changes, the formula for conditional probability changes to,

Conclusion:

Naive Bayes algorithms are mostly used in sentiment analysis, spam filtering, recommendation systems etc., Sono veloci e facili da implementare, ma il loro più grande svantaggio è che il requisito dei predittori di essere indipendenti. Nella maggior parte dei casi reali, i predittori dipendono, questo ostacola le prestazioni del classificatore.

Author: admin

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *