Come una Rete Neurale ha Imparato le Proprie Regole di Frode: Un Esperimento di AI Neuro-Simbolica
La maggior parte dei sistemi neuro-simbolici inietta regole scritte dagli esseri umani. Ma cosa succederebbe se una rete neurale potesse scoprire quelle regole da sola?
In questo esperimento, ho esteso una rete neurale ibrida con un modulo di apprendimento delle regole differenziabile che estrae automaticamente le regole di frode IF-THEN durante l’addestramento. Utilizzando il dataset di frode con carta di credito, il modello ha appreso regole interpretabili come:
SE V14 < -1.5σ E V4 > +0.5σ -> Frode dove σ denota la deviazione standard della caratteristica dopo la normalizzazione.
Il modulo di apprendimento delle regole ha raggiunto un ROC-AUC di 0.933 ± 0.029, mantenendo il 99.3% di fedeltà alle previsioni della rete neurale.
In modo interessante, il modello ha riscoperto in modo indipendente V14, una caratteristica nota da tempo agli analisti per la sua forte correlazione con la frode, senza essere istruito a cercarla.
Ciò che il Modello ha Scoperto
Dopo un massimo di 80 epoche di addestramento, il modulo di apprendimento delle regole ha prodotto le seguenti:
Regola di Frode Appresa — Seed 42 (5 condizioni, conf=0.95)
SE V14 < -1.5σ E V4 > +0.5σ E V12 < -0.9σ E V11 > +0.5σ E V10 < -0.8σ -> FRODE
Regola Complementare — Seed 7 (8 condizioni, conf=0.74)
SE V14 < -1.6σ E V12 < -1.3σ E V4 > +0.3σ E V11 > +0.5σ E V10 < -1.0σ E V3 < -0.8σ E V17 < -1.5σ E V16 < -1.0σ -> FRODE
In entrambi i casi, i valori bassi di V14 sono al centro della logica, mostrando una convergenza notevole senza alcuna guida precedente.
Dalla Regola Iniettata alle Regole Apprese — Perché È Importante
Ogni modello di frode ha un confine decisionale. Tuttavia, i team antifrode operano utilizzando regole. Il divario tra ciò che il modello ha appreso e ciò che gli analisti possono leggere e difendere è cruciale.
La differenza fondamentale tra l’iniezione di regole e l’apprendimento delle regole è che l’iniezione codifica ciò che già sai, mentre l’apprendimento scopre ciò che non sai. In questo esperimento, la scoperta è stata V14, un segnale che il gradiente ha trovato in modo indipendente.
Architettura: Tre Componenti Apprendibili
L’architettura mantiene una rete neurale standard, ma aggiunge un secondo percorso che impara regole simboliche che spiegano le decisioni della rete. I due percorsi funzionano in parallelo dallo stesso input.
1. Discretizzatore Apprendibile: I moduli di regole richiedono input binari. Un sigmoid soft collega entrambi gli approcci.
2. Layer di Apprendimento delle Regole: Ogni regola è una combinazione pesata di caratteristiche binarizzate.
3. Aggiustamento della Temperatura: La temperatura segue un programma di decadimento esponenziale, necessario per trasformare l’ottimizzazione continua in un output simbolico.
Risultati: Funziona l’Apprendimento delle Regole — E Cosa Ha Trovato
Il dataset utilizzato è quello delle frodi con carta di credito, e la prestazione del modulo di apprendimento delle regole è leggermente inferiore a quella della rete neurale pura, ma il trade-off è l’interpretabilità.
Fiducia della Regola: 0.993 ± 0.001 — Eccellente
Copertura della Regola: 0.811 ± 0.031 — Buona
Semplicità della Regola: 1.7 ± 2.1 — La media è dominata da semi in cui il percorso delle regole è completamente crollato.
Conclusione
Questo esperimento dimostra che il gradiente discendente può riscoprire segnali critici per il dominio senza essere istruito su cosa cercare. I team di conformità possono ora leggere le regole apprese e verificare la loro validità senza dover analizzare matrici di pesi.