Vijesti o Tehnologiji, Recenzije i Savjeti!

Korištenje destilacije znanja na konvolucijskim mrežama s proširenim grafikonom za otkrivanje pranja novca u Bitcoin transakcijama

Napomena: Sljedeći članak će vam pomoći: Korištenje destilacije znanja na konvolucijskim mrežama s proširenim grafikonom za otkrivanje pranja novca u Bitcoin transakcijama

Na temelju svog stvarnog značenja, kriptovaluta je više od običnog digitalnog novca. to je decentralizirana digitalni novac izgrađen na inovativnoj blockchain tehnologiji, tj. ne postoji tijelo koje upravlja kriptovalutom. Umjesto toga, korisnici preuzimaju različite zadatke povezane s upravljanjem vrijednošću kriptovalute putem digitalnih medija.

Bitcoin, najpopularniju kriptovalutu danas, također je prva lansirala anonimna osoba ili grupa po imenu Satoshi Nakamoto 2008. Kao decentralizirani i digitalizirani oblik valute, mnogo je pozitivnih strana ulaganja u Bitcoin. Ali ima i priličan udio nedostataka.

Anonimnost za sve korisnike u decentraliziranoj klimi također nudi anonimnost za kriminalce. Potiče pranje novca, krađu i druge zlonamjerne aktivnosti. Vlade i institucije brzo su to shvatile i iznijele propise protiv pranja novca (AML) za sve. Međutim, te politike imaju i nedostataka.

Dakle, može li tehnologija biti konačno rješenje za otkrivanje i ublažavanje pranja novca za valutu koju je rodila? Saznajmo u ovom istraživačkom projektu.

Praznine su predstavljale stvarne izazove

Kako bi se pronašla rješenja, projekt je trebao prevladati neke ključne izazove s kojima se područje otkrivanja prijevara do sada suočavalo:

    Strojno učenje (ML) moglo bi biti rješenje za probleme pranja novca. Kroz studije uzoraka podataka, može pružiti prilagodljive tehnike za otkrivanje prijevare. Do danas je već obavljen dobar dio posla na izradi takvih ML modela. Međutim, gotovo svi ti modeli loše odražavaju scenarije stvarnog svijeta jer koriste skupovi sintetičkih podataka. Štoviše, nijedna trenutna literatura nema dovoljno informacija o opterećenju izvedbe modela.
    Kao što su istraživali Weber i sur. (2019), jedan je model postigao značajan napredak kombinirajući Random Forest s EvolveGCN-om. Ali postoje praktična ograničenja za njegovu primjenu u stvarnom svijetu. Zahtijeva višak prostora za pohranu i računalne troškove, što nije široko primjenjivo.
    Kada je prethodni rad opsežno ispitan, zaključeno je da postojeća istraživanja i modeli pretpostavljaju da će dolazni podaci uvijek biti organizirani i statični. Ovo je daleko od istine u scenariju stvarnog svijeta. Podaci iz stvarnog svijeta nalaze se u a konstantno stanje toka zbog mnogih transakcija i interakcija u kriptovaluti.
    Otkrivanje prijevara u kriptovaluti je u početnoj fazi jer je sama industrija stara tek deset godina. Istraživači i podatkovni znanstvenici diljem svijeta tek shvaćaju potencijal koji on nosi i probleme koje stvara. Stoga tehnološki potpomognuto otkrivanje prijevara nije tako napredno. Istražnim agencijama trebaju mjeseci da uđu u trag jednoj transakciji i utvrde njezinu autentičnost.
    Nedostatak AML propisa je trošak koji nameće korisnicima. Ovaj nedostatak negativno utječe na siromašne, skupine s niskim prihodima, kao i izbjeglice i imigranti. Imaju ograničen pristup zarađivanju novca. Dodajte ovome troškove uključene u identificiranje sebe kao poštenih transakcija, i oni će biti dodatno obeshrabreni od sudjelovanja u ekonomskim aktivnostima.

Izrada modela za otkrivanje Bitcoin prijevara

Gore navedeni izazovi potaknuli su ovaj projekt na prikupljanje inspiracije iz višestrukih ML tehnika i modela. Naposljetku je došao do novog modela koji dodaje sposobnosti prethodnih modela i dobiva bolje uklopljene performanse. Konačni model je kompaktan i održava ili pokušava premašiti postavljena mjerila.

Skup podataka

Besplatno dostupan skup podataka, zahvaljujući suradnji između Elliptic Co. i Weber et al. (2019), korišten je. To je jedan od najopsežnijih skupova podataka o kriptovalutama u industriji. Ovaj skup podataka sadrži podatke o Bitcoin transakcijama u grafičkom formatu i pohranjuje transakcijske entitete u obliku čvorova. Svi čvorovi imaju 166 značajki i jednu od tri oznake – dopušteno, nedopušteno ili nepoznato. 21% podataka spada pod dopušteno, 2% pod nedopuštenim, dok je ostatak nepoznat.

Metodologija

Projekt je želio pronaći najnovije tehnike AML-a u kriptovaluti.

Prvo je pogledao rezultate nakon primjene atributa na skup podataka. Zatim je implementirao Graph Neural Network s algoritmima klasifikatora za poboljšanje sposobnosti učenja i klasifikacije. Zatim je upotrijebio Knowledge Distillation za komprimiranje modela i smanjenje njegovog memorijskog otiska. Konačno, model je uhvatio i usporedio performanse predloženog modela s referentnim vrijednostima.

Proces je tekao na sljedeći način:

    Pregled literature:

Pregled literature pružio je odgovore za razumijevanje kriptovalute i otkrivanje prijevara. Otkrio je nedostatke u tehnologiji, kao i prostor za poboljšanje. Također je predstavljao temelj istraživanja, od opisa problema do postavljanja ciljeva.

    Predložena implementacija:

Algoritmi pronađeni tijekom pregleda literature implementirani su određenim redoslijedom – počevši s postizanjem osnovne vrijednosti, primjenom slučajne šume i destilacije znanja i procjenom modela u odnosu na osnovnu vrijednost.

    Preciznost, prisjećanje i ponderirani F rezultat:

Preciznost i prisjećanje bili su ključni pokazatelji za provjeru učinkovitosti rezultata. Većina postojećih modela radi sa sintetičkim skupovima podataka koji ne odražavaju scenarije iz stvarnog svijeta. Oni ne daju točne rezultate. Ponderirani F rezultat također je pomogao dati najnepristraniju procjenu performansi novog modela.

    Vrijeme izvedbe modela:

Bilo je to vrijeme potrebno za označavanje određene podatkovne točke. Međutim, najprije je metrika provjerena primjenom predložene tehnike destilacije znanja.

    Prostor za pohranu:

Da bismo razumjeli računalni intenzitet modela, korištene referentne vrijednosti performansi bile su prostor za pohranu modela i korištenje CPU-a. Kako bi se to smanjilo, primijenjena je destilacija znanja.

Inovacija

Ideja je bila provesti budući rad kako su predložili Weber et al. (2019).

Značajke čvora izgrađene su korištenjem EvolveGCN-a i Random Foresta za stvaranje umetanja. Zatim je kao izlazni sloj korištena varijanta šume odlučivanja – logistička regresija. Ova se metoda smatra najboljim načinom za integraciju algoritama EvolveGCN i Random Forest.

Ishodi modela otkrivanja prijevara

Ishodi predloženih modela bili su:

MODEL TIP ISHOD
EvolveGCN-O Osnovna linija ● Dobre performanse klasifikacije● Pristojno vrijeme izvedbe i korištenje diskovnog prostora● Prilično složeno
d-EvolveGCN Destilirana ● Poboljšana učinkovitost klasifikacije● 10% povećanje nedopuštenih metrika i 8% povećanja izvedbe MicroAvg metrike● Nešto kraće vrijeme izvršenja● Manje složeno i manje prostora na disku
dNDF Osnovna linija ● Slične performanse kao EvolveGCN-O● Bolji rezultat preciznosti● Lošije vrijeme izvedbe i 337% povećano vrijeme izvršenja● 23% više prostora na disku
d-dNDF Destilirana ● Mnogo bolja klasifikacijska izvedba od dNDF-a ● Jednaka izvedba s d-EvolveGCN ● Vrhunska CPU memorija bila je najbolja od svih

Gdje se ovaj model otkrivanja prijevara može koristiti?

Projekt je uspješno koristio postojeće modele za stvaranje robusnog i preciznog algoritma i njegovo kompaktiranje za široku primjenu.

Predloženi model zamišljen je da razotkrije lažne transakcije u stalno rastućoj industriji kriptovaluta. Osim toga, pomoći će obeshrabriti pojedince sa zlonamjernim namjerama od klevetanja decentraliziranog valutnog sustava.

Svatko zaslužuje jednake mogućnosti. Da bi ljudi mogli iskoristiti prednosti kriptovalute, moraju biti uključeni u nove financijske sustave bez straha od pravila, propisa i straha da će biti prevareni. Ovaj će model dovesti vlade korak bliže, koristeći tehnologiju za smanjenje fizičkih i monetarnih ograničenja.

Model se također može koristiti za predviđanje zahtjeva i zadanih zahtjeva, predviđanje odljeva i konverzije, otkrivanje neželjene pošte i anomalija, otkrivanje upada i još mnogo toga.

___________________________________

Suraj Krishnamoorthy je student upGrad-a i kao dio svog programa razvio je izvješće o diplomskom radu pod naslovom — Korištenje destilacije znanja na konvolucijskim mrežama s proširenim grafikonom za otkrivanje pranja novca u Bitcoin transakcijama.