Vijesti o Tehnologiji, Recenzije i Savjeti!

The 7 Ključni koraci za izgradnju vašeg modela strojnog učenja

Napomena: Sljedeći članak će vam pomoći: The 7 Ključni koraci za izgradnju vašeg modela strojnog učenja

Korak 1: Prikupiti podatke

S obzirom na problem koji želite riješiti, morat ćete istražiti i pribaviti podatke koje ćete koristiti za napajanje vašeg stroja. Kvaliteta i količina informacija koje dobijete vrlo su važni jer će izravno utjecati na to koliko će vaš model dobro ili loše raditi. Možete imati informacije u postojećoj bazi podataka ili je morate stvoriti ispočetka. Ako se radi o malom projektu, možete izraditi proračunsku tablicu koja će se kasnije lako izvesti kao CSV datoteka. Također je uobičajeno koristiti tehniku ​​web skrapinga za automatsko prikupljanje informacija iz različitih izvora kao što su API-ji.

Korak 2: Pripremite podatke

Ovo je dobar trenutak da vizualizirate svoje podatke i provjerite postoje li korelacije između različitih karakteristika koje smo dobili. Bit će potrebno napraviti odabir karakteristika jer će one koje odaberete izravno utjecati na vrijeme izvršenja i rezultate. Također možete smanjiti dimenzije primjenom PCA ako je potrebno.

Osim toga, morate uravnotežiti količinu podataka koje imamo za svaki rezultat – klasu – tako da bude značajan jer učenje može biti pristrano prema vrsti odgovora i kada vaš model pokuša generalizirati znanje, neće uspjeti.

Također morate podijeliti podatke u dvije skupine: jednu za obuku i drugu za evaluaciju modela koje se mogu podijeliti otprilike u omjeru 80/20, ali mogu varirati ovisno o slučaju i količini podataka koje imamo.

U ovoj fazi također možete unaprijed obraditi svoje podatke normalizacijom, uklanjanjem duplikata i ispravljanjem grešaka.

Korak 3: Odaberite model

Postoji nekoliko modela koje možete odabrati u skladu s ciljem koji biste mogli imati: koristit ćete algoritme klasifikacije, predviđanja, linearne regresije, klasteriranja, tj. k-means ili K-Nearest Neighbor, Deep Learning, tj. neuronske mreže, Bayesian, itd.

Postoje različiti modeli koji se mogu koristiti ovisno o podacima koje ćete obrađivati ​​kao što su slike, zvuk, tekst i numeričke vrijednosti. U sljedećoj tablici vidjet ćemo neke modele i njihove primjene koje možete primijeniti u svojim projektima:

Model Prijave
Logistička regresija Predviđanje cijena
Potpuno povezane mreže Klasifikacija
Konvolucijske neuronske mreže Obrada slike
Rekurentne neuronske mreže Prepoznavanje glasa
Slučajna šuma Otkrivanje prijevare
Učenje s pojačanjem Učenje metodom pokušaja i pogreške
Generativni modeli Stvaranje slike
K-znači Segmentacija
k-Najbliži susjedi Sustavi preporuka
Bayesovi klasifikatori Filtriranje spama i buke

Korak 4 Obučite svoj model stroja

Morat ćete uvježbati skupove podataka da rade glatko i vidjeti postupno poboljšanje u stopi predviđanja. Ne zaboravite nasumično inicijalizirati težine vašeg modela – težine su vrijednosti koje se množe ili utječu na odnose između ulaza i izlaza – koje će automatski podešavati odabrani algoritam što ih više budete uvježbavali.

Korak 5: Evaluacija

Morat ćete provjeriti stvoreni stroj prema vašem skupu podataka za procjenu koji sadrži ulaze koje model ne poznaje i provjeriti preciznost vašeg već uvježbanog modela. Ako je točnost manja ili jednaka 50%, taj model neće biti koristan jer bi to bilo poput bacanja novčića za donošenje odluka. Ako dosegnete 90% ili više, možete imati dobro povjerenje u rezultate koje vam model daje.

Korak 6: Podešavanje parametara

Ako tijekom evaluacije niste dobili dobra predviđanja i vaša preciznost nije minimalna željena, moguće je da imate problema s pretjeranim ili nedovoljnim uklapanjem i morate se vratiti na korak obuke prije izrade nove konfiguracije parametara u vašem modelu. Možete povećati broj ponavljanja vaših podataka o vježbanju nazvanih epohe. Drugi važan parametar je onaj poznat kao “stopa učenja”, što je obično vrijednost koja množi gradijent kako bi se postupno približio globalnom ili lokalnom minimumu kako bi se smanjio trošak funkcije.

Povećanje vaših vrijednosti za 0.1 jedinice iz 0.001 nije isto jer to može značajno utjecati na vrijeme izvođenja modela. Također možete navesti najveću dopuštenu pogrešku za vaš model. Možete ići od nekoliko minuta do sati, pa čak i dana, da osposobite svoj stroj. Ovi parametri se često nazivaju hiperparametri. Ovo “ugađanje” još uvijek je više umjetnost nego znanost i poboljšavat će se kako budete eksperimentirali. Obično postoji mnogo parametara za podešavanje, a kada se kombiniraju mogu pokrenuti sve vaše mogućnosti. Svaki algoritam ima svoje parametre za podešavanje. Da spomenemo još neke, u umjetnim neuronskim mrežama (ANN) morate definirati u njihovoj arhitekturi broj skrivenih slojeva koje će imati i postupno testirati s više ili manje i s koliko neurona svaki sloj. Ovo će biti rad s velikim naporom i strpljenjem da bi se postigli dobri rezultati.

Korak 7: Predviđanje ili zaključivanje

Sada ste spremni koristiti svoj model strojnog učenja za zaključivanje rezultata u scenarijima iz stvarnog života.