Vijesti o Tehnologiji, Recenzije i Savjeti!

Koje čimbenike uzeti u obzir pri odabiru modela nadziranog učenja?

Napomena: Sljedeći članak će vam pomoći: Koje čimbenike uzeti u obzir pri odabiru modela nadziranog učenja?

Odabir pravog modela za probleme strojnog učenja vrlo je važan. Ispravan odabir dovodi do boljih performansi i točnih rezultata, a time i povjerenja u predviđanja. Ili možemo ići s pokušajem i upotrijebiti sve moguće modele, ali to će biti dugotrajan i računalno skup pristup. Dakle, bolje je da odlučimo koji će od modela biti prikladan za određeni problem. Postoje neki kriteriji i uvjeti koji se mogu uzeti u obzir na temelju kojih možemo odabrati modele. U ovom ćemo članku raspravljati o čimbenicima koje treba uzeti u obzir pri odabiru modela nadziranog učenja. Glavne točke o kojima će se raspravljati u članku navedene su u nastavku.

Sadržaj

    Čimbenici nadziranog učenja koje treba uzeti u obzir kod modela nadziranog učenja

      Kompromis varijance pristranosti Složenost funkcije Dimenzionalnost ulaznog prostora Šum ciljnih podataka Heterogeni podaci Interakcije neskladnih podataka i nelinearnosti u značajkama

Počnimo s razumijevanjem modela nadziranog učenja.

O modelu nadziranog učenja

U strojnom učenju, nadzirano učenje je vrsta učenja gdje su podaci koje koristimo nadzirani ili označeni. Modeli nadziranog učenja su modeli koji rade na temelju davanja izlaza koristeći ulaz u obliku podataka. U biti, možemo reći da se modeli koji su sposobni preslikati ulaz u izlaz na temelju znanja koje su stekli korištenjem nekih primjera mogu nazvati modelima nadziranog učenja. Izlaz koji daje model nadziranog učenja također se može smatrati zaključkom funkcije koja je generirana korištenjem označenih podataka o obuci.

Tražite li kompletan repozitorij Python biblioteka koje se koriste u znanosti o podacima, pogledajte ovdje.

U označenim podacima o obuci, svaki bi se uzorak trebao sastojati od ulazne podatkovne točke i izlazne podatkovne točke. Postoji nekoliko modela učenja pod nadzorom i ti modeli imaju različite algoritme i prirodu rada. Odabir bilo kojeg modela može se izvršiti na temelju podataka i potrebnih performansi.

Algoritmi unutar ovih modela mogu se nazvati algoritmima za nadzirano učenje i moraju biti sposobni raditi u okruženju za nadzirano učenje. Ovi su algoritmi dizajnirani za analizu podataka o obuci i prema analizi proizvode funkciju koja je sposobna mapirati neviđene primjere.

Ako algoritam može ispravno odrediti klase neviđenih primjera, tada ga možemo nazvati optimalnim algoritmom. Generiranje predviđanja pomoću algoritama nadziranog učenja vrši se generalizacijom podataka o obuci na neviđene scenarije na razumne načine.

Postoje razne vrste algoritama za nadzirano učenje i mogu se koristiti u raznim vrstama programa za nadzirano učenje. U generalizaciji, uglavnom radimo s dvije vrste problema:

    Regresijska analiza Klasifikacijska analiza

Neki od modela za regresijsku analizu su sljedeći:

    Linearna regresija Multilinearna regresija Modeliranje vremenskih nizova Neuralne mreže

Neki od modela za klasifikacijsku analizu su sljedeći:

    Slučajna šuma Stabla odlučivanja Naivna pristranost Neuralne mreže Logistička regresija

Međutim, u nedavnom scenariju možemo biti svjedoci korištenja modela klasifikacije u regresijskoj analizi ili obrnuto, ali to također treba izvesti neke od promjena u algoritmu tih modela.

Svi ovi algoritmi su najbolji na svom mjestu ako se pravilno koriste, au ovom članku naš glavni fokus je na tome kako možemo odabrati modele za naše projekte ili možemo reći da ćemo raspravljati o točkama koje čine model koji treba odabrati za naš rad . Idemo prema sljedećem odjeljku.

Odabir modela nadziranog učenja

U gornjem odjeljku možemo vidjeti primjer modela nadziranog učenja. Gore navedenih naziva vrlo je malo, što znači da se mogu koristiti različite opcije za izvođenje nadziranog učenja. Budući da nijedan model ne funkcionira najbolje za sve probleme, jedna stvar koja pada na pamet je kako možemo odabrati jedan optimalan model za naše probleme. Pri odabiru modela potrebno je uzeti u obzir razne kriterije i uvjete. Neki od njih su sljedeći:

Ovo je naš prvi koncept koji uglavnom govori o fleksibilnosti modela. Dok prilagođavamo podatke, jedan model pokušava naučiti podatke mapiranjem podatkovnih točaka. Geometrijski možemo reći da model odgovara području ili liniji koja pokriva sve podatkovne točke kao što je prikazano na sljedećoj slici

Na gornjoj slici crvena linija predstavlja model, a plave točke su podatkovne točke. Ovo je jednostavan model linearne regresije i stvari postaju kritične kada model postane pristran prema vrijednosti ulaza umjesto da bude pristran prema svakoj podatkovnoj točki ili klasi. U ovoj situaciji, rezultat koji daje model bit će netočan.

Slično, ako model postane visoka varijanca za vrijednost ulaza, što znači da će dati različite izlaze za jedan ulaz dok se primjenjuje različito vrijeme. Ovo je također netočan način modeliranja. Situacija pristranosti događa se kada model nije fleksibilan, a situacija varijance se događa kada je model vrlo fleksibilan.

Odabrani model treba biti između vrlo fleksibilnog i nefleksibilnog. Pogreške u predviđanju klasifikatora neke su bile povezane sa zbrojem pristranosti i varijance modela. Model koji prilagođavamo podacima trebao bi moći prilagoditi kompromis između pristranosti i varijance.

Tehnike poput smanjenja dimenzionalnosti i odabira značajki mogu pomoći u smanjenju varijance modela, a neki od modela sa sobom nose parametre koji se mogu prilagoditi kako bi se održao kompromis između pristranosti i varijance.

Količina podataka za obuku usko je povezana s izvedbom bilo kojeg modela. Budući da model pod sobom nosi funkcije i ako su te funkcije jednostavne, tada model s niskom fleksibilnošću može bolje učiti iz male količine podataka.

Ali funkcije modela su složene, pa im je potrebna velika količina podataka za visoku izvedbu i točnost. U uvjetima kada su funkcije vrlo složene, modeli moraju biti fleksibilni s malom pristranošću i velikom varijancom.

Modeli kao što su slučajna šuma i strojevi za potporne vektore vrlo su složeni modeli i mogu se odabrati s visokodimenzionalnim podacima, a modeli s nisko složenim funkcijama su linearna i logistička regresija i mogu se koristiti s malim količinama podataka.

Budući da je niži izračun uvijek cijenjen način modeliranja, ne bismo trebali primjenjivati ​​modele sa složenim funkcijama u scenariju u kojem je količina podataka mala.

    Dimenzionalnost ulaznog prostora

U gornjem smo tekstu raspravljali o funkciji modela. Izvedba modela također ovisi o dimenzionalnosti ulaznih podataka. Ako su značajke podataka vrlo rijetke, učenje modela može biti loše čak i kada se funkcije modela oslanjaju na manji broj ulaznih značajki.

Vrlo je jednostavno razumjeti da visoka dimenzija unosa može zbuniti model nadziranog učenja. Dakle, u takvom scenariju gdje su dimenzije ulaznih značajki visoke, moramo odabrati one modele koji su fleksibilni za njihovo ugađanje tako da u postupku bude niska varijanca i visoka pristranost.

Međutim, tehnike poput inženjeringa značajki također su od pomoći ovdje jer te metode imaju sposobnost identificiranja relevantnih značajki iz ulaznih podataka. Također, znanje domene može pomoći u izdvajanju relevantnih podataka iz ulaznih podataka prije njihove primjene na modelu.

    Buka mete

U gornjem smo vidjeli kako dimenzionalnost ulaza utječe na performanse modela. Ponekad na performanse modela može utjecati i šum izlazne varijable ciljne varijable.

Vrlo je jednostavno razumjeti ako postoji netočnost u izlaznoj varijabli, tada će model koji primjenjujemo pokušati pronaći funkciju koja se može primijeniti da osigura traženi ishod i ponovno će model biti zbunjen. Uvijek smo dužni uskladiti modele na takav način da model ne pokušava pronaći funkciju koja točno odgovara primjerima obuke.

Biti vrlo pažljiv pri primjeni modela na podatke uvijek dovodi do pretjeranog prilagođavanja modela. Također, postojat će problem prekomjernog opremanja kada je funkcija koju model primjenjuje na podatke vrlo složena.

U tim situacijama od nas se zahtijevaju podaci koji imaju ciljnu varijablu koja se može lako modelirati. Ako to nije moguće, od nas se traži da prilagodimo model koji ima veću pristranost i manju varijancu.

Međutim, postoje tehnike poput ranog zaustavljanja koje mogu spriječiti prekomjerno opremanje i tehnike koje mogu otkriti i ukloniti šum ciljne varijable. Jedan od naših članaka sadrži informacije koje se mogu upotrijebiti za sprječavanje prekomjernog opremanja.

U gornjim odjeljcima raspravljali smo o dimenzionalnosti i šumu ulazne i ciljne varijable. U nekim scenarijima možemo otkriti da imamo podatke koji imaju značajke različitih vrsta kao što su diskretne, diskretno uređene, brojačke i kontinuirane vrijednosti.

Uz takve podatke, od nas se traži da primijenimo modele koji mogu koristiti funkciju udaljenosti ispod njih. Strojevi potpornih vektora s Gaussovim jezgrama i k-najbližim susjedima algoritmi su koji su primjeri takvih modela i mogu se primijeniti na heterogene podatke bez generaliziranja podataka.

U različitim uvjetima možemo vidjeti da podaci koje trebamo modelirati imaju značajke koje su međusobno visoko povezane, a jednostavni modeli nadziranog učenja imaju vrlo slabe rezultate s njima. U takvim uvjetima od nas se traži da koristimo modele koji mogu izvršiti regularizaciju. L1 regulacija, L2 regulacija i regulacija ispadanja su modeli koji se mogu koristiti u takvoj situaciji.

    Interakcije i nelinearnosti u značajkama

U nizu podataka nalazimo da svaka ulazna varijabla pojedinačno utječe na položaj izlaza. U takvim situacijama modeli s linearnom funkcijom i funkcijom udaljenosti mogu biti bolji. Modeli kao što su linearna regresija, logistička regresija, strojevi za potporne vektore i k-najbliži susjedi imaju takve funkcije. A u slučaju složene interakcije neuronske mreže i stabla odlučivanja su bolja opcija, zbog njihove sposobnosti pronalaženja interakcije.

Završne riječi

U ovom smo članku raspravljali o različitim kriterijima i uvjetima koje treba uzeti u obzir pri odabiru modela nadziranog učenja. Budući da postoje različite situacije modeliranja, izbor modela je vrlo složen zadatak, trebali bismo znati gdje koristiti koji model.

Table of Contents