Napomena: Sljedeći članak će vam pomoći: Modeliranje ansambla objašnjeno kroz glazbu
Sesiju “Glazbenici i podatkovni znanstvenici stvaraju hitove s ansamblima” na Deep Learning DevCon (DLDC) 2020 predstavili su Loveesh Bhatt koji je viši menadžer za analitiku u Ugamu i Arpita Sur, koji je AVP / voditelj kognitivnog računalnog sustava u Ugamu .
Primarni aspekt razgovora je kako znanstvenici podataka mogu iskoristiti naslagane ansamble za poboljšanje izvedbe prediktivnih modela. Konferencija DLDC 2020, zakazana za 29. i 30. listopada, okupila je vodeće stručnjake kao i najbolje umove industrije dubokog učenja i strojnog učenja iz cijelog svijeta.
Sesija je započela sviranjem popularne pjesme Coldplaya i Chainsmokersa pod nazivom “Something Just Like This” dvaput, jednom u akustičnoj verziji, a drugom u originalu. Ideja iza sviranja dviju verzija pjesama bila je da, iz perspektive strojnog učenja, akustična verzija predstavlja jednostavan model strojnog učenja temeljen na linearnoj regresiji. S druge strane, izvorni je predstavljao fuziju GBM-a i modela slučajne šume, koji ima mogućnosti za stvaranje snažnog modela strojnog učenja.
Bhatt je zatim ukratko objasnio što modeliranje ansambla znači i zašto bi se trebalo koristiti. Izjavio je da je to kombinacija više učenika kako bi postali bolji u predviđanju. Tri metodologije koje se obično koriste su: pakiranje, povećanje i slaganje.
Skupni model pomaže kod pretjeranog uklapanja, kao što je visoka varijanca, kao i premalo uklapanja, kao što su problemi s velikom pristranošću. Spajanje u vrećice pomaže u ublažavanju problema visoke varijance, a povećanje pomoći u ublažavanju problema velike pristranosti.
Govoreći o metodologijama, Bhatt je dalje objasnio vrste pojačanja koje uključuje AdaBoost, CatBoost, Gradient Boosting i Xtreme Gradient Boosting. O trećoj metodologiji, Stacking, Bhatt je raspravljao o tome da se razlikuje od bagging-a i boosting-a u dvije ključne točke-
- Stacking često uzima u obzir heterogene slabe učenike, dok bagging i boosting uglavnom razmatraju homogene slabe učenike. Višerazinsko slaganje kombinira snagu modela osnovnog sloja i koristi drugi sloj koji se naziva meta-sloj za poboljšanje ukupne izvedbe modela.
Nakon rasprave o metodologijama, Bhatt je zatim spomenuo neke od primjena skupnog modeliranja, koje uključuje modeliranje potencijalnih kupaca, klasifikaciju, regresiju vrijednosti narudžbe kupaca, mapiranje i procjenu uspješnosti kampanje, modeliranje skuplje i dodatne prodaje, modeliranje odljeva i otkrivanje prijevara i anomalija.
Nakon slučajeva korištenja, Sur je posebno govorio o jednom od slučajeva korištenja koji se implementiraju u Ugamu, a to je klasifikacija i bavi se računalnim vidom. Sur je izjavio da se Computer Vision razlikuje od drugih tehnika strojnog učenja i uključuje višestruke aplikacije, kao što su otkrivanje objekata, prepoznavanje objekata, identifikacija objekata, klasifikacija objekata i više. Takve se aplikacije mogu primijeniti u širokom rasponu slučajeva upotrebe, uključujući digitalizaciju, konkurentsku inteligenciju i ekstrakciju informacija.
Sur je zatim objasnio jednu od studija slučaja u Ugamu, koja koristi skupne modele za poboljšanje klasifikacije slika. Ovdje ona objašnjava kako poboljšanje iskustva i pretvorbe na stranicama e-trgovine zahtijeva prikladne opise proizvoda.
Također je raspravljala o tome kako se modeli računalnog vida mogu uvježbati da izvlače uzorke, boje i druge atribute iz slika s visokom razinom točnosti. Sur je zaključio govor raspravom o razlici između strojnog učenja i transfernog učenja i objasnio tipičnu arhitekturu ImageNet modela, koji je Inception V3.