Wanneer gebruik je l1 en l2 regularisatie?

Wanneer gebruik je l1 en l2 regularisatie?
Wanneer gebruik je l1 en l2 regularisatie?
Anonim

Vanuit praktisch oogpunt heeft L1 de neiging de coëfficiënten tot nul te verkleinen, terwijl L2 de neiging heeft de coëfficiënten gelijkmatig te verkleinen. L1 is daarom handig voor het selecteren van kenmerken, omdat we alle variabelen kunnen laten vallen die zijn gekoppeld aan coëfficiënten die naar nul gaan. L2 is daarentegen handig als je collineaire/codependente kenmerken hebt.

Wat is het nut van regularisatie Wat zijn L1- en L2-regularisatie?

L1-regularisatie geeft uitvoer in binaire gewichten van 0 tot 1 voor de kenmerken van het model en wordt gebruikt voor het verminderen van het aantal kenmerken in een enorme dimensionale dataset. L2-regularisatie verspreidt de fouttermen in alle gewichten, wat leidt tot nauwkeuriger aangepaste definitieve modellen.

Wat zijn de verschillen tussen L1 en L2 regularisatie?

Het belangrijkste intuïtieve verschil tussen de L1- en T2-regularisatie is dat L1-regularisatie probeert de mediaan van de gegevens te schatten, terwijl de T2-regularisatie het gemiddelde van de gegevens probeert te schatten om overfitting te voorkomen. … Die waarde zal ook wiskundig gezien de mediaan van de gegevensdistributie zijn.

Wat is L1- en L2-regularisatie in deep learning?

L2 regularisatie is ook bekend als gewichtsverval omdat het de gewichten dwingt om naar nul te vervallen (maar niet precies nul). In L1 hebben we: Hierin bestraffen we de absolute waarde van de gewichten. In tegenstelling tot L2 kunnen de gewichten hier tot nul worden teruggebracht. Daarom is het erg handig wanneer we proberen te comprimerenons model.

Hoe werkt de regularisatie van L1 en L2?

Een regressiemodel dat de L1-regularisatietechniek gebruikt, wordt Lasso-regressie genoemd en een model dat L2 gebruikt, wordt Ridge-regressie genoemd. Het belangrijkste verschil tussen deze twee is de boetetermijn. Ridge-regressie voegt "kwadratische grootte" van de coëfficiënt toe als strafterm aan de verliesfunctie.