Kaip Lstm apskaičiuoja parametrų skaičių?
Kaip Lstm apskaičiuoja parametrų skaičių?

Video: Kaip Lstm apskaičiuoja parametrų skaičių?

Video: Kaip Lstm apskaičiuoja parametrų skaičių?
Video: Long Short-Term Memory (LSTM), Clearly Explained 2024, Lapkritis
Anonim

Taigi, pagal savo vertybes. Įvedus jį į formulę gaunama:->(n=256, m=4096), iš viso parametrų skaičius yra 4*((256*256) + (256*4096) + (256)) = 4*(1114368) = 4457472. numerį svorių yra 28 = 16 (vienetų_skaičius * vienetų_skaičius) pasikartojantiems ryšiams + 12 (įvesties_dim * vienetų_skaičius) įvesties atveju.

Taip pat paklausta, kaip rasti parametrų skaičių?

Į apskaičiuoti mokomasis parametrus čia tereikia padauginti iš pločio m formos, aukščio n ir atsižvelgti į visus tokius filtrus k. Nepamirškite kiekvieno filtro šališkumo termino. Parametrų skaičius CONV sluoksnyje būtų: ((m * n)+1)*k), pridėtas 1 dėl kiekvieno filtro poslinkio termino.

Panašiai, kiek paslėptų vienetų turi Lstm? An LSTM tinklą. Tinklas turi penkis įėjimus vienetų , a paslėptas sluoksnis sudarytas iš dviejų LSTM atminties blokai ir trys išėjimai vienetų . Kiekviename atminties bloke yra keturi įėjimai, bet tik vienas išėjimas.

Vėliau taip pat galima paklausti, kaip rasti parametrų skaičių RNN?

1 atsakymas. Objektai W, U ir V yra bendrinami visuose etapuose RNN ir tai vieninteliai parametrus paveikslėlyje aprašytame modelyje. Vadinasi parametrų skaičius reikia išmokti treniruojantis = dim(W)+dim(V)+dim(U). Remiantis klausimo duomenimis, tai = n2+kn+nm.

Kiek sluoksnių turi Lstm?

Apskritai, 2 sluoksniai parodė, kad jų pakanka sudėtingesnėms funkcijoms aptikti. Daugiau sluoksniai gali būti geresnis, bet ir sunkiau treniruojamas. Bendra taisyklė – 1 paslėptas sluoksnis dirbti su tokiomis paprastomis problemomis, kaip ši, ir pakanka dviejų, kad būtų galima rasti pakankamai sudėtingų funkcijų.

Rekomenduojamas: