Brauche ganz kurz einen Hinweis.
erfuellt diese Formel a(t) = 100/(100+t)
folgende Bedingung?
Summe(t=0 bis inf) [a(t)] > inf
und
Summe(t=0 bis inf) [a(t)²] < inf?
Danke^^
Brauche ganz kurz einen Hinweis.
erfuellt diese Formel a(t) = 100/(100+t)
folgende Bedingung?
Summe(t=0 bis inf) [a(t)] > inf
und
Summe(t=0 bis inf) [a(t)²] < inf?
Danke^^
Math, Science, History, unraveling the mysteries
Barenaked Ladies - Big Bang Theory
Hinweis: Bei der ersten Summe soll bestimmt -inf oder < inf stehen.
Beide Male ja. Willst du auch ne Begründung?
Edit: Pollys Bemerkung ist richtig. Vielleicht soll es auch = inf heißen
ohja = inf, > inf geht ja nicht
ausserdem ist t element N.
< inf darf das erste auf keinen Fall sein. Es geht um Reinforcement-learning und der Q-algorithmus konvergiert nur gegen die optimale Q-Funktion wenn eben diese Learningratefunktion a so gewaehlt wird, dass die Summe ueber alle Zeitpunkte unendlich ist und die Summe ueber die Quadrate gegen irgendeine reele Zahl konvergiert.
Und meine Frage ist ob das bei a(t) = k/(k+t) mit k als Konstante der Fall ist.
Math, Science, History, unraveling the mysteries
Barenaked Ladies - Big Bang Theory
Die unendliche Summe [k/(k+t)]² konvergiert für alle natürlichen k gegen k*Pi²/6 - [Summe über alle 1/t² von 1 bis k]
Da bin ich zumindest ziemlich sicher
gut, nur muss die erste Bedingung auch erfuellt sein, sonst lernt der Computer evtl schrott^^
Math, Science, History, unraveling the mysteries
Barenaked Ladies - Big Bang Theory