diff options
Diffstat (limited to 'rapport.tex')
| -rw-r--r-- | rapport.tex | 10 |
1 files changed, 1 insertions, 9 deletions
diff --git a/rapport.tex b/rapport.tex index da63ccc..a13a879 100644 --- a/rapport.tex +++ b/rapport.tex @@ -143,14 +143,6 @@ R_T &= \text{Perte accumulée par le joueur jusqu'à l'instant T}\\ La borne sur les fonctions de perte nous assure que $R_T=O(T)$. On cherche des bornes qui assurent que le regret rapporté au nombre de tour tend vers 0, c'est à dire $R_T=o(T)$. Pour cela, on utilise une stratégie qui dépend de l'ensemble $\mathcal{A}$, de l'information révélée, et du comportement de l'environnement. Ces stratégies seront définies et étudiées dans les sections suivantes. -\subsection*{Remerciements} - -Je tiens à remercier vivement Gilles Stoltz pour m'avoir encadré tout au long -de ce mémoire. Son soutien dynamique, ses remarques pertinentes et sa patience -dans une période pourtant très chargée pour lui, m'ont été précieux pour mener à -bien ce travail et je suis persuadé que ses conseils me seront très utiles dans -la suite de mes études. - \newpage \section{Prévision dans un univers fini} @@ -1111,7 +1103,7 @@ gradient tiré de \cite{zink}. \item Le joueur choisit un vecteur $x_t\in C$. \item Simultanément, l'adversaire choisit une fonction de perte convexe $\ell_t : C\to\set{R}^+$. -\item Le joueur et l'environnement observent la fonction $\ell_t$ et le +\item Le joueur et l'environnement observent la fonction $\ell_t$ et le joueur reçoit la perte $\ell_t(x_t)$. \end{itemize} \end{encadre} |
