summaryrefslogtreecommitdiffstats
path: root/rapport.tex
diff options
context:
space:
mode:
Diffstat (limited to 'rapport.tex')
-rw-r--r--rapport.tex10
1 files changed, 1 insertions, 9 deletions
diff --git a/rapport.tex b/rapport.tex
index da63ccc..a13a879 100644
--- a/rapport.tex
+++ b/rapport.tex
@@ -143,14 +143,6 @@ R_T &= \text{Perte accumulée par le joueur jusqu'à l'instant T}\\
La borne sur les fonctions de perte nous assure que $R_T=O(T)$. On cherche des bornes qui assurent que le regret rapporté au nombre de tour tend vers 0, c'est à dire $R_T=o(T)$. Pour cela, on utilise une stratégie qui dépend de l'ensemble $\mathcal{A}$, de l'information révélée, et du comportement de l'environnement. Ces stratégies seront définies et étudiées dans les sections suivantes.
-\subsection*{Remerciements}
-
-Je tiens à remercier vivement Gilles Stoltz pour m'avoir encadré tout au long
-de ce mémoire. Son soutien dynamique, ses remarques pertinentes et sa patience
-dans une période pourtant très chargée pour lui, m'ont été précieux pour mener à
-bien ce travail et je suis persuadé que ses conseils me seront très utiles dans
-la suite de mes études.
-
\newpage
\section{Prévision dans un univers fini}
@@ -1111,7 +1103,7 @@ gradient tiré de \cite{zink}.
\item Le joueur choisit un vecteur $x_t\in C$.
\item Simultanément, l'adversaire choisit une fonction de perte convexe $\ell_t
: C\to\set{R}^+$.
-\item Le joueur et l'environnement observent la fonction $\ell_t$ et le
+\item Le joueur et l'environnement observent la fonction $\ell_t$ et le
joueur reçoit la perte $\ell_t(x_t)$.
\end{itemize}
\end{encadre}