summaryrefslogtreecommitdiffstats
path: root/rapport.tex
diff options
context:
space:
mode:
authorThibaut Horel <thibaut.horel@gmail.com>2012-02-17 21:11:32 -0800
committerThibaut Horel <thibaut.horel@gmail.com>2012-02-17 21:11:32 -0800
commit3eb4f9d35f3a2ef259991d6c4a699f76dc926a60 (patch)
tree2a4e77ea653dbd8a7cbc81912c9e6aa6ac3bc52f /rapport.tex
parentfd8e2555137082f0306fcf120afa77c7c6cd7a0e (diff)
downloadbandits-3eb4f9d35f3a2ef259991d6c4a699f76dc926a60.tar.gz
Remove acknowledgments.
Diffstat (limited to 'rapport.tex')
-rw-r--r--rapport.tex10
1 files changed, 1 insertions, 9 deletions
diff --git a/rapport.tex b/rapport.tex
index da63ccc..a13a879 100644
--- a/rapport.tex
+++ b/rapport.tex
@@ -143,14 +143,6 @@ R_T &= \text{Perte accumulée par le joueur jusqu'à l'instant T}\\
La borne sur les fonctions de perte nous assure que $R_T=O(T)$. On cherche des bornes qui assurent que le regret rapporté au nombre de tour tend vers 0, c'est à dire $R_T=o(T)$. Pour cela, on utilise une stratégie qui dépend de l'ensemble $\mathcal{A}$, de l'information révélée, et du comportement de l'environnement. Ces stratégies seront définies et étudiées dans les sections suivantes.
-\subsection*{Remerciements}
-
-Je tiens à remercier vivement Gilles Stoltz pour m'avoir encadré tout au long
-de ce mémoire. Son soutien dynamique, ses remarques pertinentes et sa patience
-dans une période pourtant très chargée pour lui, m'ont été précieux pour mener à
-bien ce travail et je suis persuadé que ses conseils me seront très utiles dans
-la suite de mes études.
-
\newpage
\section{Prévision dans un univers fini}
@@ -1111,7 +1103,7 @@ gradient tiré de \cite{zink}.
\item Le joueur choisit un vecteur $x_t\in C$.
\item Simultanément, l'adversaire choisit une fonction de perte convexe $\ell_t
: C\to\set{R}^+$.
-\item Le joueur et l'environnement observent la fonction $\ell_t$ et le
+\item Le joueur et l'environnement observent la fonction $\ell_t$ et le
joueur reçoit la perte $\ell_t(x_t)$.
\end{itemize}
\end{encadre}