aboutsummaryrefslogtreecommitdiffstats
path: root/doc
diff options
context:
space:
mode:
Diffstat (limited to 'doc')
-rw-r--r--doc/rapport.tex18
1 files changed, 15 insertions, 3 deletions
diff --git a/doc/rapport.tex b/doc/rapport.tex
index 8876ed9..cb72f78 100644
--- a/doc/rapport.tex
+++ b/doc/rapport.tex
@@ -156,7 +156,7 @@ On a vu dans la section précédente que les $q_i$ optimaux dépendent de la sui
sachant $X\in A_{i}$. Mais si ces variances sont inconnues il nous faut les estimer. On ne peut trouver la répartition optimale de tirages à faire par strates
du premier coup. On utilisera donc un algorithme adaptatif. On commence par tirer un nombre $N_1$ assez restreint de variables $(X_{i})_{1\leq i \leq I}$
en choisissant une répartition déterministe, par exemple la répartition uniforme $q_i=\frac{N_1}{I}$ ce qui nous donnera un premier estimateur de $\mu=\E(f(X))$ mais
-surtout les premiers estimateurs de $\sigma_{i}$. Ensuite on pourra tirer un nombre $N_2 > N_1$ de $(X_{i})$ avec de nouveaux $q_i$ donnés par \eqref{eqqi}
+surtout les premiers estimateurs de $\sigma_i$. Ensuite on pourra tirer un nombre $N_2 > N_1$ de $(X_i)$ avec de nouveaux $q_i$ donnés par \eqref{eqqi}
ce qui nous donnera un nouvel estimateur de $\mu$ (en utilisant les $N_1 + N_2$ premières valeurs) puis de nouveaux $q_i$ plus précis, et ainsi de suite.
Essayons maintenant de décrire plus précisément comment calculer précisément la proportion de tirages à allouer par strates. En effet, il y a deux contraintes
@@ -187,14 +187,26 @@ on voit qu'un choix de $m_i^k$ idéal serait :
\forall i \in I \quad (m_i^k)^* = \frac{p_i\hat{\sigma}_i^{k-1}}{\sum_{j=1}^Ip_j\hat{\sigma}_j^{k-1}}(N^k-N^{k-1}-I)
\end{equation*}
Pour que les $m_i^k$ soit les entiers au plus près de leurs valeurs optimales tout en assurant que leur somme ne dépasse pas le nombre total de tirages à faire
-à l'étape k. On pose $m_1^k =\floor{(m_1^k)^*}$. Puis pour chaque $i>1$ on pose
+à l'étape k. On pose $m_1^k =\floor{(m_1^k)^*}$. Puis pour chaque $i>1$ on pose :
+\begin{equation*}
+m_i^k=\floor{(m_1^k)^*+\ldots+(m_i^k)^*}-\floor{(m_1^k)^*+\ldots+(m_{i-1}^k)^*}
+\end{equation*}
+Ce choix des $m_i^k$ assure que notre nombre de tirages par strates sera à une distance d'au plus $1$ de l'allocation optimale.
+
+Étoré et Jourdain prouvent enfin le résultat suivant qui est un théorème centrale limite pour la loi limite de leur estimateur $\mu_{strat}$.
+Si $\E[f^2(X)]<\infty$ et si $k/N ^k\to0$ quand $k\to0$ alors :
+\begin{equation*}
+\sqrt{N^k}(\mu_{strat}^k-\mu)\overset{en loi}{\to}\mathcal{N}(0,\sigma^2_*)
+\end{equation*}
+où $\sigma^2_*$ désigne la borne inférieur de $\textrm{Var}(\mu_{strat})$ trouvée plus haut.
\section{Exemples}
+Nous allons maintenant implémenter et comparer les deux techniques d'estimateur d'espérance sur deux exemples décrit dans \cite{etore:hal-00192540}
\subsection{Calcul de l'espérance d'une loi normale}
Dans ce premier exemple assez simple, on va chercher à calculer $ \mu = \E[X]$ où $X$ suit une loi normale centrée réduite
\subsubsection{Échantillonnage stratifié}
Pour cet exemple, les strates $A_i$ seront au nombre de $10$ et
-\[\forall i \in{\{1,...,10\}}\quad A_i =]y_{i-1}, y_i]
+\[\forall i \in{\{1,\ldots,10\}}\quad A_i =]y_{i-1}, y_i]
\]
où $y_i$ désigne
le quantile en $i/10$ d'une loi normale, en prenant pour convention $y_0 = - \infty $ et $y_{10} = + \infty $. Ainsi la suite des probabilités $(p_i)_{1\leq i\leq 10}$