202206141826

2022-06-14 18:27:01 +02:00 · 2022-06-14 18:27:01 +02:00 · ee68dccbe9
commit ee68dccbe9
parent f57b81be21
6 changed files with 97 additions and 6 deletions
--- a/09_puissance_iteree_valeur_propre.Rmd
+++ b/09_puissance_iteree_valeur_propre.Rmd
@ -36,10 +36,10 @@ Considérons la séquence $\mathbf{u^{(0)}}, \mathbf{A}\mathbf{u^{(0)}}, \mathbf

 \begin{equation}
 \mathbf{A}^m\mathbf{u^{(0)}} = \lambda_1^m \mathbf{u_1} + \lambda_2^m \mathbf{u_2} + \dots + \lambda_r^m \mathbf{u_r}
-\label{eq:1}
+\label{eq:09_1}
 \end{equation}

-Supposons par ailleurs que les valeurs propres soient ordonnées et que la première valeur propre soit strictement la plus grande en valeur absolue : $|\lambda_1|>|\lambda_2|\geq\dots\geq|\lambda_r|$. En divisant les deux membres de l'égalité (\ref{eq:1}) par $\lambda_1^m$, nous avons :
+Supposons par ailleurs que les valeurs propres soient ordonnées et que la première valeur propre soit strictement la plus grande en valeur absolue : $|\lambda_1|>|\lambda_2|\geq\dots\geq|\lambda_r|$. En divisant les deux membres de l'égalité (\ref{eq:09_1}) par $\lambda_1^m$, nous avons :
 \[
 (\lambda_1^{-1}\mathbf{A})^m\mathbf{u^{(0)}}=\mathbf{u_1} + \sum_{i=2}^{r}\left(\frac{\lambda_i}{\lambda_1}\right)^m\mathbf{u_i}
 \]
--- a/18_kernel_ridge_regression.Rmd
+++ b/18_kernel_ridge_regression.Rmd
@ -33,7 +33,7 @@ plot(x=d, y=k(1,d), type="l")
 Nous proposons ensuite de représenter la relation entre les observations et la cible par une combinaison linéaire des similarités d'une nouvelle observation $\mathbf{x}$ avec chaque observation du jeu d'entraînement :
 \begin{equation}
 f(\mathbf{x}) = \sum_{i=1}^{n} \alpha_i k(\mathbf{x},\mathbf{x_i})
-\label{eq:1}
+\label{eq:18_1}
 \end{equation}
 Plus $\mathbf{x}$ est proche de $\mathbf{x_i}$, plus $\mathbf{x_i}$ pèse dans le calcul de la valeur prédite pour $\mathbf{x}$.
 Chaque $k(\cdot,\mathbf{x_i})$ est une fonction gaussienne et $f$ est une superposition de fonctions gaussiennes.
@ -108,7 +108,7 @@ $$
 & \hat{y} = \sum_{i=1}^{n} \alpha_i k(\mathbf{x},\mathbf{x_i}) \\
 \end{aligned}
 $$
-Nous retrouvons l'équation (\ref{eq:1}). Nous pouvons écrire ce résultat sous forme matricielle en introduisant la matrice noyau $\mathbf{K}$.
+Nous retrouvons l'équation (\ref{eq:18_1}). Nous pouvons écrire ce résultat sous forme matricielle en introduisant la matrice noyau $\mathbf{K}$.
 $$
 \begin{aligned}
 & \hat{y} = \sum_{i=1}^{n} \alpha_i k(\mathbf{x},\mathbf{x_i}) \\
--- a/19_nystroem_approximation.Rmd
+++ b/19_nystroem_approximation.Rmd
@ -162,7 +162,7 @@ $$
 \end{aligned}
 $$

-## Calcul de l'approximation de Nyström dans le cadre d'une régression ridge à noyau
+## Régression ridge à noyau et approximation de Nyström

 Dans le cadre de la régression ridge à noyau (voir un précédent module), nous notons : $\mathbf{G} = \mathbf{K} + \lambda\mathbf{I_n}$. Les coefficients du modèle ridge sont alors donnés par : $\boldsymbol\alpha_\lambda = \mathbf{G}^{-1} \mathbf{y}$. Nous cherchons à calculer efficacement $\mathbf{G}^{-1}$ à partir d'une approximation Nyström de rang $m$ de $\mathbf{K} \approx \mathbf{L}\mathbf{L}^T$. Pour ce faire, nous utilisons une forme de l'identité de Woodbury :
 $$
--- a/23_exercices.R
+++ b/23_exercices.R
@ -0,0 +1,85 @@
+rm(list=ls())
+set.seed(1123)
+
+source('15_loocv.R')
+
+multdiag <-
+function(X,d)
+{
+  R <- matrix(NA, nrow=dim(X)[1], ncol=dim(X)[2])
+  for (i in 1:dim(X)[2]) { R[,i]=X[,i]*d[i] }
+  return(R)
+}
+
+n <- 700
+p <- 55
+
+sd <- 6 # standard deviation for zero-mean gaussian noise
+X <- matrix(runif(n*p),nrow=n,ncol=p)
+X <- scale(X)
+beta <- runif(p, min=-10, max=10)
+y <- X%*%beta + rnorm(n, mean=0, sd=sd)
+
+lambdas <- 10^seq(-1,3,by=0.2)
+
+var <-
+function(lambda)
+{
+  d <- (Xs$d^2)/(Xs$d^2 + lambda)^2
+  var <- multdiag(Xs$v,d)
+  var <- sd^2 * tcrossprod(var,Xs$v)
+}
+
+bias <-
+function(lambda)
+{
+  d <- lambda/(Xs$d^2+lambda)
+  bias <- multdiag(Xs$v,d)
+  bias <- bias %*% crossprod(Xs$v,beta)
+}
+
+epeVar <-
+function(lambda)
+{
+  var <- var(lambda)
+  return( mean(rowSums(X*(X%*%var))) )
+}
+
+epeBias <-
+function(lambda)
+{
+  bias <- bias(lambda)
+  return( mean((X%*%bias)^2) )
+}
+
+epe <-
+function(lambda)
+{
+  return( epeVar(lambda) + epeBias(lambda) + sd^2 )
+}
+
+#rm <- ridge(X, y, lambdas)
+#Xs <- svd(X)
+#epes <- sapply(lambdas, epe)
+
+X.init <- X
+beta.init <- beta
+
+ps <- seq(1,p)
+lps <- length(ps)
+epes <- numeric(lps)
+biass <- numeric(lps)
+vars <- numeric(lps)
+maes <- numeric(lps)
+
+for (k in ps)
+{
+  X <- X.init[,1:k]
+  beta <- beta.init[1:k]
+  rm <- ridge(X, y, lambdas)
+  Xs <- svd(X)
+  epes[k] <- epe(rm$lambda)
+  biass[k] <- epeBias(rm$lambda)
+  vars[k] <- epeVar(rm$lambda)
+  maes[k] <- rm$mae
+}
--- a/4
+++ b/4
@ -0,0 +1,4 @@
+#!/bin/bash
+
+arg="library(bookdown);bookdown::preview_chapter(\"$1\")"
+Rscript -e $arg
--- a/pad.R
+++ b/pad.R
@ -1,4 +1,6 @@
 # Font /mnt/font/InputMonoNarrow-Regular/20a/font
 # rm(list=ls())
 # bookdown::render_book()
-# :/^\#
+# :/^\#
+
+# bash make_chapter 19_nystroem_approximation.Rmd