Road to AMI Labs

Vectors

Algèbre linéaire·Bloom 2

Chapitre 1 · Leçon 1

Vecteurs et espaces vectoriels

Le problème : comment représenter une image pour un ordinateur ?

Tu prends une photo de ton chat avec ton téléphone. L'image fait 224×224 pixels, chaque pixel a 3 canaux (rouge, vert, bleu), chaque canal est un nombre entre 0 et 255. Au total, c'est 150,528 nombres. Comment un réseau de neurones peut-il "comprendre" cette image ?

La réponse : il la traite comme un vecteur — une liste ordonnée de nombres dans un espace de très haute dimension. Toute l'algèbre linéaire du deep learning part de là.

Key Idea

Un vecteur est une liste ordonnée de nombres. En deep learning, tout est un vecteur : les images, les embeddings, les poids du modèle, les gradients. Maîtriser les vecteurs, c'est maîtriser le langage du deep learning.

Qu'est-ce qu'un vecteur ?

Des coordonnées GPS aux embeddings

Quand tu donnes ta position GPS, tu donnes deux nombres : latitude et longitude. C'est un vecteur en 2D : $\mathbf{x} = [48.8566, 2.3522]^T$ (Paris). Si tu ajoutes l'altitude, c'est un vecteur en 3D. Un embedding de VICReg, c'est la même chose — mais en .

Vecteurs et espaces vectoriels

Le problème : comment représenter une image pour un ordinateur ?

La réponse : il la traite comme un vecteur — une liste ordonnée de nombres dans un espace de très haute dimension. Toute l'algèbre linéaire du deep learning part de là.

Key Idea

Qu'est-ce qu'un vecteur ?

Des coordonnées GPS aux embeddings

Objet	Dimension	Exemple
Image MNIST	784	28×28 pixels en niveaux de gris
Image ImageNet	150,528	224×224×3 pixels RGB
Embedding VICReg	2,048	Sortie du ResNet-50
Embedding I-JEPA	1,280	Sortie du ViT-H/16
Token GPT-4	~12,288	Dimension cachée estimée

Valeur	Signification
1	Vecteurs identiques (même direction)
0	Vecteurs orthogonaux (aucune relation)
-1	Vecteurs opposés

Métrique	Sensible à la magnitude ?	Utilisée dans
Distance euclidienne $\\|\mathbf{a} - \mathbf{b}\\|^2$	Oui	VICReg (terme d'invariance), I-JEPA (prediction loss)
Cosine similarity	Non	SimCLR, MoCo, CLIP

Opération	Formule	Rôle en deep learning
Addition	$\mathbf{a} + \mathbf{b}$	Skip connections (ResNet)
Mise à l'échelle	$\alpha \mathbf{x}$	Learning rate, weight decay
Produit scalaire	$\mathbf{a} \cdot \mathbf{b}$	Attention (Q·K), similarité
Norme	$\\|\mathbf{x}\\|$	Normalisation, détection de collapse
Cosine similarity	$\frac{\mathbf{a} \cdot \mathbf{b}}{\\|\mathbf{a}\\|\\|\mathbf{b}\\|}$	InfoNCE loss (SimCLR, MoCo)
Distance euclidienne	$\\|\mathbf{a} - \mathbf{b}\\|^2$	VICReg invariance, I-JEPA prediction
Projection	$\text{proj}_\mathbf{b}(\mathbf{a})$	Predictor dans JEPA

Concept	Essentiel à retenir
Vecteur	Liste ordonnée de nombres — tout en DL est un vecteur
Produit scalaire	Mesure la similarité directionnelle entre deux vecteurs
Norme L2	"Longueur" du vecteur — le collapse = norme → 0
Cosine similarity	Similarité normalisée ∈ [-1, 1] — cœur du contrastive learning
Distance euclidienne	Utilisée par VICReg et I-JEPA (pas la cosine)
Rang	Nombre de dimensions effectivement utilisées — collapse = rang faible
Haute dimension	L'intuition 3D ne marche plus — concentration de la mesure

Vectors

Vecteurs et espaces vectoriels

Qu'est-ce qu'un vecteur ?

Vectors

Vecteurs et espaces vectoriels

Qu'est-ce qu'un vecteur ?

Notation

Opérations fondamentales sur les vecteurs

Addition et mise à l'échelle

Le produit scalaire : mesurer la similarité

La norme : mesurer la "taille" d'un vecteur

Cosine similarity : la mesure de similarité standard

Distance euclidienne vs cosine similarity

Espaces vectoriels : la structure mathématique

Indépendance linéaire et rang

Projection et orthogonalité

Vecteurs en haute dimension : l'intuition qui change

Application : les embeddings dans le self-supervised learning

Références