Première partie
Cet article est tiré du numéro 10 de la revue Ccd & Telescope éditée par l'Association des Utilisateurs de Détecteurs Electroniques.
Une caméra CCD est avant tout un instrument de mesure, la grandeur physique observée étant le flux lumineux. Le lot commun des instruments de mesure est d'être imparfait et d'entacher d'une erreur plus ou moins grande les résultats qu'ils fournissent. Tout bon physicien travaille en connaissance de cause et précautionneusement accompagne les résultats expérimentaux de marges d'incertitudes. Par exemple au lieu d'annoncer lapidairement qu'une étoile se trouve à 13.3 années lumières, il est de loin plus rigoureux et honnête d'écrire 13.3 ± 1.2 années lumières. La fourchette de 1.2 années lumière permet d'apprécier du premier coup d'il la véracité de la mesure, de jauger la confiance que l'on peut lui accorder. En vérité, l'information sur la marge d'erreur est tout aussi indispensable que la mesure elle-même. Imaginez que l'erreur soit de 10 années lumières pour une distance mesurée de 13.3 années lumières : L'interprétation de la mesure est tout autre !
De quoi dépend la marge d'erreur et comment l'estimer ? La réponse à ces questions est un problème complexe, plus complexe parfois que la mesure elle-même. Pourtant l'enjeu est de taille, car identifier les causes d'erreurs, c'est se donner les moyens de réduire leur importance. On peut distinguer deux grandes familles : Les erreurs dites systématiques et les erreurs dites aléatoires.
Les erreurs systématiques sont généralement celles qui posent le moins de problèmes à cause de leur caractère déterministe. Supposez que l'instrument ajoute toujours, systématiquement si l'on préfère, une valeur constante à toutes les mesures qu'il réalise. Une simple opération de tarage sur un étalon permettra de connaître le niveau de cette erreur et de la retrancher aux données brutes pour les corriger. Avec une caméra CCD, cette opération de tarage s'appelle une calibration.
Les erreurs aléatoires posent un problème plus sérieux et même passablement désespérant car, par définition, il sera impossible de corriger une mesure instantanée. Nous verrons cependant plus loin qu'un traitement statistique d'un lot de plus plusieurs mesures du même phénomène permet d'accroître la précision. Le caractère imprévisible des erreurs aléatoires évoque un bruit, un peu comme celui qui recouvre le discours d'un interlocuteur noyé dans la rumeur d'un hall de gare. La marge d'erreur est alors désignée sous le nom de bruit de mesure. On dira encore que la mesure est bruitée. Le bruit peut donc être perçu comme un écart entre le signal effectivement observé et le signal réel, cet écart variant aléatoirement d'une mesure à l'autre.
Tout est source de bruit. Durant de longues années, la meilleure façon de détecter la variation d'éclat des étoiles était de les observer visuellement en les comparant les unes aux autres. Une technique fort délicate donnant une précision fortement assujettie à l'expérience et à la forme du moment de l'observateur. Une série d'événement (par exemple la réception de son tiers provisionnel), en apparence sans relation avec le phénomène observé (une étoile variable), était susceptible d'influencer la qualité du résultat. Prenons une autre illustration, plus proche de nos préoccupations. L'émission d'un photon par une source lumineuse est régie par un phénomène aléatoire en raison de l'origine quantique de la lumière (on parle de processus stochastique). Le phénomène persiste lorsque le flux de photons parvient au foyer du télescope, si bien que le signal lumineux se voit entaché d'un bruit : C'est le bruit de photon ou encore le bruit de signal. Pire, nous verrons plus loin que plus le flux optique est intense, plus le bruit est important. Ce résultat peut paraître déroutant au premier abord car il semble signifier qu'au fur et à mesure que nous observerons des objets plus lumineux, ou ce qui revient au même, que nous augmenterons la taille du télescope, nos mesures seront dégradées. Fort heureusement le signal et le bruit n'évoluent pas de concert proportionnellement et nous pouvons confirmer qu'un télescope est le meilleur moyen de voir des étoiles invisibles à l'oeil nu !
La valeur du bruit peut être calculée à partir d'un modèle mathématique dans lequel sont rassemblés les paramètres significatifs qui affectent la mesure. Le bruit peut aussi être relevé expérimentalement à partir d'une analyse statistique des données acquises. Une modélisation correcte suppose une bonne connaissance des mécanismes qui influencent la mesure et l'analyse statistique suppose que nous puissions acquérir suffisamment de mesures indépendantes de la grandeur observée. Suivant les cas, l'une ou l'autre de ces approches est praticable plus facilement et parfois les deux sont simultanément accessibles, ce qui offre la possibilité de vérifier la qualité de la modélisation ou de mettre en évidence une déficience instrumentale. Attachons-nous principalement ici à l'estimation expérimentale du bruit à partir d'un échantillon contenant un grand nombre de mesures du même phénomène, observé avec la même instrumentation. Quelle que soit la grandeur mesurée (des volts, des mètres, des watts, des photons, ) nous pouvons tracer un graphe dans lequel l'axe x est subdivisé en intervalles réguliers qui découpent en autant de tranches la gamme des valeurs mesurées. Portons sur l'axe y le nombre d'occurrences dans chacune des tranches. Si les subdivisions de l'axe x sont étroites, la courbe tend à devenir continu (voir courbe ci-après). Ce type de courbe représente la distribution des valeurs mesurées. Il apparaît que cette distribution est symétrique par rapport à la valeur moyenne des mesures et qu'elle tend à s'annuler lorsque l'on s'éloigne de cette moyenne. La courbe a une allure gaussienne et on l'appelle parfois courbe en cloche en raison de sa ressemblance avec le mélodieux instrument de musique. Elle traduit la distribution des mesures en fonction de leur valeur. Les mathématiciens se sont plongés depuis longtemps sur l'interprétation de ce type de distribution (et bien d'autres !). Une discipline est née de cela, c'est la statistique. Les statisticiens désignent par distribution normale la courbe que nous venons de tracer à partir des données de mesures. Elle illustre la densité de probabilité de nos mesures.
Exemple de courbe de densité de probabilité (ici la moyenne est nulle).
L'interprétation géométrique de la distribution normale est simple : la valeur située au pic de la courbe n'est autre que la moyenne de toutes les mesures. C'est à cet endroit que la densité de probabilité est maximale, ce qui signifie que la valeur moyenne est bien la valeur la plus probable de la quantité mesurée. En s'éloignant de la valeur moyenne, le nombre de points mesurés diminue régulièrement pour s'annuler quasi totalement. La dispersion des mesures autour de la valeur moyenne traduit la valeur du bruit. Si les points se regroupent, ce concentrent, autour de la valeur moyenne, le bruit de mesure est faible. Au contraire, si les points s'étalent largement, l'incertitude de mesure est grande, ou ce qui revient au même, le bruit est important. Donc, un moyen pour quantifier le bruit consistera à déterminer un critère lié à la largeur de la distribution. Il nous faut faire pour cela un petit peu de mathématique.
Précisons tout d'abord ce que l'on entend par valeur moyenne. Soit N le nombre de mesures indépendantes que nous venons de réaliser d'une même grandeur et soit S(i) les valeurs mesurées avec i=1...N. La moyenne est :
![]()
On appelle alors variance ou puissance de bruit la quantité :
![]()
La variance est la somme de la différence quadratique des mesures élémentaires et de la valeur moyenne de ces mesures, le tout normalisé par le nombre de mesures (au premier ordre).
La valeur effective du bruit dans l'échantillon est fournie par l'écart-type, représenté par le symbole s (sigma), et qui vaut :
![]()
On appelle bruit efficace ou encore bruit RMS (de l'anglais Root Mean Square) la quantité :
![]()
On voit que le bruit efficace est équivalent à l'écart-type à condition que la moyenne soit nulle et que N soit grand. Cependant, même si ces conditions ne sont pas remplies, il est fort courant de confondre le bruit RMS avec l'écart-type, en donnant au premier la même définition qu'au second, ce qui est en toute rigueur un abus de langage.
En faisant l'acquisition indépendante de plusieurs séquences de mesures et en calculant pour chacune d'elle la moyenne, il apparaît que cette dernière fluctue d'une séquence à l'autre. On montre que la variance de la moyenne s'écrit :
![]()
Cette équation démontre qu'il est avantageux de travailler avec N grand pour obtenir une valeur fiable de la valeur moyenne, ce qui est très intuitif.
L'expression de la courbe de densité de probabilité de la loi normale est :
![]()
Traçons cette courbe pour une moyenne nulle et pour s = 1.
Densité de probabilité de la loi normale.