Note(s) taguée(s) 'construire un questionnaire'

Le questionnaire : finaliser le questionnaire !

Après avoir vu une multitude d’étapes pour construire son questionnaire (notes consultables ici), il est temps de finaliser celui-ci.

Je vous rassurer, il ne vous reste plus qu’une dernière chose à faire : le pré-tester.
Il s’agit d’administrer le questionnaire à 10-20 personnes appartenant à la cible définitive pour vérifier plusieurs choses :

  • Si celui-ci « passe » bien : pas d’incompréhension, pas de question sans réponse, pas de question sur laquelle un individu ne peut pas se prononcer (oubli de la modalité « NSP » par exemple), etc.
  • Il est également temps de s’assurer de la durée du questionnaire. En effet, si vous sous-traitez votre questionnaire à une boîte de terrain (comme Update, cf. ici), elle vous parlera la plupart du temps en durée de questionnaire et pas forcément en nombre de questions.
    Respecter la durée convenue dans le devis est donc une priorité (pour respecter le budget… mais aussi pour ne pas se retrouver avec des individus qui abandonnent le questionnaire car jugé trop long).

Dans les faits, les pré-tests sur 10-20 personnes de la cible sont rares… car ils coûtent très chers ! Les instituts se servent alors de leur expérience pour garantir le bon déroulement du questionnaire. Il arrive aussi que celui-ci soit testé sur des collègues ne connaissant pas l’étude. Si cette pratique n’est pas exactement idéale, elle est préférable au lancement d’un questionnaire jamais pré-tester.

Le questionnaire : la check-list du rédacteur

Nous avons déjà passé en revue de nombreuses étapes dans la construction du questionnaire.
Pour rappel, nous avons vu :

Aujourd’hui je vous livre un outil tiré de l’excellent livre « Études de marché » de Giannelloni & Vernette pour vérifier que vous avez bien inclus les questions souhaitées et utiles dans votre questionnaire : la check-list du rédacteur.

Giannelloni et Vernette ont ainsi défini 4 questions à se poser sur chacune de nos questions du questionnaires. Les voici rapidement résumées (je vous incite à acheter le livre pour plus de détails, il est très bien fait) :

  • La question que je viens d’écrire est-elle nécessaire ? La question doit fournir une information utile pour répondre à la problématique de l’étude. On doit, à l’inverse, pouvoir se demander si on peut répondre à la problématique en enlevant la question… Si la réponse est oui, on devrait l’enlever. Malheureusement, dans la pratique, les clients ont tendance à rajouter des questions peu voire pas utiles pour la problématique sans que l’on puisse s’y opposer…


  • Pour l’information recherchée, une seule question suffit-elle ? Souvent, une seule question ne suffit pas à répondre totalement à un besoin d’information soulevé par la problématique. Il faut alors mieux diviser le sujet en plusieurs sous-questions, chacun répondant à un élément différent (tous les éléments étant complémentaires pour satisfaire notre recherche d’info). Dans la pratique, multiplier les questions sur une dimension d’information permet, en plus, de nuancer les résultats et d’identifier les réussites et les optimisations éventuelles.


  • La personne interrogée pourra-t-elle fournir l’information ? Trois raisons peuvent expliquer que le répondants ne puisse répondre à nos questions :
    • Incompréhension de la question.
    • Ignorance de la réponse.
    • Oubli de la réponse.

    Ici, je vous renvoie également aux biais dans les questions pour plus de détails.


  • La personne interrogée voudra-t-elle fournir l’information ? Encore une fois, trois raisons peuvent expliquer que le répondants ne veuille répondre à nos questions :
    • Sujets socialement sensibles.
    • Sujets trop privés.
    • Questions demandant un trop gros effort de recherche.

    Ici aussi, pensez aux biais dans les questions !


Avec cet outil très opérationnel, Giannelloni & Vernette nous aide à écrire un questionnaire plus direct et plus utile. Je vous conseille donc d’utiliser la check-list du rédacteur dès que possible !

Grégoire Hervé-Bazin dans Méthodologie quanti le 11 février 2011

Les tris à plat, diversité et puissance des tests

Nous l’avons vu (la nature des questions), il existe plusieurs natures de questions : les questions nominales, les questions ordinales (ces deux premières catégories étant souvent regroupées sous l’appellation « variables non métriques » ou « variables qualitatives ») et les questions métriques.

En fonction du type de question, les statistiques que nous pourrons effectuer varieront fortement.

Intéressons-nous ici aux statistiques descriptives, et particulièrement à l’analyse univariée. En plus clair, aux tris à plat (on décrit UNE variable, sans croisement). Nous verrons à chaque fois qu’il existe un indicateur de tendance centrale et une possibilité de rendre compte de la dispersion.

Gardez à l’esprit que :
Variables métriques > variables ordinales > variables nominales.
(> : est supérieur à, on peut faire plus de tests statistiques et plus puissants)


  1. Pour les questions nominales

Ici, rappelez-vous, les modalités de réponses n’ont pas de lien entre elles (une modalité n’est pas meilleure que les autres).
Pour décrire une variable nominale, on utilisera les fréquences (ou pourcentages) : il s’agit uniquement de décompter le nombre d’observations sur chacune des modalités et de rapporter son importance à l’ensemble des observations.

Exemple (fictif) :
On interroge 650 personnes et on leur demande : « Quelle est votre couleur préférée ? »
Voici les réponses, sous forme de fréquences :

Réponse Nb d’individus Fréquence (%)
Bleu 325 50.0%
Rouge 197 30.3%
Jaune 128 19.7%

L’indicateur de tendance centrale est le mode. C’est tout simplement la modalité pour laquelle on a le plus d’observation, la plus haute fréquence. Ici, c’est le bleu qui est donc le mode.


  1. Pour les questions ordinales

Ici, rappelez-vous, les modalités ont un ordre, sans que cela implique qu’elle aient toute une distance équivalente entre elle.
Pour décrire une variable ordinale, on peux utiliser les fréquences et le mode (car les questions ordinales sont plus puissantes que les variables nominales). En plus de cela, pour décrire encore plus finement une variable ordinale, on utilisera les quantiles : il s’agit de diviser la série de données en classes égales (les plus connus des quantiles sont les quartiles).

Exemple (fictif, inspiré de ce site) :
On mesure la distance parcourue par 11 voitures avec 1 litre d’essence :
Voici les résultats, sous forme de rang :

Distance parcourue (en km) Rang
70 1
75 2
80 3
82 4
91 5
100 6
105 7
113 8
120 9
125 10
130 11

Ici le premier quartile est 80 km, le deuxième est 100km et le troisième est 120km.
En effet, on a 11 observations (n=11). La formule des quartiles nous indique qu’il faut faire :

  1. pour le premier quartile : (n+1)/4. Soit : 12/4 = 3. L’observation du rang 3 nous indique 80.
  2. pour le deuxième quartile : (n+1)/2. Soit : 12/2 = 6. L’observation du rang 6 nous indique 100.
  3. pour le troisième quartile : 3(n+1)/4. Soit : 36/4 = 9. L’observation du rang 9 nous indique 120.

Ici, il est surtout important de retenir la logique plus que la formule (le but de ce blog n’étant pas d’aligner les formules) : on cherche simplement à diviser l’échantillon en classe égale.
L’indicateur de tendance centrale pour les variables ordinales est la médiane. C’est tout simplement le deuxième quartile, à savoir la valeur pour laquelle 50% des cas ont des valeurs inférieures et 50% ont des valeurs supérieures. Dans notre exemple, la médiane est de 100 km.

Petite précision : que faire quand on a un nombre pair d’observation ? Imaginons que nous avions observé 10 voitures, sans voir la 11ème (qui a fait 130 km) :

Distance parcourue (en km) Rang
70 1
75 2
80 3
82 4
91 5
100 6
105 7
113 8
120 9
125 10

Le calcul de la médiane est alors la moyenne des « n/2 » et « n/2 + 1 » observations. Ici : 10/2 = 5 et 10/2 + 1= 6. Au 5ème rang, on a 91 km ; au 6ème rang, on a 100 km. La médiane est donc de (91+100)/2=95.5 km.


  1. Pour les questions métriques

Ici, rappelez-vous, les modalités ont à la fois la notion d’ordre et de distance entre les modalités de réponse.
Pour décrire une variable métriques, on peux utiliser les fréquences, les quantiles, le mode et la médiane (car les questions métriques sont plus puissantes que les variables ordinales, elles-mêmes plus puissantes que les nominales). En plus de cela, pour décrire encore plus finement une variable métrique, on utilisera la moyenne et l’écart-type.

Exemple (fictif) :
On a demandé à 500 personnes de noter de 0 à 10 leur satisfaction vis-à-vis d’un produit. Voici les réponses (avec les fréquences) :

Note de satisfaction Nb d’individus Fréquence (%)
0/10 0 0.0%
1 0 0.0%
2 1 0.2%
3 3 0.6%
4 7 1.4%
5 21 4.2%
6 50 10.0%
7 105 21.0%
8 161 32.2%
9 65 13.0%
10/10 87 17.4%

Ici, on peut constater que le mode se situe à 8/10, la médiane est également à 8/10 (donnée par tous les logiciels de statistiques).
L’indicateur de tendance centrale est la moyenne. Ici, elle est de 7.84.
Les indicateurs de dispersion les plus souvent mentionnés sont l’écart-type ou la variance. Ils sont relativement difficiles à interpréter. En gros, plus leur valeur sont élevées, plus la dispersion est forte.
On peut compléter ces indicateurs avec d’autres moyens :

Il est toujours intéressant de comparer la moyenne et la médiane. Ici, elles sont relativement proches, mais il faut savoir que la moyenne est plus impactée par les valeurs extrêmes que la médiane. Ainsi, si quelques personnes avaient attribué la note de 1/10, on aurait eu une moyenne beaucoup plus basse alors que la médiane n’aurait pas bougé.
Une moyenne inférieure à la médiane implique des valeurs extrêmes « basses » qui tirent la distribution vers le bas et une moyenne supérieure à la médiane implique des valeurs extrêmes « hautes » qui tirent la distribution vers le haut.

Sachez qu’il existe la possibilité (surtout sur SPSS) de sortir la moyenne en excluant 5% des valeurs extrêmes pour la comparer à la moyenne avec toutes les valeurs.

Sachez également, pour ceux qui sont vraiment friands de statistiques, qu’il existe deux indicateurs pour nous renseigner sur la forme de la distribution :

  1. Le coefficient de symétrie (ou Skewness) qui indique si les observations sont concentrées autour de la moyenne (coefficient nul), concentrées autour des valeurs faibles (coeff. positif) ou des valeurs élevées (coeff. négatif).
  2. Le coefficient d’aplatissement (ou Kurtosis) qui indique la concentration de la distribution : une valeur positive indique que les valeur sont concentrées autour de la moyenne, une valeur négative indique une distribution assez plate, avec des valeurs bien reparties partout.

La nature des questions

Nous avons déjà parlé du format des questions (question ouverte, question fermée), attardons nous maintenant sur un sujet capital : la nature des questions.

Beaucoup l’ignorent mais les questions n’ont pas toutes la même nature. Ce point est particulièrement important car, de la nature de la question dépendra les traitements statistiques qu’on pourra réaliser. Il est donc particulièrement important de savoir quelles sont les différentes natures des questions afin de prévoir au mieux ses tris et savoir ainsi exactement ce que l’on pourra obtenir.

Il existe 3 natures de questions différentes. La nature d’une question dépend des relations qu’ont les modalités de réponse à cette question entre elles (si ce n’est pas clair, continuez l’article, des exemples facilitent la compréhension).

  • Les questions nominales. Les plus simples, elles ont des possibilités statistiques limitées.
  • Les questions ordinales. Introduction de la notion d’ordre, un peu plus de possibilité statistiques.
  • Les questions métriques (ces questions regroupent deux sous-natures de questions, dont nous ne parlerons pas : les questions d’intervalles et les questions de proportion ou ratio). Ont à la fois l’ordre et la distance, les variables les plus puissantes au niveau statistique.

Reprenons ces variables en détail :

  1. Les questions nominales

Ce sont les variables les plus « simples » possibles, elles ne servent qu’à vérifier l’appartenance du répondant à une catégorie ou à une autre. Concrètement, ce sont les questions pour lesquels les modalités de réponses n’ont pas de lien entre elles, une modalité n’est pas meilleure que les autres.
Par exemple, la question « sexe ? » a pour réponses « homme » ou « femme », mais on peut dire que l’une des réponses vaut mieux que l’autre. C’est la même chose pour la question « Quelle est votre profession ? » ou même toutes les questions à choix multiples comme « Parmi la liste de loisirs ci-dessous, lesquels préférez-vous ? ».
Le point commun entre toutes ces questions est qu’elles sont nominales : on ne peut pas dire qu’une modalité de réponse est meilleure qu’une autre, il n’y a aucune relation d’ordre entre elles.
On le verra plus tard, mais les tests statistiques sont limités sur ces questions (pourcentages… éventuellement mode).
Petit conseil : pour « vérifier » qu’une question est nominale, repensez à l’exemple de la CSP ou du Sexe et posez-vous la question : a-t-on la même logique ici ?

  1. Les questions ordinales

Ici, on introduit la notion d’ordre (comme le laisse largement deviner le nom même de ces questions). Concrètement, les modalités ont un ordre, sans que cela implique qu’elle aient toute une distance équivalente entre elle. Cette notion de distance n’est peut-être pas très claire spontanément, mais voici un exemple pour comprendre :
Par exemple, la question « Pouvez-vous classez les trois marques ‘A’, ‘B’ et ‘C’ de celle que vous préférez à celle que vous aimez le moins ? » est une question ordinale. Les répondants pourront ainsi dire que B est supérieur à C qui est supérieur à A mais en aucun cas on ne pourra savoir si la marque préférée est très largement devant dans l’esprit des individus ou si au contraire, le classement est très serré. On n’a donc pas cette notion de distance entre les modalités de réponse.
On le verra plus tard, les tests statistiques sur ces questions sont un peu plus puissants que sur les questions nominales mais encore assez limités (pourcentages, mode, médiane, fractiles).
Petit conseil : pour « vérifier » qu’une question est ordinale, essayez de savoir si vous pouvez dire que la distance entre deux modalités (‘A’ et ‘B’ par exemple) est deux fois plus grande qu’entre d’autres modalités (‘B’ et ‘C’ par exemple). Si vous pouvez parler d’ordre sans parler de distance, vous avez une question ordinale sous les yeux. Si vous pouvez parler d’ordre et de distance, vous avez une question métrique.

  1. Les questions métriques

Les questions métriques ont à la fois la notion d’ordre et de distance entre les modalités de réponse.
Par exemple, toutes les questions comme « quel est votre âge ? », « Pourriez-vous donner une note de satisfaction entre 0 et 10 à ‘produit A’; 0 étant la moins bonne note, 10 étant la meilleure et les notes intermédiaires vous permettant de nuancer votre jugement ? » sont des variables numériques. Elles appellent une réponse qui va à la fois permettre un classement ordonné et un classement dans lequel on saura quelles sont les distances entre les réponses des gens (par exemple, le répondant attribuant une note de 9/10 donne bien 4 points de plus qu’un répondant attribuant une note de 5/10).
On le verra plus tard, les tests statistiques sur ces questions sont les plus puissants (pourcentages, mode, médiane, fractiles, moyenne, écart-type).
Petit conseil : pour « vérifier » qu’une question est ordinale, essayez de savoir si vous pouvez dire que la distance entre deux modalités (‘A’ et ‘B’ par exemple) est deux fois plus grande qu’entre d’autres modalités (‘B’ et ‘C’ par exemple). Si vous pouvez parler d’ordre sans parler de distance, vous avez une question ordinale sous les yeux. Si vous pouvez parler d’ordre et de distance, vous avez une question d’intervalle ou de ratio.

En résumé, conservez à l’esprit que la nature des questions est capitale pour votre plan de traitement (tris à plat et tris croisés !). Une question ne se verra pas « traitée » de la même façon et on aura toujours plus de possibilités avec une variable ordinale qu’avec une variable nominale et encore plus de possibilité avec une variable métrique qu’avec une variable ordinale.

Variables métriques > variables ordinales > variables nominales.