La sélection de l'échantillon ' c'est-A -dire le choix des indidus interrogés ' constitue une phase cruciale pour la validité d'une étude.
Deux types de méthodes sont ensageables. Les premières ' dites méthodes probabilistes ' sont les plus proches des lois statistiques, mais présentent de lourdes contraintes de mise en ouvre. C'est dans les études de fréquentation, ou lorsque l'univers de référence n'est pas connu, qu'elles prouvent toute leur efficacité. Les secondes ' qualifiées d'empiriques ' bien que théoriquement moins rigoureuses ' sont régulièrement employées dès que l'étude s'intéresse au grand public.
Quelle que soit la méthode retenue, deux grands principes doivent AStre respectés :
» Simplicité d'administration
En répondant A une enquASte, la personne interrogée ne remplit pas une obligation mais rend un serce A l'entreprise culturelle ou au cabinet chargé de l'étude. Par une logique gratitude ' ou par simple bon sens ' il conent de lui faciliter la tache et de lui rendre aussi agréable que possible le temps d'administration du questionnaire.
» Unicité des conditions d'administration
Sous peine de non-validité des informations collectées, tous les sondés doivent avoir été interrogés dans les mASmes conditions.
En d'autres termes, l'addition de carottes et de navets n 'a jamais été synonyme de bonne étude marketing.
Les méthodes probabilistes
La méthode probabiliste la plus couramment usitée est celle du sondage aléatoire. Elle procède par tirage au sort au sein de la population étudiée. Pour que l'échantillon soit vérilement représentatif, chaque indidu de la population étudiée doit avoir la mASme chance que les autres de urer dans l'échantillon final. C'est lA que réside la principale difficulté de mise en oeuvre, qui se traduit par ce que les spécialistes appellent un - biais -. Pour contourner ce biais possible, les indidus sont sélectionnés A partir d'un aléa ' ou taux de sondage ' égal au quotient de la taille de l'échantillon par la taille de la population étudiée.
Prenons le cas d'un monument historique. L'étude des sources internes a montré que 5000 siteurs sont attendus sur la période considérée. Pour tirer un échantillon de 500 personnes, l'aléa est de 10%. A partir du premier siteur interewé ' par exemple le quatrième A AStre sorti du batiment ' on interrogera les 14e, 24e, 34e, etc..
La mise en ouvre des sondages aléatoires est délicate. Pour AStre valide, certaines conditions doivent AStre rigoureusement respectées :
» la population étudiée doit AStre facilement repérable.
» La taille de la population étudiée doit AStre évaluée précisément avant de procéder au sondage, de faA§on A calculer l'aléa.
Ce qui montre l'importance d'une étude rigoureuse des sources internes d'information.
» L'aléa déterminé doit AStre strictement respecté, ce qui nécessite un étroit contrôle des enquASteurs chargés de l'administration des questionnaires. On éte ainsi les phénomènes de - bouille - ' l'enquASteur interroge les personnes les plus sympathiques ou celles qui n'opposent pas de refus ' plutôt que celles désignées par leur position aléatoire, introduisant ainsi un biais puisque certaines catégories d'indidus se trouvent sur-représentées par rapport au reste de la population.
» Les refus de répondre doivent AStre compilisés et, dans certains cas particuliers, redressés informatiquement avant l'analyse, de faA§on A redonner A tous les indidus leur vérile poids dans la population.
Si l'on reprend l'exemple cité plus haut, les siteurs étrangers et ceux appartenant A un groupe auront une propension plus faible A répondre, d'où un risque de sous-représentation de cette catégorie de personnes.
» Le choix de l'aléa et les dates d'administration doivent AStre cohérents avec les cycles de fonctionnement de l'entreprise, de faA§on A ne pas sur-représenter certaines catégories de publics ou d'indidus.
Dans une bibliothèque, les périodes de rentrée des classes et de congés scolaires présentent différents atypismes qui doivent AStre pris en considération.
» Les conditions d'administration doivent favoriser le respect de l'aléa.
Par exemple, lors d'une enquASte effectuée A l'entrée d'un spectacle, le spectateur présent une heure avant le lever du rideau ne doit pas avoir une probabilité plus forte d'AStre interrogé que celui arrivé en retard. On peut en effet émettre l'hypothèse que ces deux catégories de spectateurs ont des pratiques différentes et que l'une ne doit pas AStre sur-représentée au détriment de l'autre.
Les méthodes empiriques
A la différence des méthodes aléatoires, les méthodes empiriques fondent la sélection de l'échantillon sur un choix raisonné et non probabiliste d'indidus. La plus connue d'entre elles est celle dite des quotas. Dans ce cas, l'échantillon sélectionné se présente comme un modèle réduit de la population étudiée en respectant les caractéristiques. C'est ce que l'on appelle les - quotas -.
LA aussi, certaines conditions d'administration doivent AStre observées :
» Les méthodes empiriques supposent que la population mère soit connue préalablement A la réalisation du sondage.
Les caractéristiques les plus usuellement utilisées sont les données socio-démographiques (age, sexe, CPS). Ce ne sont malheureusement pas toujours les mieux adaptées aux études nécessaires dans le secteur culturel. On leur préférera ' dans la mesure où l'univers a déjA été décrit ' des éléments plus qualitatifs se rapportant, par exemple, aux pratiques culturelles.
» Au début de l'entretien une question préliminaire doit AStre posée afin de vérifier que la personne interrogée entre bien dans les quotas.
» Un soin tout particulier doit entourer les derniers questionnaires administrés ' les - queues de quotas - ' où la tentation est grande pour les enquASteurs de - s'échanger - des caractéristiques pour respecter les catégories imposées.
Par rapport aux quotas qui leur ont été imposés en début de sondage, les enquASteurs procèdent par élimination chaque fois qu 'une personne ent d'AStre interrogée. En fin d'administration, il reste régulièrement - l'agriculteur de plus de 55 ans jouant du oloncelle, impossible A trouver dans des délais raisonnables -, d'où, parfois, une tentation de tricher.
La taille de l'échantillon
Pour disposer d'une bonne fiabilité de résultats, la taille de l'échantillon doit AStre suffisante. La précision d'une estimation varie, en effet, en fonction de la racine carrée de la taille de l'échantillon. Il est important de noter que la taille de l'échantillon est indépendante de la taille de population étudiée.
Un échantillon représentatif de 7 000 personnes sera suffisant pour étudier les pratiques de lecture des FranA§ais. Mais il faudra approximativement le mASme nombre d'indidus pour étudier les pratiques de lecture des habitants d'une lle de 50 000 ou 100000 habitants.
Un second critère doit AStre pris en considération lors du calcul de la taille de l'échantillon : le nombre de sous-populations ' c'est-A -dire de groupes qui vont donner lieu A des traitements informatiques spécifiques ' sur lesquelles on désire obtenir des résultats valides. L'échantillon doit en effet comprendre suffisomment d'indidus pour autoriser des croisements significatifs.
Reprenons l'exemple d'une étude de lectorat dans une bibliothèque. Une étude qualitative aura fait émerger précédemment une typologie sommaire en quatre groupes: -non-lecteurs-, -faibles lecteurs-, -lecteurs moyens- et -gros lecteurs-. L'échantillon quantitatif devra comprendre un nombre d'indidus dans chacun de ces groupes pour autoriser des traitements valides sur chacun.
Enfin, au-delA des considérations techniques, la taille de l'échantillon est aussi conditionnée par les
moyens financiers que l'entreprise est disposée A investir dans l'étude marketing. Cela explique que dans certains cas il faille se contenter d'une phase qualitative, moins onéreuse A réaliser.
Dans les études courantes, les échantillons comprennent généralement entre 400 et 1 500 indidus.