łÉČËVRĘÓƵ

Nouvelles

Les pièges des »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő des mĂ©dias sociaux

Les chercheurs invitĂ©s Ă  affiner leurs mĂ©thodes d’exploration des »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő issues des mĂ©dias sociaux

Un nombre croissant de chercheurs universitaires explorent les »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő issues des mĂ©dias sociaux afin d’approfondir leurs connaissances sur le comportement humain, en ligne et hors ligne. Au cours des dernières annĂ©es, des Ă©tudes ont prĂ©tendu pouvoir tout prĂ©dire, qu’il s’agisse des succès cinĂ©matographiques de l’étĂ© ou des fluctuations boursières.

±ĘłÜ˛ú±ôľ±Ă©: 27 November 2014

Or, de plus en plus, des lacunes sont dĂ©montrĂ©es dans bon nombre de ces Ă©tudes, d’oĂą la nĂ©cessitĂ©, pour les chercheurs, d’éviter les pièges redoutables de l’utilisation de vastes corpus de »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő issues des mĂ©dias sociaux, selon des informaticiens de l’UniversitĂ©ĚýłÉČËVRĘÓƵ, Ă  MontrĂ©al, et de l’UniversitĂ©ĚýCarnegieĚýMellon, Ă  Pittsburgh.

Ces rĂ©sultats erronĂ©s peuvent avoir de lourdes consĂ©quences. En effet, chaque annĂ©e, des milliers d’articles de recherche reposent maintenant sur les »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő issues des mĂ©dias sociaux. «ĚýBon nombre de ces articles sont utilisĂ©s par le public, l’industrie et le gouvernement pour motiver et justifier des dĂ©cisions et des investissements Ěý», affirme DerekĚýRuths, professeur adjoint Ă  l’École d’informatique de l’UniversitĂ©ĚýłÉČËVRĘÓƵ.

Dans un article publiĂ© dans le numĂ©ro du 28ĚýnovembreĚý2014 de la revue scientifique Science, DerekĚýRuths et JĂĽrgenĚýPfeffer, de l’Institut de recherche logicielle de l’UniversitĂ© Carnegie Mellon, font ressortir plusieurs problèmes associĂ©s Ă  l’utilisation de »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő issues des mĂ©dias sociauxĚý– et proposent des stratĂ©gies permettant de les surmonter. Ils mentionnent notamment les problèmes suivantsĚý:

  • les diverses plateformes de mĂ©dias sociaux attirent diffĂ©rents types d’utilisateurs. Pinterest, par exemple, intĂ©resse surtout les femmes de 25 Ă  34Ěýans, mais les chercheurs corrigent rarement l’image biaisĂ©e que ces Ă©chantillons peuvent donner;
  • les sources de »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő accessibles publiquement reflètent rarement l’ensemble des »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő des mĂ©dias sociaux, et les chercheurs ignorent gĂ©nĂ©ralement quand et comment les mĂ©dias sociaux filtrent leurs flux de »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő;
  • la conception des plateformes de mĂ©dias sociaux peut dicter la façon dont les utilisateurs se comportent et, par consĂ©quent, le type de comportements qu’il est possible de mesurer. Ainsi, sur Facebook, l’absence d’un bouton «Ěýje n’aime pasĚý» rend plus difficile la dĂ©tection de rĂ©actions nĂ©gatives au contenu que la prĂ©sence d’un bouton «Ěýj’aimeĚý» tĂ©moignant de rĂ©actions positives;
  • un grand nombre de polluposteurs («ĚýspammersĚý») Ěýet de bots, qui se font passer pour des utilisateurs normaux sur les mĂ©dias sociaux, sont intĂ©grĂ©s par erreur Ă  de nombreuses mesures et prĂ©dictions du comportement humain;
  • les chercheurs font souvent Ă©tat de leurs rĂ©sultats pour des groupes d’utilisateurs, de sujets et d’évĂ©nements faciles Ă  classifier, donnant ainsi l’illusion que les nouvelles mĂ©thodes sont plus exactes qu’elles ne le sont en rĂ©alitĂ©. Ainsi, les efforts visant Ă  dĂ©terminer l’orientation politique d’utilisateurs de Twitter ne sont exacts qu’ 65Ěý% dans le cas des utilisateurs types, et ce, mĂŞme si certaines Ă©tudes (basĂ©es sur des utilisateurs politiquement actifs) ont fait Ă©tat d’une exactitude de 90Ěý%.

Selon DerekĚýRuths et JĂĽrgenĚýPfeffer, des solutions bien connues Ă  bon nombre de ces problèmes ont dĂ©jĂ  Ă©tĂ© trouvĂ©es par des disciplines telles que l’épidĂ©miologie, la statistique et l’apprentissage machine. «ĚýCes problèmes ont ceci en commun que les chercheurs doivent savoir exactement ce qu’ils analysent rĂ©ellement lorsqu’ils travaillent Ă  l’aide de »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő issues des mĂ©dias sociauxĚý», affirme DerekĚýRuths.

Les spĂ©cialistes des sciences sociales ont dĂ©jĂ  affinĂ© leurs normes et leurs techniques afin de relever ce type de dĂ©fi avec succès. «ĚýLa cĂ©lèbre manchette de 1948 “Dewey dĂ©fait Truman” vient du fait que les sondages tĂ©lĂ©phoniques avaient sous-Ă©chantillonnĂ© les partisans de Truman dans la population gĂ©nĂ©raleĚý», explique le professeurĚýRuths. «ĚýOr, plutĂ´t que de discrĂ©diter de façon permanente le recours aux sondages, cette erreur monumentale a menĂ© aux mĂ©thodes de sondage plus Ă©voluĂ©es et plus exactes, ainsi qu’aux normes plus strictes que nous connaissons aujourd’hui. Nous en sommes maintenant Ă  un tournant technologique semblable. En nous attaquant Ă  ces problèmes, nous pourrons mesurer pleinement les avantages que comporte la recherche fondĂ©e sur les »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő issues des mĂ©dias sociaux.Ěý»

--------------Ěý

Social Media for Large Studies of Behavior, DerekĚýRuths et JĂĽrgenĚýPfeffer, Science, 28ĚýnovembreĚý2014.Ěý

Ěý

Ěý

Back to top