Il y a un vieux dicton : « Les bâtons et les pierres peuvent briser les os ». « Mais les mots ne me feront jamais de mal. »
Dites cela à Eugenia Lo, professeur adjoint au département d’informatique, et elle vous montrera des tonnes de données qui prouvent le contraire.
Son laboratoire social + IA et langage a montré que :
Le langage policier prédit avec précision les comportements violents des conducteurs noirs. Les préjugés des médias audiovisuels et les chambres d’écho des médias sociaux mettent la démocratie américaine en danger.
L’équipe de recherche du professeur Low à la School of Engineering s’est désormais tournée vers une autre question. Quel est l’impact du discours des médias sociaux sur les taux d’infection et de mortalité par coronavirus aux États-Unis, et que peuvent en tirer les décideurs politiques et les responsables de la santé publique ?
De nombreuses études décrivent uniquement ce qui se passe en ligne. Dans de nombreux cas, une relation directe avec le comportement hors ligne n’est pas démontrée. Mais il existe des moyens concrets de relier le comportement en ligne aux décisions hors ligne. »
Eugenia Law, professeure adjointe, Département d’informatique, Virginia Tech
cause et effet
Pendant la pandémie de COVID-19, les médias sociaux sont devenus un lieu de rassemblement pour les personnes qui s’opposent aux directives de santé publique telles que le port du masque, la distanciation sociale et la vaccination. La propagation de la désinformation a alimenté un mépris généralisé à l’égard des mesures préventives, provoquant une montée en flèche des taux d’infection, des hôpitaux mis à rude épreuve, une pénurie de personnel de santé, des décès évitables et des pertes économiques.
Selon une étude de 2022 publiée dans le Yale Journal of Biology and Medicine, il y a eu 692 000 hospitalisations évitables parmi les patients non vaccinés au cours du mois de novembre à décembre 2021. Plus de 10 cas ont été signalés. Ces hospitalisations coûtent à elles seules la somme faramineuse de 13,8 milliards de dollars.
Dans l’étude, l’équipe de Lo, comprenant le doctorant Xiaohan Ding, a utilisé le chatbot GPT-1 pour analyser les messages des groupes de discussion sur les subreddits interdits s’opposant aux précautions liées au COVID-19 et a développé une technique de formation. Low a déclaré que l’équipe de recherche s’est concentrée sur Reddit parce que les données étaient disponibles. De nombreuses autres plateformes de médias sociaux interdisent aux chercheurs externes d’utiliser leurs données.
Les recherches de Lowe sont basées sur un cadre de sciences sociales appelé théorie de la trace floue, lancé par Valerie Reyna, professeur de psychologie à l’Université Cornell et co-chercheuse du projet à Virginia Tech. Reyna a montré que les individus apprennent et se souviennent mieux des informations lorsqu’elles sont exprimées dans des relations causales, plutôt que simplement sous forme d’informations mémorisées. Cela est vrai même si les informations sont inexactes ou si la relation implicite est faible. Reyna appelle cette construction de relations de cause à effet « l’essentiel ».
Les chercheurs ont travaillé pour répondre à quatre questions fondamentales sur les rouages des médias sociaux.
Comment pouvons-nous prédire efficacement les principaux points de tout un débat sur les réseaux sociaux à l’échelle nationale ? Quels sont les principaux points qui caractérisent comment et pourquoi les gens s’opposent aux pratiques de santé publique liées au COVID-19 et comment ces conclusions évoluent-elles au fil du temps au fil des événements clés ? Les modèles de points à retenir parmi les utilisateurs des subreddits interdits s’opposant aux pratiques de santé liées au COVID-19 prédisent-ils de manière significative les tendances des résultats en matière de santé nationale ?
lien manquant
L’équipe de Rho a utilisé des techniques d’incitation dans des modèles linguistiques à grande échelle (LLM). Un type de programme d’intelligence artificielle (IA) – fournit également des statistiques avancées pour rechercher et suivre ces points dans les groupes de subreddit interdits. Le modèle a ensuite comparé les étapes de la COVID-19, notamment les taux d’infection, les hospitalisations, les décès et les annonces de politique publique associées.
En conséquence, en fait, les publications sur les réseaux sociaux liant des causes telles que « J’ai reçu le vaccin contre le coronavirus » et des effets tels que « Depuis, je me sens comme la mort » ont rapidement changé les croyances des gens. est apparu et a eu un impact. Décisions de santé hors ligne. En fait, le nombre total d’infections quotidiennes par le coronavirus et de nouveaux cas aux États-Unis peut être largement prédit par la quantité d’informations contenues dans les groupes de subreddit interdits.
Il s’agit de la première étude sur l’IA à relier empiriquement les modèles de langage des médias sociaux aux tendances réelles en matière de santé publique, en identifiant d’importants modèles de discussion en ligne et en reliant ces études à grande échelle pour éclairer des stratégies de communication de santé publique plus efficaces. échelle.
« Cette recherche résout la question intimidante de savoir comment relier les composantes cognitives du sens que les gens utilisent réellement au monde des flux d’informations et des résultats de santé sur les médias sociaux », a déclaré Reyna. « Ce cadre LLM basé sur des invites qui identifie les points clés à grande échelle a de nombreuses applications potentielles qui peuvent promouvoir une meilleure santé et un meilleur bien-être. »
Big data, grand impact
Low a déclaré qu’il espérait que cette étude encouragerait d’autres chercheurs à utiliser ces techniques pour répondre à des questions importantes. À cette fin, le code utilisé dans ce projet sera mis à disposition gratuitement lorsque l’article sera publié dans les actes de la conférence de l’Association for Computing Machinery sur les facteurs humains dans les systèmes informatiques. Le document compare également les coûts de différentes méthodes permettant aux chercheurs d’analyser des ensembles de données massives et de tirer des conclusions significatives à moindre coût. L’équipe de recherche prévoit de présenter ses résultats à Honolulu, à Hawaï, du 11 au 16 mai.
Au-delà du monde universitaire, Low espère que l’initiative encouragera les plateformes de médias sociaux et d’autres parties prenantes à trouver des alternatives à la suppression ou à l’interdiction des groupes qui discutent de sujets controversés.
« Bannir simplement les gens dans les communautés en ligne, en particulier dans les espaces où ils échangent et apprennent déjà des informations sur la santé, risque d’entraîner les gens plus profondément dans les théories du complot et de les forcer à accéder à des plateformes qui ne modèrent pas du tout leur contenu. « Il y a un genre », a déclaré Lo. . « Cette recherche explore la manière dont les sociétés de médias sociaux peuvent travailler avec les responsables et les organisations de santé publique pour mieux comprendre ce qui se passe dans l’esprit du public pendant une crise de santé publique. »
sauce:
Revues de référence :
Ding, X. et coll. (2024). Tirer parti de modèles linguistiques à grande échelle basés sur des invites : prédire les décisions et les résultats en matière de santé en cas de pandémie grâce au langage des médias sociaux. CHI ’24 : Actes de la conférence CHI sur les facteurs humains dans les systèmes informatiques. est ce que je.org/10.1145/3613904.3642117.