Shikha Shesthra ’24, Caroline Yao ’24 et Aarushi Sachdeva ’24 ont présenté leurs projets de recherche et d’enseignement lors de la Capital Regional Women in Computer Science Conference (CAPWIC) à Charlottesville, Virginie, en avril 2024.
Shikha Shrestha a présenté une affiche sur l’évaluation des estimations de performances des modèles en présence de données manquantes. Il mettait en lumière les recherches qu’elle a menées avec le professeur Ben Mitchell au cours de l’été.
Leur étude a étudié l’impact des valeurs manquantes sur les performances du modèle selon différentes méthodes d’imputation. Dans cette étude, nous nous sommes concentrés sur les différences dans les estimations de performance des classificateurs forestiers aléatoires lors de l’utilisation de méthodes d’imputation courantes pour remplacer les valeurs manquantes. Leurs résultats révèlent une tendance significative à la surestimation des performances du modèle lorsque des valeurs manquantes sont présentes à la fois dans les ensembles de formation et de test, et le degré de surestimation varie en fonction de la méthode d’imputation. Ces résultats soulignent l’importance de faire preuve de prudence lorsqu’on traite des données comportant des valeurs manquantes dans le contexte de l’apprentissage automatique, et cette idée importante est apparue grâce à notre recherche collaborative.
Caroline Yao a présenté la génération de terrain 3D avec bruit procédural et pseudo triangulation de Delaunay. Ce projet a été mené en collaboration avec Yue Zhang et sous la supervision du professeur Neil Lutz.
Ce projet a démontré trois algorithmes de bruit procédural différents (Perlin, Diamond-Square et Worley Noise) et a fourni des exemples de terrains de sortie pour chacun. Les points forts du projet incluent des modifications innovantes du bruit de Wally et une procédure de triangulation pseudo-Delaunay adaptée de la triangulation 2D régulière de Delaunay, qui a joué un rôle clé dans la formation finale de la surface topographique, ainsi qu’une mise en œuvre complète comprenant une analyse temporelle. Avantages et inconvénients de chacun des trois algorithmes.
Aarushi Sachdeva a présenté une affiche sur l’application d’algorithmes génétiques pour le regroupement d’images basées sur les couleurs, un projet sur lequel elle a travaillé dans son cours d’IA avec son partenaire de laboratoire Ken Barkdoll sous la direction du professeur Lisa Meaden.
Ce projet se concentre sur le regroupement d’images par couleur et explore des moyens innovants pour créer des collages d’images visuellement attrayants grâce à des algorithmes génétiques. Leur algorithme utilise une nouvelle fonction de croisement qui fonctionne à la fois dans les plans horizontal et vertical de la grille de collage 2D et une nouvelle fonction de croisement qui récompense le regroupement de couleurs local et pénalise les écarts par rapport à la distribution des couleurs de l’ensemble de données d’origine. Leur approche démontre l’efficacité des algorithmes génétiques dans le traitement des informations spatialement localisées et le potentiel de composition créative du contenu visuel.