Le laboratoire de Turaga pour améliorer la fiabilité des ordinateurs dans l’identification des objets dans les images
Le directeur de la School of Arts, Media and Engineering de l’Arizona State University a remporté une subvention fédérale d’un million de dollars pour améliorer la façon dont les ordinateurs discernent les images pour le département américain de la Défense.
Pavan Turaga, qui est professeur à la fois à la School of Arts, Media and Engineering et à la School of Electrical, Computer and Energy Engineering, a reçu une subvention de 18 mois AI-Explorations de la Defense Advanced Research Projects Agency au début du mois.
Le laboratoire ASU de Turaga, Geometric Media Lab, a travaillé sur la fusion de différentes méthodes, notamment mathématiques, physiques et basées sur les données, pour mieux traiter et comprendre les données d’imagerie.
“Il s’agit d’une grande agence de défense qui est traditionnellement connue pour investir dans des projets à haut risque et à haut rendement”, a déclaré Turaga, qui utilise les pronoms eux/eux.
“Cet appel spécifique était une réponse à un problème persistant dans le monde de l’apprentissage automatique et de l’intelligence artificielle.”
Les ordinateurs utilisent des réseaux de neurones pour traiter les images. Les réseaux utilisent des techniques d’apprentissage en profondeur pour obtenir des données permettant d’identifier des objets dans des images.
“La dernière décennie de travail sur les réseaux de neurones a montré qu’ils sont très fragiles et peu fiables”, a déclaré Turaga.
« Nous ne savons pas pourquoi ils font ce qu’ils font. Il y a une photo d’un chat et ils diront que c’est un chien, et il n’y a généralement pas d’explication satisfaisante à cela.
Les images que les réseaux de neurones traitent sont affectées par de nombreux facteurs, tels que l’éclairage et l’angle de la caméra.
Dans le projet DARPA, l’équipe de Turaga intégrera les connaissances de la physique dans les réseaux de neurones pour aboutir à des modèles d’apprentissage automatique plus fiables et plus robustes.
Ils utiliseront la géométrie riemannienne, inventée à l’origine par la communauté mathématique du début du XXe siècle pour étudier la courbure des surfaces. Grâce à un remaniement minutieux et à une fusion avec des réseaux profonds, nous serons en mesure d’évaluer comment la forme et la géométrie d’un objet peuvent rendre les choses plus faciles à identifier.
Le Geometric Media Lab de l’ASU est bien placé pour être le pont entre le monde des réseaux de neurones et le monde de la physique, a déclaré Turaga, dont la thèse de doctorat portait sur l’avancement d’une technique similaire consistant à utiliser des méthodes géométriques pour coder des modèles de physique.
Un réseau de neurones peut être entraîné, par répétition, à reconnaître des images. Les réseaux le font en se concentrant sur des régions de l’image.
“L’attention des réseaux est souvent sur la couleur et l’ombrage – c’est très diffus et pas précis”, a déclaré Turaga. « Il s’agit d’examiner beaucoup de choses et de prendre une décision qui peut ou non être optimale.
« Nous proposons, regardons une géométrie plus détaillée. Quelle est la forme ? Et encodez cette définition de manière à ce que les réseaux de neurones puissent s’entraîner.”
Le réseau traitera les pixels de la même manière mais avec une meilleure fiabilité.
“Quand nous disons:” Dites-moi à quoi vous faites attention pendant que vous prenez cette décision “, cela se concentre plus clairement sur les caractéristiques des objets qui en font ce qu’il est”, ont-ils déclaré.
« Nous sommes en mesure d’amener le réseau de neurones à prêter attention à la partie pertinente de l’objet, comme la forme et la texture. Si vous ne le faites pas, vous obtenez un réseau de neurones qui prête attention à beaucoup de choses distrayantes. »
Le laboratoire de Turaga est capable de montrer comment leur technique améliore le traitement du réseau grâce à des images de “carte d’attention” qui ressemblent à des cartes thermiques.
« Notre approche montre que nous pouvons entraîner les réseaux à être attentifs en mettant en évidence des formes plus précisément.
“Nous essayons de rendre les réseaux de neurones plus fiables en créant ces visualisations qui nous aident à faire confiance à ce qu’ils font.”

Cette image montre comment la technologie du Geometric Media Lab améliore la capacité des ordinateurs à identifier de manière fiable les objets dans les images en apprenant à l’ordinateur à prêter attention aux formes des objets. La ligne du haut est l’objet dans l’image. La deuxième ligne montre ce à quoi les réseaux de neurones informatiques prêtent attention lorsqu’ils discernent les objets. L’attention est diffuse. La rangée du bas montre comment l’ordinateur, en utilisant la méthode du laboratoire, accorde une plus grande attention à des zones spécifiques des objets, augmentant la fiabilité de l’identification. Image reproduite avec l’aimable autorisation du Geometric Media Lab de l’ASU
La fiabilité des systèmes est essentielle car la DARPA s’intéresse aux applications de défense, telles que les images de drones.
En utilisant des tests de données de référence standard, la méthode de Turaga montre une augmentation de quatre points de pourcentage de la précision, de 68% à 72%
« Ce qui est intéressant, ce n’est pas que nous ayons poussé (la précision), mais de dire qu’elle a augmenté, car nous prêtons attention à la propriété sous-jacente de l’objet.
“Nous encodons en fait la connaissance de la forme et de la géométrie de l’objet.”
Turaga a déclaré qu’ils n’auraient pas pu faire ce genre de travail sans un rendez-vous conjoint entre les écoles.
“Ce rôle me donne le temps et l’espace pour réfléchir à ce genre de questions spéculatives, ce qui ne serait pas facile si je n’étais que dans l’ingénierie traditionnelle.
“Cela me permet de prendre du recul et de dire : ‘Refléchissons plus profondément à la manière dont les technologies des médias encodent les connaissances.'”
Le Geometric Media Lab travaille avec la Global Security Initiative de l’ASU sur le projet de subvention, dont une partie est sous-traitée aux universités Johns Hopkins et Florida State. Le projet durera 18 mois et comprendra des équipes d’étudiants et de professeurs. Les co-chercheurs principaux sont Visar Berisha, professeur agrégé, et Gautam Dasarathy, professeur adjoint, tous deux à la School of Electrical, Computer and Energy Engineering de l’ASU, et comprennent également l’étudiant Rajhans Singh et le postdoc Ankitha Shukla en tant que contributeurs clés.
Graphique du haut par Alejandro Cabrera/ASU News

Leave a Comment