REFRESH(900 sec): http://www.lemonde.fr/pixels/article/2016/01/08/intelligence-artificiel le-ce-que-voient-les-machines_4843858_4408996.html?xtmc=surveillance&xt cr=2 #alternate alternate alternate Le Monde.fr : Pixels En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour vous proposer des contenus et services adaptés à vos centres d’intérêts. En savoir plus et gérer ces paramètres. Le Monde Télérama Le Monde diplomatique Le Huffington Post Courrier international La Vie S'abonner au Monde à partir de 1 € * Services Le Monde ▾ + Boutique Le Monde + Accueil + Hors-séries + Livres + DVD + CD + Unes du Monde + Loisirs & papeterie + Promotions + Partenaires Le Monde + Annonces auto + Annonces emploi + Annonces immo + Comparateur de banques + Comparateur de crédit + Cours d’anglais + Modèles de lettres + Prix de l’immobilier + Shopping Le Monde.fr * Édition globale * Édition afrique Rechercher : ____________________ rechercher Facebook Twitter Google+ Instagram Emploi Newsletters Affichez ici la météo de votre ville S'inscrire Connexion Intelligence artificielle : ce que voient les machines Partager Tweeter * Accueil * International * Politique * Société * Éco * Culture * Idées * Planète * Sport * Sciences * Pixels * Campus * Le Mag * Édition Abonnés Pixels * Vie en ligne * Jeux vidéo * Banc d'essai * Cultures Web Des programmes sont désormais capables d’identifier des objets et des visages dans des images, et même de décrire certaines scènes. Intelligence artificielle : ce que voient les machines Si des programmes sont désormais capables d’identifier des objets et des visages dans des images, d’énormes progrès restent à accomplir avant les premiers robots autonomes. Le Monde | 08.01.2016 à 11h01 • Mis à jour le 11.01.2016 à 11h27 | Par Morgane Tual Cet article fait partie d’une série consacrée à l’état des lieux de l’intelligence artificielle. Les robots humanoïdes de science-fiction ne pourront pas exister sans être dotés d’un système leur permettant de « voir » correctement leur environnement. Et pour y parvenir, caméras et capteurs sont loin d’être suffisants : ils ne font que transmettre des données brutes, comme des pixels, à la machine. Mais celle-ci doit ensuite être capable de les interpréter et de les comprendre : un défi complexe, sur lequel travaille tout un pan de la recherche en intelligence artificielle (IA). Car les applications de la vision artificielle sont larges et ses enjeux importants : de la robotique à la reconnaissance faciale, en passant par l’aide aux non-voyants, les voitures autonomes ou encore l’armée ou la surveillance. Si d’importants progrès ont été faits ces dernières années, il reste encore du chemin à parcourir avant que les machines ne voient comme les humains. Apprendre à reconnaître les formes « Reconnaître un objet pose beaucoup de problèmes », explique Jean Ponce, chercheur en vision artificielle à l’ENS, « un objet n’a pas le même aspect selon l’angle de la prise de vue, et deux chaises n’ont par exemple pas la même forme, couleur et texture ». De la même manière, un humain ou un animal n’ont pas la même forme selon leur position ou selon le point de vue de l’image, ce qui augmente, pour la machine, la difficulté de les identifier. Comment une voiture autonome peut-elle différencier un auto-stoppeur d’un policier qui lui fait signe de s’arrêter ? Un sac plastique sur la route d’une pierre à éviter ? Pour y parvenir, les spécialistes de l’IA tentent d’apprendre aux machines à reconnaître ces formes grâce à l’apprentissage supervisé. Par exemple, pour permettre à un programme de reconnaître un chien, il faut « l’entraîner » en lui fournissant de nombreuses images de chiens, afin qu’il soit ensuite capable d’en repérer sur des nouvelles images. C’est pourquoi le Vision Lab de l’université Stanford, aux Etats-Unis, a élaboré ImageNet, une base de données de centaines de milliers d’images, toutes soigneusement labellisées à la main, mises à disposition des chercheurs qui en ont besoin. Pour reconnaître un castor, le programme est « entraîné » avec de nombreuses photos de l'animal, avant d'être capable de le détecter sur de nouvelles images. Une technique efficace, notamment grâce aux progrès récents du deep learning (en français, « apprentissage approfondi »). Cette technologie, basée sur les réseaux de neurones artificiels, a des propriétés « très similaires au système visuel humain » affirme Yann LeCun, un des pionniers du deep learning, directeur du laboratoire d’intelligence artificielle de Facebook à Paris : « Le réseau de neurones que l’on entraîne est constitué d’une série de couches. La première prend les pixels bruts et analyse la présence de petits motifs sur l’image. La deuxième récupère ces résultats et regarde si un contour ou une orientation particulière se dessine. La troisième détecte une conjonction de contours, comme des coins ou des cercles par exemple, et ainsi de suite. » Lire nos explications : Comment le Deep learning révolutionne l'intelligence artificielle Par exemple, c’est grâce au deep learning qu’il a réussi à mettre au point ce dispositif impressionnant : un programme capable de reconnaître en temps réel les objets filmés par la webcam d’un simple ordinateur portable. La start-up berlinoise Natural Vision développe quant à elle des applications permettant d’identifier des plantes ou des papillons en les photographiant. Certains services grand public utilisent déjà cette technologie, comme Facebook, qui sait reconnaître automatiquement les personnes présentes sur des photos – une fonctionnalité interdite en Europe. Ou encore Google Photos, qui réussit, dans une certaine mesure, à identifier le contenu des photographies postées par ses utilisateurs. Mais pas sans ratés : cet été, un internaute s’est plaint car le programme avait confondu deux de ses amis noirs avec des gorilles. Google Photos, y'all fucked up. My friend's not a gorilla. http://t.co/SMkMCsNVX4 — jackyalcine (@diri noir avec banan) Quand la machine découvre le chat Cette technologie est donc loin d’être infaillible, et les ingénieurs cherchent d’autres moyens de la faire progresser. « Un des gros défis de la vision est d’essayer de limiter les labels et le niveau de supervision nécessaire », souligne Jean Ponce. « On a une tendance à vouloir étiqueter le monde entier, mais où est-ce qu’on s’arrête ? » Doit-on labelliser, sur une image, l’humain, le ciel, l’herbe, le trèfle, la cravate, l’ongle, le poil ? Un travail fastidieux — si ce n’est impossible — qui nécessite des moyens financiers et humains considérables. « Et comment on fait pour les vidéos ? », poursuit le chercheur. La recherche se tourne donc désormais vers l’apprentissage sans supervision, qui connaît certaines réussites. La plus célèbre est sans doute celle que Google a annoncée en 2012, quand « Google Brain », son projet de deep learning, a été capable de « découvrir » de lui-même la forme du chat. Et ce, sans qu’on lui fournisse d’images labellisées « chat ». Concrètement, la machine a été nourrie pendant trois jours de millions de captures d’écran aléatoires de YouTube. A l’issue de cet entraînement, elle aurait été capable de détecter des têtes de chat et des corps humains – des formes récurrentes dans les images analysées. « Ce qui est remarquable, c’est que le système a découvert le concept de chat lui-même. Personne ne lui a jamais dit que c’était un chat », s’est félicité Andrew Ng, fondateur de Google Brain, dans les colonnes du magazine Forbes. Identifier le contexte, « la prochaine étape » Toutefois, être capable d’identifier un chat ou un humain sur une image ne suffit pas à comprendre ce qu’elle raconte. Une photo pourrait par exemple montrer un chat tentant de réveiller son maître, grognon, à l’aube en lui tapotant doucement le visage. Pour parvenir à décrire de cette façon une image, la machine devrait être en mesure d’identifier des objets, mais aussi un contexte, une interaction, voire même des émotions. « C’est la prochaine étape », estime Fei-Fei Li, directrice du Vision Lab de Stanford, dans une conférence TED donnée en mars. « Faire en sorte que les machines comprennent des scènes dans leur globalité, les comportements humains et les relations entre les objets. » L’équipe a déjà quelques résultats intéressants, avec un programme capable d’identifier « un homme dans un t-shirt noir qui joue de la guitare », « un ouvrier du bâtiment dans une veste de sécurité orange qui travaille sur une route » ou « deux petites filles qui jouent aux Legos ». Certains programmes sont capables de décrire des scènes dans des photos. Mais ce système n’est pas capable d’être plus subtil dans son analyse et fait encore beaucoup d’erreurs, quand il croit identifier « un jeune garçon qui tient une batte de baseball », « un chat assis sur un canapé avec une télécommande » et « une femme tenant un ours en peluche devant un miroir ». Le programme se trompe parfois dans les descriptions des images... L’autre difficulté, et pas des moindres, consiste à analyser les images d’une vidéo, mouvantes par définition. L’équipe de Jean Ponce utilise l’apprentissage supervisé pour permettre au programme d’identifier des objets sur ces images, en les nourrissant cette fois non pas de photos, mais de vidéos. Il est ainsi capable de repérer où ces objets se trouvent dans l’image, même s’ils bougent ou que la caméra change de point de vue. Le chercheur se sert aussi du cinéma pour entraîner ses machines à mieux « comprendre » des scènes filmées complexes. Car ce matériel a un énorme avantage : les films disposent de sous-titres et souvent de descriptions des scènes pour les personnes non-voyantes. Des données textuelles précieuses pour nourrir l’apprentissage de ces programmes. Ces technologies sont encore balbutiantes, et il reste encore un long chemin à parcourir avant que les machines ne comprennent les images comme les hommes. « Or, sans la perception, imaginer un robot autonome n’est pas possible », affirme Jean Ponce. « Pour manipuler, un objet, il faut savoir où il est ! » Même si certains robots réalisent aujourd’hui des prouesses, comme lors du DARPA Challenge organisé chaque année aux Etats-Unis, « essayez de mettre ça avec une personne âgée dans un environnement non contrôlé ! », ironise le chercheur. « I, Robot, ce n’est pas pour tout de suite. » IFRAME: //www.youtube.com/embed/BGOUSvaQcBs?wmode=transparent En bref : Ce dont l’intelligence artificielle est aujourd’hui capable : * Reconnaître des objets, des animaux, des visages, des espèces de plantes * Découvrir par elle-même de nouveaux objets Ce qu’elle ne sait pas faire : * Décrire des scènes complexes * Identifier les subtilités de l’image Les progrès qu’il reste à faire : * Réduire le taux d’erreur * Analyser les vidéos Lire dans la même série : Intelligence artificielle : une machine est-elle capable de philosopher ? Lire dans la même série : Intelligence artificielle : quand la machine imite l’artiste Lire dans la même série : Intelligence artificielle : une machine peut-elle ressentir de l’émotion ? Lire dans la même série : Apprentissage : l’intelligence artificielle, une élève de plus en plus douée * Morgane Tual Journaliste au Monde Suivre Aller sur la page de ce journaliste Suivre ce journaliste sur twitter Sur le même sujet * Apprentissage : l’intelligence artificielle, une élève de plus en plus douée * Mark Zuckerberg veut construire une intelligence artificielle comme « Jarvis dans “Iron Man” » * Rendre l’intelligence artificielle accessible à tous, « une façon de se blanchir » pour les entreprises * Elon Musk lance un centre sur l’intelligence artificielle pour « bénéficier à l’humanité » * Wikipedia se dote d’une intelligence artificielle pour mieux repérer le vandalisme Édition abonnés Contenu exclusif * La Silicon Valley se convertit au « machine learning » Abonnez-vous à partir de 1 € WikiLeaks ▪ Internet Actu ▪ The surveillance files ▪ Hadopi ▪ Logiciel libre ▪ Vie privée ▪ Téléchargement illégal ▪ Réseaux sociaux ▪ Drones ▪ Hits Playtime Le monde abonnements Profitez du journal où et quand vous voulez. Abonnements papier, offres 100 % numériques sur Web et tablette. S'abonner au Monde à partir de 1 € Déjà abonné au journal Le Monde ? * Activez votre accès à l'Édition abonnés du Monde.fr * Gérez votre abonnement Les rubriques du Monde.fr International ▪ Politique ▪ Société ▪ Économie ▪ Culture ▪ Sport ▪ Techno ▪ Style ▪ Vous ▪ Idées ▪ Planète ▪ Éducation ▪ Disparitions ▪ Santé ▪ Monde Académie Les services du Monde La boutique du Monde ▪ Le Monde dans les hôtels ▪ Cours d'anglais ▪ Annonces auto ▪ Annonces immo ▪ Shopping ▪ Comparateur crédit ▪ Conjugaison ▪ Programme télé ▪ Jeux ▪ Météo ▪ Trafic ▪ Prix de l'immobilier ▪ Source Sûre ▪ Carte des départements Données du Monde La Réunion ▪ Hautes-Alpes ▪ Vesaignes-sous-Lafauche ▪ Pommerol ▪ Remauville ▪ Fessenheim ▪ L'Abergement-Sainte-Colombe ▪ Hombourg ▪ Dombrot-le-Sec ▪ Afa Les sites du Groupe Télérama.fr ▪ Talents.fr ▪ Le Huffington Post ▪ CourrierInternational.com ▪ Monde-Diplomatique.fr ▪ Les Rencontres professionnelles Le Monde ▪ La Société des lecteurs du Monde ▪ Le Prix Le Monde de la recherche Sur le web * › Boutiques à Paris * › Blog séries TV * › Programme TNT * › TV replay * › Programme TV de Arte en replay * › Bars à Paris * › Ce soir à la TV TNT * › Actu littéraire * › Au cinéma cette semaine * › Actu média / net Recettes Brandade de morue ▪ Pate a crepe recette ▪ Déclaration d'amour Suivez-nous Facebook Twitter Google+ Instagram Mobile RSS Recevez nos newsletters Index actualité : A B C D E F G H I J K L M N O P Q R S T U V W X Y Z © Le Monde.fr | Fréquentation certifiée par l'OJD | CGV | Données personnelles | Mentions légales | Qui sommes-nous ? | Charte groupe | Publicité | Aide (FAQ) : web - abo - journal - mobile Journal d'information en ligne, Le Monde.fr offre à ses visiteurs un panorama complet de l'actualité. Découvrez chaque jour toute l'info en direct (de la politique à l'économie en passant par le sport et la météo) sur Le Monde.fr, le site de news leader de la presse française en ligne. En Continu