Jean-Robert a écrit: mais où commence le rocher et où finit-il ?
Comment font les aveugle pour ce retrouver dans les dédales de la vie de tout les jours? De quatre façon soit:
1. Par le toucher, avec la canne et aussi par le contact.
2. Par l'acoustique, avec la perseption des différent son qu'ils produisent par rapport à leur environnement et que ce dernier produits.
3. Par la perseption sensoriel de présence innerte et mobile.
4. Et par l'odorat.
(...)
Les chauves-souris arrive à identifier une proie et à former une image mentale de celle-ci tout en lui permettant de calculer sa distance par l'écho que celle-ci produit grace au son qu'elle à émit en détection. Ce qu'il faut alors réussir à faire c'est un programme qui est capable de faire la même chose...
.
Tu n'as saisi la profondeur de la difficulté que t'exposait Argyre.
J'ai du faire un module de robotique de qq heures, plus un petit projet personnel où il s'agissait - ô suprême complexité - de déterminer si un objet passant devant une rampe de capteurs, fournissant une image en 2 niveaux de gris (N&B autrement dit), était en un ou en plusieurs morceaux, genre une biscotte cassée dans une chaine agroalimentaire.
Bien sûr on est actuellement capable de performance bien meilleures que celles ci (reconnaissance d'écriture...) en termes de reconnaissance de formes, mais d'avoir abordé le problème au niveau le plus élémentaire m'a fait comprendre l'ineffable "saut" à effectuer pour passer de l'
information à la
signification. Distinguer qu'une biscotte est cassé
signifie que les deux formes qui se trouvent sous tes yeux, de forme "quelconque mais pas complètement quelconque" c'est à dire présentant une certaine symétrie et une régularité mais celle ci absolument quelconque, n'en formait qu'une, probablement de symétrie et de régularité plus élevée. Ce qui signifie de donner un sens au mot forme, déjà.
Comment ferais-tu ? Tu as une matrice de nombre avec des 0 et des 1 et tu dois les manipuler pour générer 'ça' ? Je te garantis que tu es comme une poule devant une poele à frire au départ.
Je vais te dire comment j'ai fait et comment les systèmes réellement efficaces, c'est à dire les tissus nerveux vivants, ne font
pas. Je "contaminais" ma matrice. Je partais d'un point "en haut à gauche" et je regardait la valeur de ses proches voisins. Si c'était des "1" je les "contaminais", c'est à dire que je les reportais dans une autre matrice ce qui signifiait que les points étaient jointifs. Rien que de définir "en haut à gauche" n'est PAS simple, selon que tu privilégies ce qui "le plus en haut" ou ce qui est "le plus à gauche"... En général, ce n'est ni l'un ni l'autre mais baste. Et ensuite, si la matrice contaminée était égale à la matrice de départ, alors tout était jointif et l'algo écrivait fièrement "BONNE BISCOTTE". Sauf que... si les deux morceaux ne sont pas présent sur la même "frame", la même image, alors tu déclares entier un moignon de biscotte, et c'est ridicule. Alors tu fais un test de surface (tu comptes le nombre de pixel à 1) et tu le compares à une consigne. Sauf que... si deux morceaux cassés sont jointifs par un point, ils ne forment qu'un seul morceau dont la surface entre dans les tolérance de la consigne, owned ! Alors tu définie que le morceau doit être convexe, qu'il ne doit pas contenir de zone de "0" en creux, et là tu commence vraiment à lutter pour définir algorithmiquement ce qui est "en creux" dans un "plein".
Et là, il ne s'agissait que de "0" et de "1". Imagine une image en 256 niveaux de gris. Imagine l'effet d'ombrage. Imagine le fait qu'un même objet peut être vu depuis tous les angles en tournant autour, tout en devant rester le même objet. Imagine ceci en mouvement.
Il n'empêche qu'il y a des poissons assez doués pour détecter depuis sous la surface de l'eau un insecte - le genre de truc précisément "de forme quelconque mais pas complètement quelconque" posé sur une branche et de lui balancer un jet d'eau calibré pour le jeter à l'eau. Et là tu comprends qu'ils ne s'y prennent pas comme ça. Le niveau algorithmique mené sur des tableaux de chiffres explose obligatoirement en complexité avec la complexité de l'image à analyser et du sens qu'il faut en retirer, ce qui inclue tout le contrôle moteur, car une image ne sert à rien si elle n'est pas en lien avec le mouvement qu'elle contrôle. Le cerveau ne se sert pas d'algorithme, ou alors d'une manière free style qui ne ressemble en rien à un programme écrit dans n'importe quel langage de prog.
Ce n'est pas un problème de nature du capteur. Le cerveaux s'accommode d'une diversité absolument ébouriffante de signaux de niveaux physiques disjoints. Un truc absolument fascinant, c'est celui qui consiste à faire retrouver la vision a des aveugles non pas en greffant des puces sur le nerfs optiques, opération très lourde, très délicate, invasive, pour leur permettre de distinguer une centaine de pixel, mais de leur placer sur la peau, n'importe qu'elle surface bien innervée du corps une matrice d'électrode picotantes qui reproduisent la matrice issue d'une petite caméra placé par exemple dans une monture de lunette.
Au départ on ne sens que des picotements. Mais au bout de 24h (!) on ne sens plus les picotement, le cerveau parvient à externaliser l'image c'est à dire à *voir* l'objet devant lui. A le resituer dans son ambiance 3D.
Bien entendu qu'a aucun moment de l'Evolution, le systeme nerveux n'a eu a traiter un signal provenant d'un objet en volume sur la surface de l'épiderme de la façon dont il est question dans cette expérience (des points images sous forme de picot sur la peau). Mais le module cérébral capable de cela est d'une plasticité bien plus profonde. C'est nécessairement disjoint de la nature du capteur, sauf que c'est quand même de genre visuel et donc en lien avec les compétences acquises par le vivant en connectant un cerveau à une rétine photosensible. C'est ce qui explique sans doute que des mammifères aient pu développer des performances voisines, voire supérieures sur certains aspects, à la vision, à partir d'un retours d'échos sonores.
Mais avant d'implémenter ça sur des robots, je pense qu'Argyre à le temps d'attraper des cheveux blancs :face:
Ceci dit, il y aussi peut être une "voie robotique", qui ne serait pas mimétique du vivant et qui feraient que les robots seraient de plus en plus utiles, sans ressembler forcément de plus en plus aux humains. Une machine a laver c'est très utile et ça ne ressemble a aucun être vivant...
a+