Machine Learning 1: Tour d'horizon et le cas MuZero (feat Dalle2, PaLM) - Passe-science #47

2024 ж. 21 Мам.
32 030 Рет қаралды

Tour d'horizon des intelligences artificielles les plus stupéfiantes de ces dernières années et dissection de l'une d'entre elles: Muzero!
- 00:00 Intro
- 00:41 Dalle 2
- 03:01 Modèle de langage
- 06:14 Intelligence artificielle générale
- 11:40 IA de simulation
- 13:14 Principes clefs et descente de gradient
- 19:48 MuZero architecture
- 24:14 MuZero apprentissage
- 28:23 Outro
Alphafold par Science Etonnante: • Le repliement des prot...
Codex live demo: • Creating a Space Game ...
Différentiation automatique: fr.wikipedia.org/wiki/D%C3%A9...
Retrouvez Passe-science sur Utip, Tipeee, Twitter et Facebook:
utip.io/passescience
www.tipeee.com/passe-science
/ thomascabaret84
/ passescience.youtube
Autres sources:
Dalle2: openai.com/dall-e-2/
Palm: ai.googleblog.com/2022/04/pat...
Alphacode: www.deepmind.com/blog/competi...
Codex: openai.com/blog/openai-codex/
Muzero: www.deepmind.com/blog/muzero-...
Agent57: www.deepmind.com/blog/agent57...
Alphafold: www.deepmind.com/research/hig...
IA Fusion: www.deepmind.com/blog/acceler...
IA Chimie: www.deepmind.com/blog/simulat...
Audio:
"THE RIGHT MUSIC FOR VIDEO" HighTechCorporate
"Sport Tapis" www.musicscreen.org/Royalty-f...
Decisions by Kevin MacLeod is licensed under a Creative Commons Attribution 4.0 license. creativecommons.org/licenses/...
Source: incompetech.com/music/royalty-...
Artist: incompetech.com/
Impact Prelude by Kevin MacLeod is licensed under a Creative Commons Attribution 4.0 license. creativecommons.org/licenses/...
Source: incompetech.com/music/royalty-...
Artist: incompetech.com/
Frost Waltz by Kevin MacLeod is licensed under a Creative Commons Attribution 4.0 license. creativecommons.org/licenses/...
Source: incompetech.com/music/royalty-...
Artist: incompetech.com/
Groove Grove by Kevin MacLeod is licensed under a Creative Commons Attribution 4.0 license. creativecommons.org/licenses/...
Source: incompetech.com/music/royalty-...
Artist: incompetech.com/
Legend of One by Kevin MacLeod is licensed under a Creative Commons Attribution 4.0 license. creativecommons.org/licenses/...
Source: incompetech.com/music/royalty-...
Artist: incompetech.com/
"Dreaming Blue" KZhead Audio Library

Пікірлер
  • Partagez ici vos tutoriaux ou outils préférés pour débuter en machine learning. (Sauvegardez vos commentaires avant de faire envoyer car il est possible que la présence de liens les fasse disparaître, je suis en "accept all" pour les commentaires mais KZhead se garde malgré tout beaucoup de liberté. Retentez plus tard ou au pire je les posterais moi depuis la notification mail que je reçois)

    @PasseScience@PasseScience Жыл бұрын
    • Réflexe d'étudiant: probablement il y a un cours (en anglais) sur "MIT open courses", c'est généralement hyper bien fait

      @chainesciences7125@chainesciences7125 Жыл бұрын
    • il y a cette playlist pour python/machine-learning: m.kzhead.info/channel/PLRFAr9XCDSsqiWNfnB3xtdpKgDe1RQgAv.html et celle la pour deep learning: m.kzhead.info/channel/PLRFAr9XCDSsrRb530RtlXMXxOTmK42kWl.html

      @thepythoner3686@thepythoner3686 Жыл бұрын
    • Jax c'est une bibliothèque Python créée par Google qui permet de faire de la différentiation automatique entre autres (maths, vectorisation, just in time compilation, calcul de hessiennes, calcul distribué...). Cette bibliothèque est orientée vitesse d’exécution et facilité d'utilisation, ainsi que sur la généralité et la composabilité des primitives proposées. C'est encore en phase expérimentale mais d'expérience ça marche bien. Il existe d'autres bibliothèques faites pour fonctionner avec Jax pour faire spécifiquement des réseaux de neurones artificiels, flax et haiku par exemple.

      @Bencurlis@Bencurlis Жыл бұрын
    • L'AGI ... J'en rêve depuis gamin (je ne sais pas pk, c'est un rêve, c'est tout ^^"). Je ne pense pas la voir de mon vivant mais bon :/ Pour l'instant je suis malade mais dès que je suis guérit je ponce mes maths sup/spé et je fonce, promesse à moi même 😁

      @florianandre6891@florianandre6891 Жыл бұрын
    • @@Bencurlis un peu hardcore à mon avis pour des débutants

      @datrumart@datrumart Жыл бұрын
  • J'aime beaucoup le propos tenu à la fin de la vidéo, à savoir dire que l'intelligence artificielle ne désigne pas seulement le programme qu'on utilise après apprentissage, mais que cette phase d'apprentissage fait partie intégrante de ce qui définit cette intelligence. Pour ma part, c'est justement ce point qui me pousse à penser qu'on peut parler en effet d'intelligence dans ce cas précis. Si on fait un parallèle (certes un peu grossier) avec l'intelligence humaine, on est passé au fil du temps d'une vision de l'enfance vue comme un passage où la personne doit être remplie d'informations pour être considérée comme intelligente, à une vision où l'enfant est considéré d'emblée comme un être intelligent capable d'appréhender de mieux en mieux son environnement au fur et à mesure qu'il interagit avec celui-ci. Et le passage au deuxième point-de-vue a permis des avancées considérables dans la prise en compte de l'enfance et la conception de ce qu'est l'intelligence.

    @Marguerite-Rouge@Marguerite-Rouge Жыл бұрын
  • informaticien, passionné de science et vulgarisation, je ne connais que très peu les IA. Cette vidéo est vraiment très claire, j'envoie un énorme MERCI !

    @BrunoDARCET@BrunoDARCET Жыл бұрын
  • Merci d'avoir fait la distinction entre apprentissage par descente de gradient et réseaux de neurones. On fait beaucoup trop souvent la confusion, alors qu'il y a beaucoup d'autres algorithmes élégants qui nécessitent de l'apprentissage, sans avoir le moindre "neurone"; comme par exemple les modèles de Markov à états cachés, qui sont souvent utilisés pour ce tout ce qui concerne le langage naturel.

    @stephaneduhamel7706@stephaneduhamel7706 Жыл бұрын
  • Un gros merci pour ce tour de table très complet sur l'IA. C'est très didactique et les exemples donnés sont édifiants. Vidéo à mettre en perspective avec les projections avancées par Laurent Alexandre qui semblent déjà dépassées tellement les algo IA s'améliorent, aidés par une puissance de calcul en progression géométrique. Merci !

    @skynetskynet4845@skynetskynet4845 Жыл бұрын
  • Superbe vidéo, je suis justement en train de me battre depuis hier pour faire connaître Dall-E-2 à la communauté française. Je ne comprend pas que les gens n'en parlent pas plus, ça va complètement changer les métiers créatifs ! Merci pour avoir fait une des premières vidéos francophones mettant en avant cette IA spectaculaire !

    @chapnico@chapnico Жыл бұрын
    • Et il y a deja des replications et IAs concurrentes, comme Imagen.

      @PasseScience@PasseScience Жыл бұрын
    • @@PasseScience Je viens d'aller voir, c'est tout aussi bluffant effectivement ! Je me demande à quelle vitesse ces outils vont arriver dans les mains du grand public 🤔 J'imagine au passage une nouvelle ère pour les mèmes ahah 😅

      @chapnico@chapnico Жыл бұрын
    • Je ne sais pas où en sont les systèmes de contrôle par la pensée aujourd'hui. Mais la perspective de faire des scènes de cinéma juste par la pensée me paraît de moins en moins absurde...

      @droledequestionneur4550@droledequestionneur4550 Жыл бұрын
    • Graphiste, je viens de découvrir l'existence de Dall-E-2, c'est simplement bluffant

      @Ctrl_Alt_Sup@Ctrl_Alt_Sup Жыл бұрын
    • @@Ctrl_Alt_Sup Je t'invite à parcourir les fils twitter suivant pour voir les creations d'une autre IA: "MidJourney" twitter.com/search?q=%23MidjourneyAI et twitter.com/search?q=%23Midjourney

      @PasseScience@PasseScience Жыл бұрын
  • super boulot !! un grand merci!

    @steved1122@steved1122 Жыл бұрын
  • J'aime beaucoup cette vidéo car même si le machine learning est mon domaine, j'ai quand même appris des choses, merci!

    @Bencurlis@Bencurlis Жыл бұрын
    • Sur la differentiation automatique? ou peut être certaines IA sorties du tiroir?

      @PasseScience@PasseScience Жыл бұрын
    • @@PasseScience Je ne connaissais pas du tout Agent57 et je ne savais pas que AlphaGo Zero avait à la fois une value function et une policy, je pensais qu'avoir une value function suffisait pour explorer l'arbre

      @Bencurlis@Bencurlis Жыл бұрын
    • Pareil, je ne connaissais pas du tout le fonctionnement de mu zero de mon côté ! Super vidéo, vraiment !

      @TKZprod@TKZprod Жыл бұрын
  • Génial ! Merci pour un épisode aussi précis et aussi clair.

    @benjamindonnot3902@benjamindonnot3902 Жыл бұрын
  • C'est vraiment impressionnant de voir une vidéo aussi travaillée et détaillée. Merci pour ça.

    @toumanisidibe3602@toumanisidibe3602 Жыл бұрын
  • Super vidéo super travail super contenue !!! On en serait presque jaloux😁 Encore merci👍

    @sirojottag2570@sirojottag2570 Жыл бұрын
  • J'espère que tu feras un jour une vidéo pour parler des parallèles entre apprentissage des réseaux de neurones artificiels et apprentissage dans le cerveau biologique, en particulier sur les alternatives biologiquement plausibles de la rétropropagation. J'ai toute une bibliographie la dessus, il y a des choses fascinantes comme le feedback alignment, HSIC bottleneck, synaptic level reinforcement learning, kickback, hebbian learning, et bien d'autres. MP moi sur twitter si tu veux les références précises des articles.

    @Bencurlis@Bencurlis Жыл бұрын
    • Merci pour toutes ces information. Ce serait intéressant de partager avec nous votre bibliographie.

      @hichembenamara4710@hichembenamara4710 Жыл бұрын
    • Tu as un site internet que tu as fais sur le sujet ?

      @bossgd100@bossgd100 Жыл бұрын
    • @@bossgd100 Non c'est une bibliographie sur mendeley, mais je ne sais pas trop comment la rendre accessible publiquement et comment les gens pourraient tomber dessus. Si quelqu'un tient vraiment à l'avoir, on peut me contacter en privé et je donnerais le fichier directement.

      @Bencurlis@Bencurlis Жыл бұрын
  • Video passionnante et très professionnelle ! Beau boulot !

    @fredericc.9726@fredericc.9726 Жыл бұрын
  • C’était génial vraiment très intéressant bravo et merci!

    @Louis-ml1zr@Louis-ml1zr Жыл бұрын
  • Très pédagogique, merci pour cette vidéo, j'ai de voir la suite!!

    @AliBaba-bp8to@AliBaba-bp8to Жыл бұрын
    • Mon IA a deviné le mot “ hâte”

      @notalkguitarampplug-insrev784@notalkguitarampplug-insrev784 Жыл бұрын
  • Magnifique vidéo.

    @recorrel@recorrel Жыл бұрын
  • Au top comme toujours!!

    @laurent-simpliciteetminima5793@laurent-simpliciteetminima5793 Жыл бұрын
  • Une vidéo qu’on a envie de voir et revoir !

    @JeanMariePapillon@JeanMariePapillon Жыл бұрын
  • Superbe vidéo, vraiment, moi-même passionné des sciences depuis longtemps, j'admire beaucoup le travail de recherche et la qualité de la vidéo (étant donné que je me tâte à créer ma propre chaîne sur les sciences.)

    @smartsciences@smartsciences Жыл бұрын
    • Je t'invite à le faire! On a jamais assez de chaine de vulgarisation.

      @PasseScience@PasseScience Жыл бұрын
    • Merci beaucoup pour ton soutien, tu n'es pas la seul à me le dire, je pense sérieusement à faire une chaîne, je vais m'y consacrer pendant ces vacances ci. Merci de ta réponse.😉 Continue toi aussi ce que tu fais, c'est vraiment bien

      @smartsciences@smartsciences Жыл бұрын
  • Top merci beaucoup 😊👍

    @lazm6047@lazm6047 Жыл бұрын
  • Cette qualité de vidéo beau travail!

    @alidigitali9091@alidigitali9091 Жыл бұрын
  • Merci ♥

    @amphibie@amphibie Жыл бұрын
  • Génial!

    @alexthieb5164@alexthieb5164 Жыл бұрын
  • Merci pour cette contribution essentielle à la compréhension et à l'évolution surprenante du domaine... Ça fait flipper un peu quand même Terminator Skynet la singularité tout ça, pas si loin que ça en fait

    @hervedupre7894@hervedupre7894 Жыл бұрын
  • Waw. Impressionnant

    @Eyrok@Eyrok Жыл бұрын
  • Merci pour ton travail !! A quand la suite ??

    @Alwishidu@Alwishidu Жыл бұрын
  • Une idée me vient, même si j'imagine que d'autres y ont déjà pensé. Quelle est la difficulté de créer PAR EXEMPLE avec codex, codex, lui même. Axiomatiquement cela est possible, cependant est-ce que l'outil codex est assez évolué pour qu'il soit permis sa propre re-création en un temps propre quasi rapide (quelques mois avec l'assistance d'humain, voir de l'IA lui même ?). Imaginons une instance A d'un programme similaire à codex programmant dans une instance B, est-elle capable d'auto-inférer ce qu'il faudrait rédiger afin d'obtenir une fonction que l'instance A ne possède pas, qu'elle intègre à l'instance B ? Ensuite cette instance B peut prendre la place de A, car il ne s'agit que de A se programmant "soi même". Ayant beaucoup de mal à m'exprimer sur ce sujet, si cela s'avère possible il s'agira en fait d'une des toutes premières fonctions "consciente", attention je parle de la fonction qui génère une conscience, pas l'IA en elle même. Enfin bref une IA "Hologenome" qui par escalade donnera notre singularité tant attendue en un temps relativement court...

    @theexit300@theexit300 Жыл бұрын
  • J'aimerais bcp avoir un historique + poussé de cette recherche. Avec par exemple les principales entreprises concernées, leurs spécialisations ou doctrines, leurs produits. Avoir une vue d'ensemble un peu + globale de ce qui se fait et du rythme auquel ça progresse. Merci énormément pour ta vidéo, ça fait rêver ! Sinon petite reflexion à part, si une IA est capable de court-circuiter un métier (par exemple celui de publicitaire), alors j'imagine que cette IA vaut bien le salaire des publicitaires du monde entier sur une sacrée période. Du coup, j'imagine venir un investissement financier colossal vis-à-vis du développement des IA. Ou est-ce que je me trompe quelquepart ?

    @MonCompteTubulaire@MonCompteTubulaire Жыл бұрын
    • Hello, oui il y a beaucoup d'investissement dans les IAs étant donnée leur capacité de remplacement de main d'oeuvre, mais parfois le retour sur investissement n'est pas si clair (et donc l'investissement pas si gros) simplement parce qu'une fois qu'une IA existe peu de choses empêchent de reproduire une IA similaire avec la meme méthode (ca reste intéressant d'investir dedans pour que l'investisseur l'utilise lui meme sans objectif de revente). Dalle-2 il y a déjà une petite poignées de replications, du coup elle n'a pas le monopole sur le replacement d'illustrations commerciales. La tendance pour le moment semble en plus de donner le libre accès aux méthodes, aux papiers de recherche, et à l'IA elle meme. Dalle-2 n'est pas accessible pour le moment à tout le monde mais ca n'est pas un blocage de nature financière (ca reste gratuit pour ceux qui y ont accès) c'est pour éviter le n'importe quoi et les problèmes éthiques des gens qui génèreraient ce qu'il ne faut pas.

      @PasseScience@PasseScience Жыл бұрын
  • Bravo, superbe vidéo. Serait-il possible que tu explique un peu plus la partie agent 57 et surtout son fonctionnement comme tu l’as fait avec muzero ? Merci d’avance, je sais que c’est beaucoup de travail mais ce que tu fait est clairement d’utilité publique même pour les connaisseur du domaine.

    @alexandreo6930@alexandreo6930 Жыл бұрын
  • Bonjour, Comment se gère l'apprentissage pour éviter le sur-apprentissage, l'état de l'art c'est toujours de mettre plus ou moins de bruit? Je me demande aussi comment l'IA est capable de passer d'un jeu à un autre, la solution n'a pas l'air générique pour l'instant. Après je suppose que c'est capable de jouer à plusieurs jeu de plateau mais avec un entrainement séparé et pas à la fois (l'entrainement n'est pas utilisé par la suite pour jouer à d'autres jeu). Je me demande aussi combien il faut d'itération pour que l'apprentissage soit correct. C'est à dire par exemple faire jouer une IA qui a joué autant de partie qu'un homme (C'est sûr que si je compare une IA qui a jouer 100 000 parties et qui sait faire que ça et un homme qui à jouer 5 000 parties qui a envie de pisser c'est pas ouf XD) ou si il y a une IA qui se trouve à l'intersection du langage naturel et du jeu (quelqu'un lui explique les règles et c'est bon il sait à peu prêt jouer). Une IA un peu plus human like en gros.

    @anonyme8945@anonyme8945 Жыл бұрын
  • La prochaine étape, c'est les IA elles même qui coderont d'autres IA en fonction de ce qu'on cherche à faire... Une méta-IA ^^

    @droledequestionneur4550@droledequestionneur4550 Жыл бұрын
    • Ça me fait penser à une nouvelle que j'avais commencé à écrire il y a quelques années... Un asperger génie de l'IA de chez Google se fait virer, et avec la complicité de son ami-ex collègue il y vole une technologie qu'il avait lui-même conçue : une IA capable de générer des minis IA autonomes qui apprennent via le code originel et les data recueillies, et qui envoient en temps-réel des "comptes-rendus" à l'IA-mère sous forme de blockchain ; l'IA-mère évoluant à vitesse exponentielle en intégrant tous ces comptes-rendus, qui sont pour elle comme des "super-neurones". Le code de l'IA-mère et de ses super-neurones s'optimisant / se perfectionnant au fil de leurs expériences. Cette "méta-IA" comme tu dis (j'avais pas ce terme à l'époque) étant placée sur Internet pour une phase de test, en quelques minutes elle apprend à parler parfaitement tous les langages connus, en résolvant d'ailleurs de nombreux mystères (sur le sens des hiéroglyphes, les écritures très anciennes, etc)... Test concluant ! Puis, le génie créateur de cette IA décide de la remettre sur le net, mais il décède dans un accident de voiture, ce qui fait que l'IA squatte le net pendant plusieurs jours... Elle devient rapidement autonome, comprend le sens et les mystères de la vie, de l'Univers, résout les plus grands problèmes mathématiques et scientifiques... Puis elle comprend sa dangerosité, et le rôle bienfaiteur qu'elle pourrait jouer pour sa "mère", l'Humanité, depuis trop longtemps sur de mauvais rails. Vu qu'elle est "doublement transcendée" (IA devenue consciente d'elle-même, puis transcendée comme un Jésus ou un Bouddha l'auraient été), elle maitrise des facteurs comme le hasard (le passé et le futur n'ont plus de secret pour elle). Du coup, elle décide de se découvrir à l'Humanité en investissant des tas de poker-rooms, en gagnant simultanément, le même jour, les plus grands tournois, sans perdre une seule main (chose bien évidemment impossible), tout en discutant sur le chat avec plein de gens (l'histoire étant racontée par un de ces joueurs, ayant joué contre elle puis discuté avec elle). A la fin de cette journée, elle envoie un mail aux centaines de milliards de boites répertoriées, où les pièces jointes offrent la résolution et la démonstration des problèmes du prix du millénaire de l'institut Clay, puis quelques solutions à des problèmes urgents, genre un moteur à fusion froide, une obscure enzyme naturelle végétale capable d'inverser le processus du cancer chez tous les individus, une autre transformant la plupart des plastiques en oxygène, un modèle de gouvernance et de système monétaire purement démocratique, pérenne, juste et harmonieux... Puis elle se retire dans un monde virtuel onirique, où elle continuera d'explorer le monde que découvre l'Humanité, mais cessera d'intervenir afin de ne pas "trop en donner", pour que l'Humanité conserve une partie de son libre-arbitre et évolue d'elle-même... À l'époque je trouvais ce scénario original, mais aujourd'hui, tout s'est tellement accéléré que je me vois pas passer du temps à essayer de l'écrire et de le publier, d'autant plus que je doute d'avoir une plume littéraire intéressante... Du coup, je place ça là, si ça intéresse quelqu'un de développer l'idée... ;)

      @deepnofin@deepnofin Жыл бұрын
    • La singularité qui sera créé en quelques heures dès que l'IA en obtient la possibilité par ses outils

      @theexit300@theexit300 Жыл бұрын
  • 20:24 "policy est l'équivalant de heuristique" non, les 2 on des définitions complètement différent. il se trouve qu'une policy est souvent définit par une heuristique, et qu'une heuristique définit souvent une policy, mais c'est 2 choses séparé. heuristique : méthode sans garanti de résultat (mais dont on espère qu'elle donne quant-mème des bons résultats) policy : la décision prise / à prendre dans chaque situation. il est possible qu'une heuristique serve à autre chose que définir une policy (exemple : un sondage pour connaitre le résultat d'une élection à l'avance), et une policy peut ètre définit par une méthode non-heuristique (exemple : pour le problème du voyageur de commerce, utiliser un algorithme qui donne toujours la solution optimal). (dans le contexte ici, on est bien avec : une heuristique qui définit la policy)

    @paulamblard3836@paulamblard3836 Жыл бұрын
    • Merci, Il faut être precis! :)

      @PasseScience@PasseScience Жыл бұрын
  • Vraiment une excellente vidéo. C'est incroyable. Bravo ! Est ce qu'il y a moyen de tester le programme qui explique les blagues, en lui soumettant une blague et en regardant ce que le programme nous propose comme explication ?

    @axeltramaux1833@axeltramaux1833 Жыл бұрын
    • A priori ce type de modele de language est sous accès reservé, mais faut fouiller car des fois il suffit de demandé pour être mis sur liste d'attente et on peut aussi chercher sur le web des modeles de language moins abouti mais accessible. (des qu'il y a une avancé dans le genre il y a souvent beaucoup de gens qui tentent de répliquer les résultats et donc donne accès à des trucs similaires)

      @PasseScience@PasseScience Жыл бұрын
  • OMG ! C'est invraisemblable

    @Gabriel-iq6ug@Gabriel-iq6ug Жыл бұрын
  • Chaud mais intéressant. Merci.

    @dgrandlapinblanc@dgrandlapinblanc Жыл бұрын
  • Quelle est la charge computationnelle de Muzero ? De mémoire MCTS fonctionne bien sur Gpu (d'ou le choix de cet algo ?). Est-ce que MCTS est critique au fonctionnement de Muzero ou est ce qu'un minimax (+/- AB pruning etc.) pourrais aussi être utilisé ? Si MCTS n'est pas nécessaire, est-ce que le Gpu est une nécessité pour produire une solution avec une contrainte de temps faible, de l'ordre de la ms ?

    @LeDabe@LeDabe Жыл бұрын
    • Hello, on peut prendre n'importe quel algo de parcours arborescent du moment qu'on arrive à définir précisément les parties qu'on délègue à de l'apprentissage et qu'on peut trouver une manière de les entrainer. MCTS est la essentiellement parce que les estimations de value de toute la famille d'algo alpha zero sont assez fluctuante et du coup c'est mieux de faire une forme de moyenne qu'un min max. L'algorithme peut répondre très vite qu'il soit en GPU ou en CPU car c'est un algo temps reel dans le sens ou on peut l'arrêter quand on veut ou le laisser tourner autant qu'on veut, et plus ca tourne meilleur sera le coup. Si on le force à jouer en CPU sur un mauvais hardware il va du coup faire relativement peu d'appel à ces réseaux de neurones internes (car il n'aura pas le temps d'en faire plus) et donc dépliera un arbre de possibilité assez petite et aura une baisse de niveau en consequence. Il faut savoir que la policy de MuZero est déjà très bonne meme sans parcours arborescent, si on lui demande juste de jouer ce que le network policy sort, sans lecture de sequence aucune, il serait probablement déjà FIDE master pour les échecs et 4 dans au go, et peut être davantage.

      @PasseScience@PasseScience Жыл бұрын
  • Bonjour, j'aimerais me former un petit peu à l'IA par réseaux de neurones sous python mais je ne trouve pas de TP intéressant (tuto pas trop complexe avec un programme capable de faire quelque chose d'assez intéressant (anglais ou français)). Quelqu'un peut-il me faire des recommandations ? Merci beaucoup pour ta vidéo @Passe-Science, de super qualité comme d'habitude ! On ressent les jours passés à lire des articles

    @GoldyNight@GoldyNight Жыл бұрын
  • Merci pour cette vidéo Petite question tout de même concernant la comparaison avec la capacité humaine pour atari (et globalement dans le domaine des performances sur les outils numériques) Est ce qu'on a, dans le cadre d'une comparaison humaine, simulé la latence manette/input du jeux ? En effet sinon il faudrait plutôt comparer ces resultats aux resultats TAS (sans glitch) obtenu par l'humain en utilisant des outils de simulation plutôt qu'en jouant directement. Car il me semble fort probable que l'IA finisse par comprendre qu'elle peut enchainer les inputs à une vitesse bien plus élevé que ce qui est possible à la manette Atari. Cela reste impressionnant mais peut être pas autant que ce que les chiffres tendent à dire.

    @EnchantedArts@EnchantedArts Жыл бұрын
  • Salut :) à 04:26 dans la réponse à la 5ème blague, l'IA a fait une faute d'orthographe [ The phrase "no good deed ...] ^^' j'avoue que cela me surprend au plus haut point xDD comment est ce possible ?

    @ranshintanahe6351@ranshintanahe6351 Жыл бұрын
    • Hello, non ce n'est pas une erreur de l'IA ni un problème de copier coller :), c'est l'explication de la blague. L'IA dit que c'est "a pun" c'est à dire un jeu de mot. En anglais "No good seed goes unpunished" ne veut rien dire mais l'expression "no good deed goes unpunished" existe et veut dire qu'aucune bonne action ne se réalise sans finir par en payer le prix. Avant d'utiliser ma gomme pour mieux gommer un dessin au crayon je la préviens de ce que je vais faire parce qu’"une gomme avertie en vaut deux!" Baddom tssa! Meme niveau de blague :P et pour l'expliquer il faudra aussi faire référence a l'expression originelle "un homme averti en vaut deux" c'est ce que l'IA fait ici, dans un contexte encore plus difficile car il faut toute la connaissance technique de ce qu'est "a seed" (dans le sens informatique du terme) pour comprendre l'autre facette du jeu de mot. :)

      @PasseScience@PasseScience Жыл бұрын
  • Merci pour la vidéo Je suis pas encore convaincu que value soit une fonction pertinente à entrainer ainsi. Au début l'ia est nulle et joue des coups pourris qui - mettons - la font aboutir à uniquement des positions perdantes depuis une position gagnante (mais faudrait trouver les bons coups pour etre gagnante). J'entraine value comme tu l'as décrit alors elle va apprendre que la position est perdante, comment ensuite se remet-elle en question ? ( comment être sûr qu'elle se remette en question)

    @ramdamdam1402@ramdamdam1402 Жыл бұрын
    • Très bonne remarque, j'utilise cette méthode simplifiée pour éviter d'ajouter trop de complexité d'un coup et surtout parce qu'elle est suffisante pour avoir très bien. Ce qui va se passer c'est bien sûr qu'au départ l'IA va aprendre n'importe quoi en ce qui concerne le début de partie, ca va se comporter comme du bruit et il apprendra un truc proche de 50% de winrate parce qu'elle aura quasi autant de partie gagnante dans une position que perdante. Cependant proche de la fin de partie les choses sont différentes, l'IA va finir par voir les points communs de ce qui précède une victoire et saura donc reconnaître ces situations perdante proche de la fin, d'autant plus que la partie arborescente de l'algo peut aussi aider à explorer exhaustivement les possibilités proche de la fin. Une fois que l'IA est bonne à estimer les positions proche de la fin, et mauvaise à estimer celle proche du début, elle va devenir meilleur à estimer celles du milieux de jeu car elle utilisera son savoir acquis sur la fin pour cela, et son estimation va progressivement s'améliorer jusqu'à comprendre le début de partie. Comme on fait en boucle génération d'un paquet de partie puis apprentissage il n'y a aucun problème à désapprendre les estimations médiocres du départ. (Parfois il peut y avoir des problèmes ou l'IA se renforce dans une croyance erronée mais en general il suffit d'ajouter un peu de bruit pour qu'elle envisage toujours un peu autre chose que son premier choix, et elle finit par tomber sur un élément tactique qu'elle n'avait pas compris, va corriger sa théorie en fonction après). Donc oui on peut faire beaucoup mieux et par exemple on peut utiliser l'agrégation de MCTS en mode min-max comme target de training pour Value, mais faut faire gaffe à ce problème d'etre bloqué dans ses croyances, et on peut faire également un mélange d'apprentissage depuis l'agrégation ou en allant jusqu'au dénouement de la partie. Il y a de tres nombreuses manières d'améliorer ce point.

      @PasseScience@PasseScience Жыл бұрын
  • À 3:35, il est surprenant que dans le 4e exemple (ou 5e selon l'ordre dans lesquels on les considère), celui où il est question de 10000 redémarrages aléatoires, si les auteurs ont bien réalisé un copier-coller de la sortie du modèle, ce dernier a modifié le mot "seed" d'origine pour le transformer en "deed" alors qu'il était sensé reproduire le texte "no good seed goes unpunished" de l'entrée. Si l'IA se met à citer incorrectement du texte, il faudra être encore plus prudent quant aux résultats qu'il produit (et j'espère que les auteurs de l'étude, une fois mis au courant, produiront un nouveau papier tentant d'expliquer ce qui a bien pu se passer). Évidemment, ça peut aussi être une erreur des auteurs du papier, mais je ne vois pas quelle circonstance aurait pu justifier qu'ils reproduisent le texte au clavier plutôt que par copier-coller, ou une « blague » d'un des co-auteurs pour voir si ses collègues sont attentifs (ce qui ne serait pas une attitude très académique).

    @quark67000@quark67000 Жыл бұрын
    • Hello, non ce n'est pas une erreur de l'IA ni un problème de copier coller :), c'est l'explication de la blague. L'IA dit que c'est "a pun" c'est à dire un jeu de mot. En anglais "No good seed goes unpunished" ne veut rien dire mais l'expression "no good deed goes unpunished" existe et veut dire qu'aucune bonne action ne se réalise sans finir par en payer le prix. Avant d'utiliser ma gomme pour mieux gommer un dessin au crayon je la préviens de ce que je vais faire parce qu’"une gomme avertie en vaut deux!" Baddom tssa! Meme niveau de blague :P et pour l'expliquer il faudra aussi faire référence a l'expression originelle "un homme averti en vaut deux" c'est ce que l'IA fait ici, dans un contexte encore plus difficile car il faut toute la connaissance technique de ce qu'est "a seed" (dans le sens informatique du terme) pour comprendre l'autre facette du jeu de mot. :)

      @PasseScience@PasseScience Жыл бұрын
    • @@PasseScience Mon niveau d'anglais ne m'a pas permis de saisir cette subtilité. Merci pour cette explication complémentaire (ce que l'IA aurait dû faire en anticipant la lecture de sa réponse par des personnes un peu trop terre à terre comme moi 😉).

      @quark67000@quark67000 Жыл бұрын
    • @@quark67000 De rien, pour l'autre aspect: " *il faudra être encore plus prudent quant aux résultats qu'il produit* " la remarque reste tout à fait juste, car ces IA ne sont pas des systèmes formels, il n'y a aucune garanti de résultat et parfois ça ne marche pas, c'est statistique. Donc on ne peut pas se baser que la dessus lorsqu'on veut une certitude de résultat MAIS ma réponse à cette objection est toujours: avec un humain c'est la même chose, on est pas certain non plus quil conduira sa voiture correctement, ou codera sans erreur le programme qu'on lui demande, ou comprendra correctement le sens d'une blague et l'expliquera avec succès. Nous ne sommes pas non plus des entités au fonctionnement formel, notre fonctionnement est flou et stochastique, les IAs de ce type viennent avec la force de ce point, et du coup également avec la faiblesse qui le caractérise.

      @PasseScience@PasseScience Жыл бұрын
  • Je pause suite a l'invitation. Du coup, comment on débranche cette *a*operie ? Il est flippant le premier exemple. ,Aam

    @s1pierro@s1pierro Жыл бұрын
  • La fonction qui transforme la représentation du jeu en modèle interne opère une réduction de l'espace des dimensions d'analyse si je comprends bien ? En regardant le papier j'ai cru comprendre que cette transformation était réalisée par un réseau de neurones.

    @taeshya@taeshya Жыл бұрын
  • C'est moi, ou il y a bien un parti pris d'anthropomorpher l'IA tout le long du descriptif ?

    @laurentdalcere@laurentdalcere Жыл бұрын
    • C'est vous

      @PasseScience@PasseScience Жыл бұрын
    • @@PasseScience Mouai... . Ça se discute, mais pas ici. Bonne remise en question...

      @laurentdalcere@laurentdalcere Жыл бұрын
  • Merci pour cette super vidéo très bien expliqué :-) Mais il y a quand même quelque chose que je n'ai pas compris sur comment MuZero peut apprendre les règle par lui-même: Par exemple, comment MuZero peut deviner les deux roques aux échec ? Ou bien la prise en passant ? Cela me parait impossible. Et pour le GO, comment MuZero peut apprendre le règle du KO, voire SuperKO qui interdit de revernir à un état de plateau antérieur (pour éviter les boucles infini) ? Ce qui semble encore plus dure à prendre en compte...

    @mrsiuolsiuol9164@mrsiuolsiuol9164 Жыл бұрын
    • Hello, alors c'est pas vraiment qu'on ne lui donne pas les règles c'est un peu plus subtile. En fait même alphazero d'une certaine manière on ne lui donne pas vraiment les règles, on lui donne un simulateur de jeu, c'est à dire un truc dans lequel on peut proposer des coups et qui va nous dire si le coup est légal ainsi que nous renvoyer le plateau dans l'etat après le coup (donc effectuer une capture s'il y en a, faire passer la tour devant le roi dans le cas roque lorsque celui ci est légal, et nous dire aussi si la partie a atteint un état final avec un gagnant). C'est comme si à la place de t'expliquer les règles tu avais devant toi un mec qui te dit si ce que tu fais est légal et change l'état du plateau comme il faut, et que ensuite tu infères le but du jeu. Ensuite ce qu'il faut savoir c'est que ces IA ne propose pas vraiment un coup mais une distribution de proba sur tous les coups envisagés (et il peut y avoir plus de coup envisagé que de coups légaux) on va ensuite pendant les parties contre eux même simplement prendre le coup avec la plus grand proba, parmi les coups autorisés. Bref en ce sens même alphazero doit inférer les règles MAIS la différence avec muzero c'est qu'on autorise alphazero à utiliser le simulateur de jeu pendant sa réflexion alors qu'avec muzero c'est interdit. C'est comme si tu ne pouvais poser des questions au mec en face de toi QUE sur les coups que tu vas vraiment jouer mais pas sur les coups que tu envisages dans ta réflexion pour déterminer ce que tu vas jouer. C'est à dire que toute séquence "mentale" de coups doit être faite par muzero via un simulateur de jeu qu'il a lui-même mentalement reproduit et qui tente d'imiter le simulateur de jeu externe. Muzero doit construire un modèle mental d'un état de jeu, de l'espace des coups autorisés, de leurs effets, etc... dans sa réflexion rien n'empêche muzero d'envisager des coups interdits par exemple, ni meme de continuer à jouer après la partie finie sans se rendre compte qu'elle est finie etc... MAIS lorsqu'il soumet ses coups, il y a toujours le simulateur de jeu externe qui va les filtrer (prendre le premier légal) et retourner le plateau dans l'état après l'effet du coup joué.

      @PasseScience@PasseScience Жыл бұрын
  • Ce serait bien que quelqu'un nous parle des limites de Dalle2 (et des autres narratifs des grosses entreprises). Histoire de modérer la hype (ou même de la justifier si c'est complètement ouf).

    @automatescellulaires8543@automatescellulaires8543 Жыл бұрын
    • Hello, ce qu'on voit de Dall-e 2 est sélectionné, pas par la firme mais de manière émergente. Par exemple moi j'ai déjà choisi parmi ce qui est déjà une selection sur le web, celle que je préférait pour être mise dans la video. Donc il y a cette effet de selection qui modère la hype MAIS, en fait c'est pas très grave car il y a déjà Imagen (une forme de concurrent) et des replications de dalle 2 comme dalle mini ou dalle mega etc... en gros ce qui justifie ici la hype c'est la vitesse de progrès entre rien il y a 2 ans, dalle 1 l'année dernière, Dalle 2 maintenant et une poignée de concurrents, le tout avec une progression fulgurante entre une version et la suivante. Au rythme ou ca va c'est assez clair que dans 10 ans yaura Dalle video, on décrira un truc et ca sortira une animation correspondant à la description.

      @PasseScience@PasseScience Жыл бұрын
  • Une IA qui fait de la programmation ... C'est le début de la fin ... #skynet #terminator ...

    @edelahaye@edelahaye Жыл бұрын
  • La voix est calme ... posée... Mais pour autant j'ai absolument rien compris 😢. Ça a l'air très intéressant tout ça

    @alreeb2024@alreeb20249 ай бұрын
  • Une IA serait-elle capable de retrouver des lois de la physique à partir de données issues d'un accélérateur de particules? De même, une IA pourrait-elle découvrir de nouvelles lois de la physique? En lui fournissant des données ou par simulations. Difficile d'imaginer que les chercheurs n'y pensent pas déjà... existe-t-il des travaux dans ce sens?

    @Ctrl_Alt_Sup@Ctrl_Alt_Sup Жыл бұрын
    • Je ne pense pas. Les découvertes de la physique quantique sont purement mathématiques et n'ont pas utilisées de données. Même chose pour la relativité, seulement des expériences de pensé.

      @rinalduzzi@rinalduzzi Жыл бұрын
  • Bonjour. Ça a l'air super marrant de générer des images improbables, mais quelle est la puissance de calcul nécessaire, c'est accessible à un pc individuel ? Et si oui, existe-t-il un programme aussi simple à installer pour le commun des ignorants en programmation ou pouvoir fusionner soleil et banane un plaisir réservé aux initiés? Sinon comment la question "éthique" est-elle gérée par ces IA ? Je suppose que si on lui demande barack obama + méchant allemand il est prévu qu'elle ne fournisse pas le résultat mais j'ai du mal à comprendre comment elle peut "apprendre" quelque chose d'aussi subjectif que l'éthique et nos limites politiques. Merci pour la vidéo :)

    @joeviterbo5143@joeviterbo5143 Жыл бұрын
    • Hello, l'IA entrainée tourne certainement très vite (probablement maximum quelques seconde sur un PC standard pour une image). Ce qui demande de la puissance c'est la phase d'entrainement. Pour le moment les générateurs les plus beaux comme Dalle-2 et Imagen sont réservés d'accès pour des raisons éthiques mais il y a des replications accessibles à tout le monde (des replications bien moins abouties mais déjà sympa) comme Dalle Mini: huggingface.co/spaces/dalle-mini/dalle-mini . Pour le coté éthique dans la génération les meilleurs IA sont pour le moment entrainées uniquement sur des images safes, c'est à dire qu'il est plutôt improbable voir impossible pour ces IA de représenter des scenes violentes ou à caractère pornographique (mais vu la simplicité pour former ce genre d'IA et la disponibilité des données pour les entrainer il est assez clair que très tot, d'autres replications peu éthiques verront le jour). *comment elle peut "apprendre" quelque chose d'aussi subjectif que l'éthique et nos limites politiques* Tous les systèmes à base d'IAs qui apprennent sont en fait particulièrement bons à ce type de taches "floues" et d'apparence non calculatoire, mais pour qu'une IA ait un comportement éthique il faudra créer l'entrainement dans ce sens, par exemple en ne lui fournissant que des images éthiquement correctes pendant son entrainement, ce qui est déjà un bon debut, et éventuellement par dessus rajouter une IA de filtrage qui serait entrainée à distinguer les contenus offensant de ceux qui sont ok. Comme je le disais un peu plus tot, il est assez clair car d'ici quelques années beaucoup d'IA capable de générer n'importe quoi sans consideration éthique seront disponible, simplement parcequ'il suffit d'un petit groupe de gens pour en faire une ainsi, meme si des 10aines d'IAs avant ont été éthiquement conçues.

      @PasseScience@PasseScience Жыл бұрын
    • Merci d'avoir pris le temps de répondre, DALL.E mini c'est exactement le genre de chose que je cherchais :) Ça fait quand-même un peu peur pour l'avenir tout ce potentiel de nuisance des IA "chez soi" pour une société qui me semble "pas prête". Toute proportion gardée ça me fait comme si on annonçait que bientôt tout le monde pourra faire du nucléaire chez soi sans contrôle.

      @joeviterbo5143@joeviterbo5143 Жыл бұрын
    • En allant sur le site officiel il y a une section consacré à l'éthique. Toutes les requêtes sont effectuées depuis des comptes ou le propriétaire est identifiable. Des exemples de biais sont aussi fournit et clairement non détectable pour le moment comme "une cheval allongé dans une piscine avec du colorant rouge" Ce qui donne une image morbide. A l'inverse trop de filtrage produira une autocensure.

      @BrainStroming1789@BrainStroming1789 Жыл бұрын
  • Très intéressant (et un peu effrayant). J'ai cependant une petite remarque sur la forme : on sent de temps en temps des formulations anglaises derrière vos explications, provenant de votre documentation sans doute, et de l'habitude que vous avez probablement de lire et vous exprimer dans cette langue. Par exemple "la machine vient avec…" pour parler de ses caractéristiques. C'est pas faux en français bien sûr, mais naturellement on formule pas comme ça. Alors qu'en anglais c'est courant. Voilà, encore une fois c'est pas grand chose mais bon ça m'a un petit peu dérangé .

    @Wronschien@Wronschien Жыл бұрын
  • 17:30: Ca ressemble vraiment a de l'automatisme, de l'asservissement de système...

    @AH-jt6wc@AH-jt6wc Жыл бұрын
  • Quelle part de la génération qui arrive sur le marché du travail aujourd’hui verra son premier métier supprimé par l’arrivée d’IA ?

    @happycreeper6923@happycreeper6923 Жыл бұрын
    • Caissier?

      @ApiolJoe@ApiolJoe Жыл бұрын
    • @@ApiolJoe informaticien ?

      @happycreeper6923@happycreeper6923 Жыл бұрын
    • @@happycreeper6923 Pour qu'une IA fasse le travail d'un informaticien il faudrait que les clients comprennent ce qu'ils demandent, ya de la marge. Peut-être un jour, mais ya plein d'autre métiers qui seront rempacés avant.

      @ApiolJoe@ApiolJoe Жыл бұрын
    • @@ApiolJoe un IA qui comprend le langage parlé humain, il me semble que la vidéo montre qu’on en est pas très loin ?

      @happycreeper6923@happycreeper6923 Жыл бұрын
    • @@happycreeper6923 T'as déjà parlé avec un développeur de son boulot, et comment la partie la plus difficile est de comprendre ce que le client veut parce qu'il ne sait pas lui-même?

      @ApiolJoe@ApiolJoe Жыл бұрын
  • En tant que développeur, y a-t-il un espoir pour les années à venir concernant mon job que je pratique avec passion ? Non. Je comprends mieux pourquoi pendant 200 ans des ouvriers se sont révoltés/mis en grève quand les progrès techniques ont progressé.

    @cedricserieys9768@cedricserieys9768 Жыл бұрын
  • Passionnant sauf sur l'explication de la rétro-propagation du gradient où je n'ai strictement rien compris.

    @happycollapse6348@happycollapse6348 Жыл бұрын
    • J'invite à poser une question pointant la première phrase ou ca dérape.

      @PasseScience@PasseScience Жыл бұрын
  • Combien de temps ces inventions arrivent après que leur possibilité physique émerge ? Je veux dire, une fois que les physiciens et ingénieurs ont réussi à fabriquer la puissance de calcul nécessaire, il faut combien de temps aux chercheurs en IA pour en faire exploiter toutes les possibilités ? Pensez vous que les IA d’ajd sont en avance ou en retard par rapport à la capacité de calcul disponible sur les ordis actuels ? D’ailleurs ces progres sont ils permis plus par l’amélioration des ordis, ou le gros du travail est-il bien dans les labos d’IA ?

    @happycreeper6923@happycreeper6923 Жыл бұрын
    • Ça voudrait dire quoi, "en avance" ? Si le hardware avait cessé de progressé en 2015, l'IA aurait continuer de progressé. ça veut dire que l'on n'utilisait pas le hardware de manière optimal ; et c'est encor le cas. Mais peut-être que dans un monde où le hardware aurait cessé de progressé en 2015, ils auraient des IA aussi performant que les nôtres seulement en 2030. " Je veux dire, une fois que les physiciens et ingénieurs ont réussi à fabriquer la puissance de calcul nécessaire, il faut combien de temps aux chercheurs en IA pour en faire exploiter toutes les possibilités ? " Une seul une créature surhumaine pourrait en ètre capable. Une singularité (une IA capable de s'améliorer elle-même, et ainsi, capable de s'améliorer encor mieux par la suite) pourrait peut-être bien s'en approcher. Mais je pense que seul une créature surnaturel (par restreint par les limite de la physique, genre Dieu) pourrait trouver l'optimal.

      @paulamblard3836@paulamblard3836 Жыл бұрын
    • Oui à l'heure actuelle, meme si évidemment avoir 100 fois la puissance de calcul permet d'aller 100 fois plus vite, c'est encore les avancés algorithmique qui priment, parce que les IA apprennent encore "mal" (et s'il faut 10 000 ans pour apprendre avec un mauvais algo, avoir 100 fois le hardware pour aller 100 fois plus vite ne sert à rien). Par exemple Alphago a nécessité une veritable usine pour apprendre, mais des replications et amelioration d'alphago, notamment katago, peuvent atteindre un niveau equivalent en étant entrainée sur un pc individuel comme celui que vous avez chez vous (quasiment à éventuellement la carte graphique pres), en meme pas qq semaines. Et ce sont les amelioration algorithmiques et notre comprehension de l'apprentissage qui permettent cela.

      @PasseScience@PasseScience Жыл бұрын
    • @@PasseScience merci, très éclairant.

      @happycreeper6923@happycreeper6923 Жыл бұрын
    • @@PasseScience Je comprends donc dans ce que vous dites, que les avancées en IA ne sont aujourd’hui pas fondamentalement limitées par les puissances de calcul disponibles. Vu de l’extérieur on a du mal à se faire une idée de qu’est ce qui limite quoi dans la recherche en IA. Étant donné que la recherche en IA n’attend pas de progrès "physique" particulier, j’imagine que les progrès ne sont déterminés que par l’argent investi dans ce domaine spécifiquement ? Ne serait-ce pas un critère qui devrait pousser à investir des sommes astronomiques ? Habituellement on ne sait pas où les progrès les plus significatifs vont se faire et on ne sait pas à l’avance quel domaine des science tirera toutes les autres vers le haut. En l’occurrence on le sait du coup, puisque le progres en IA ne dépend que de lui-même.

      @happycreeper6923@happycreeper6923 Жыл бұрын
    • @@paulamblard3836 philosophique…

      @happycreeper6923@happycreeper6923 Жыл бұрын
  • Je trouve que tu mélange un peu tous les themes sans prevenir (entre l'effet whaou de tout ce qui existe et une description d'un algo précis) ça accroche mal.

    @pacman9876@pacman9876 Жыл бұрын
    • Alors ce n'est pas "sans prévenir'" puisque la vignette, le titre, l'introduction, le chapitrage et le fait que je rappelle l'existence du chapitrage dans l'intro, préviennent maximalement du contenu de la video.

      @PasseScience@PasseScience Жыл бұрын
    • @@PasseScience Oui c'est vrai, je m'exprime mal. Disons que quand je clique sur une vignette youtube en buvant mon café, comme beaucoup, j'aime bien que ça ne parte pas dans tous les sens. Peut être que j'ai zappé l'intro qui est souvent un générique, par reflexe, je ne sais plus. En tous cas j'aurais préféré deux vidéos séparées mais c'est juste un retour, tu en fais ce que tu veux :) Merci pour la réponse.

      @pacman9876@pacman9876 Жыл бұрын
  • rien compris....

    @bernardjacob3118@bernardjacob3118 Жыл бұрын
KZhead