L'IA qui est en train de casser Rocket League

Poster un commentaire
lemaurinois

Et bin, j'ai pas sorti le cul des ronces !

IDoc
IDoc
1 an

@lemaurinois: Quand tu penses que l'IA d'avant avait le niveau Gold et que celle ci est déjà Grand Champion.
Et tu rajoutes à ca le demo hack : https://www.youtube.com/watch?v=4Fo6BHMvmIo
Ca annonce du cheat de competition (après normalement RLBot ne fonctionne pas "pour l'instant" en ranked)

lemaurinois

@IDoc: par contre ça peut être sympa pour du training.


Et question, ça marchera sous epic ?

Parce qu'on est beaucoup plus bridé que sur steam

IDoc
IDoc
1 an

@lemaurinois: RLBot fonctionne avec Bakkesmod qui tourne aussi bien sur Steam que Epic Games.
La truc chiant avec Epic c'est l'absence de Workshop comme sur Steam.
C'est une galère (mais pas impossible) de jouer avec des maps customs dessus.

IDoc
IDoc
1 an

Pour ceux qui veulent voir les matchs : https://www.youtube.com/@RLGym/videos
Puis le stream : https://www.twitch.tv/rlgym

boulbi
boulbi
1 an

Je bloque un peu sur le principe de l'IA concernant certain points dont celui-ci :

Une IA s'améliore en apprenant, or dans la vidéo le gars fait ce constat : " une fois que la balle est sur le toit d'une voiture, elle n'en tombera pas", soulignant ainsi la "maîtrise" acquise par l'IA.

Mais dans ce cas précis, j'ai l'impression que l'IA ne fait ni plus ni moins que ce que ferait excel quand on lui demande de trier en ordre alphabétique 12 000 lignes : il va le faire plus rapidement que n'importe quel être humain et sans se planter, mais il n'y a aucune notion d'intelligence à ce niveau, seulement une règle immuable à appliquer.
Et ici la règle, dans le jeu, c'est : corriger en permanence certains paramètres ( vitesse, trajectoire etc...) pour que la balle reste sur la voiture.

Si intelligence il y a, elle se retrouve uniquement dans le fait qu'il "faut" conserver la balle sur le toit pour parvenir plus facilement au but adverse et marquer, la maîtrise de la méthode, elle, n'a rien d'intelligent.

L'autre exemple avec les IA qui jouent à cache cache me semble bien plus pertinent du coup.

IDoc
IDoc
1 an

@boulbi: Il y a plusieurs possibilités, soit c'est le réseau neuronal qui a appris cela tout seul soit il a été guidé pour apprendre cela soit par apprentissage supervisé ou l'on guide clairement l'IA dans une direction ou encore en récompensant ce comportement (apprentissage par renforcement).
Je ne saurais te dire comment il l'a appris mais par contre en regardant le stream on voit clairement (dans le cas de Ragnarok) qu'il apprend tout seul sans supervision.

boulbi
boulbi
1 an

@IDoc: C'est une éventualité, mais du coup c'est de la "triche" : la puissance de calcul d'un processeur tout pourri pour gérer ces paramètres est tellement supérieure à ce que peut faire un cerveau humain.

Imagine sur fortnite : pour gagner je dois abattre les autres joueurs, et je me rends compte que si je leur tire en pleine tête ils meurent tout de suite et me garantissent la victoire. Je suis pas sur qu'une IA mette plus je 1 centième de seconde pour ajuster et faire un headshot et ce quelque soit la distance.

Et là on se retrouve dans une situation un peu biaisée ou "un peu" d'intelligence associée à une vitesse d'exécution impossible à atteindre donnent naissance à un monstre imbattable mais pas si intelligent que ça.

Il faudrait voir ce que ça donne sur des jeux plus complexes comme lol avec des millions de combinaisons et surtout de stratégies possibles.

IDoc
IDoc
1 an

@boulbi: C'est pas nouveau que la machine (physique ou logicielle) est supérieur à l'homme dans certains cas.
C'est le cas pour les échecs depuis plusieurs années et plus récemment le jeu de go.
Par contre, toute puissante est elle, la machine ne fonctionne que dans un cadre précis et si ce cadre change un peu trop, elle est inutilisable.
Mais on arrive à un moment ou dans certains jeux "complexe" la machine arrive au niveau, voir dépasse les humains.
D'ailleurs dans le processus de création d'un IA ennemi dans un jeu, il faut bien doser la puissance de cette IA sinon le jeu devient injouable et deplaisant.

HKarotte

@boulbi: "c'est de la triche" pourquoi ? Si la triche c'est d'affronter un.e adversaire d'un niveau inégal au notre et donc être dans une situation injuste qui nous laisse aucune chance OK, mais je crois pas que ce soit ça la définition de la triche. Si la triche c'est le fait de ne pas respecter les règles du jeu, et bien là il n'y a pas de triche.
C'est injuste, mais pas "illégal"

boulbi
boulbi
1 an

@HKarotte: En effet, ce n'est pas de la triche mais est ce que c'est une preuve d'intelligence ? Le fait qu'une IA s'appuie sur sa puissance de calcul pour être imbattable sur un aspect purement technique comme un angle d'attaque par exemple ne fait pas partie de l'intelligence à mon sens.
Par contre le fait d'être arrivé à la conclusion qu'il faut utiliser tel ou tel angle d'attaque ou telle ou telle vitesse pour gagner oui ça en fait partie.

Le "souci" c'est que IA et puissance de calcul sont indissociables. Pour arriver à déterminer la puissance d'une IA en terme de raisonnement, il faudrait lui enlever sa capacité/vitesse de calcul pour les éléments purement techniques.
Mais je n'ai pas l'impression que ce soit faisable pour le moment.

HKarotte

@boulbi: Oui.
Mais est-ce que c'est pas le principe même d'une IA et de tout ce qui est numérique de fonctionner grâce à des calculs, toujours plus poussés et toujours plus rapides ? C'est indissociable non ?

boulbi
boulbi
1 an

@HKarotte: Exact.

Waio
Waio
1 an

C'est quoi cette histoire de récompense, comme tu récompenses un programme?

Perso je pense que c'est du bullshit, c'est juste un programme qui retient dans une giga base de données sur les différents mouvements possibles.

Après, je code pas et ça m’intéresse pas plus que ça, donc ce que je pense c'est aussi du bullshit

lemaurinois

@Waio: avec un susucre

IDoc
IDoc
1 an

@Waio: Pour "diriger" l'apprentissage dans une direction que tu souhaites tu peux donner une récompense à ton IA lorsqu'elle fait une action que tu considère positive.
Cela la renforce dans le sens ou elle va chercher à récupérer le plus de récompense possible.
Cela marche aussi dans l'autre sens, ou par exemple sur Trackmania, si ton IA se retourne ou sort du tracé tu peux la punir.
Elle fera alors en sorte de données moins de poids a ses décisions qui ont mené à cette action "negative".

Une video sur une IA avec renforcement positif sur Trackmania : https://www.youtube.com/watch?v=SX08NT55YhA

Atmoz
Atmoz
1 an

@IDoc: Sa question était de savoir sous quelle forme se présente la récompense.
Genre tu lui offres des barrettes de RAM en plus, ou tu lui permets d'aller sur des sites de pr0n pendant une 1 ou 2h ?!?

Geraven
Geraven
1 an

@waio La récompense, c'est juste des bits. Le fait est que le terme récompense n'est que le terme que l'humain utilise pour identifier ce qu'il fait. Mais dans les faits, c'est qu'une variable qui est passé au programme et que le programme identifiée telle manière qu'il sait qu' il doit faire en sorte de refaire les actes associés.

Waio
Waio
1 an

@Geraven: en fait tu programmes le programme pour chercher à obtenir ces bits, c'est ça ?

IDoc
IDoc
1 an

@Waio: Pour qu'une IA puisse s'améliorer, il faut que le créateur de l'IA établisse un moyen d'évaluer une situation.
Il va donc en fonction de certains paramètres, calculer un "score" correspondant au résultat de l'action de l'IA.
Si l'IA fait un meilleur score alors elle s'est amélioré.
La récompense dans le reinforcement learning augmente le score, c'est à dire qu'a 2 situations qui aurait mener au même score, l'IA choisira celle qui a eu le plus de récompense pour sa prochaine évolution.

Cette page est réservée aux ADULTES

Tu es sur le point d'accéder à un site web qui contient du matériel explicite (pornographie).

Tu ne dois accéder à ce site que si tu as au moins 18 ans ou si tu as l'âge légal pour visionner ce type de matériel dans ta juridiction locale, l’âge le plus élevé étant retenu. En outre, tu déclares et garantis que tu ne permettras aucun mineur à d'accéder à ce site ou à ces services.


En accédant à ce site, tu acceptes nos conditions d'utilisation.