Download Pack formation - Udemy - Apprentissage par renforcement avec Python Torrent

Torrent Contents Size: 10.79 GB

Pack formation - Udemy - Apprentissage par renforcement avec Python

Partie 01

01 - Introduction à la problématique de l'apprentissage par renforcement

01 - Présentation.mkv	MKV	79.84 MB
02 - Concepts et terminologie.mkv	MKV	55.47 MB
03 - Fonctionnement de l'apprentissage par renforcement.mkv	MKV	29.75 MB
04 - Autres concepts.mkv	MKV	59.08 MB
05 - Processus de décision Markovien (MDP) déterministes.mkv	MKV	51.35 MB
06 - MDP stochastiques.mkv	MKV	13.59 MB
07 - Exemple de MDP en 2D sous Python.mkv	MKV	28.98 MB
08 - Table des transitions stochastiques.mkv	MKV	66.7 MB
09 - Formulation mathématique des MDP.mkv	MKV	58.58 MB
10 - Problématique du bandit manchot.mkv	MKV	75.94 MB
11 - Paramétrage des distributions (loi normale).mkv	MKV	40.36 MB
12 - Calcul de la valeur d'une action.mkv	MKV	41.14 MB
13 - Programme Python du bandit manchot.mkv	MKV	82.72 MB
14 - Utiliser les tenseurs en Python avec Numpy.mkv	MKV	68.57 MB
15 - Programme de simulation.mkv	MKV	32.19 MB
16 - Simulation avec la méthode Epsilon-Greedy.mkv	MKV	30.37 MB
17 - Simulation avec la méthode UCB.mkv	MKV	30.13 MB

02 - Approche avec les équations de Bellman

01 - Fonction valeur d'état.mkv	MKV	69.88 MB
02 - Fonction valeur d'action.mkv	MKV	21.77 MB
03 - Equation de Bellman pour la valeur d'état.mkv	MKV	61.13 MB
04 - Equation de Bellman pour la valeur d'action.mkv	MKV	25.45 MB
05 - Optimalité.mkv	MKV	9.44 MB
06 - Exemple en Python - Présentation du problème.mkv	MKV	27.48 MB
07 - Exemple en Python - Construction de la table de transition.mkv	MKV	87.82 MB
08 - Exemple en Python - Application de l'algorithme.mkv	MKV	127.51 MB

03 - Application sur un projet réel

01 - Présentation du projet.mkv	MKV	92.64 MB
02 - Instanciation de la classe et table des transitions.mkv	MKV	52.38 MB
03 - Table des valeurs des actions et des états.mkv	MKV	9.43 MB
04 - Application Bellman avec stratégie Greddy.mkv	MKV	78.24 MB
05 - Application Bellman avec stratégie Epsilon-Greedy.mkv	MKV	42.25 MB

04 - Méthodes d'optimisation basées sur la programmation dynamique

01 - Introduction à la programmation dynamique.mkv	MKV	32.97 MB
02 - Exemple d'algorithme récursif et dynamique.mkv	MKV	34.74 MB
03 - Rappels sur l'optimalité des fonctions de valeurs d'actions et d'états.mkv	MKV	29.36 MB
04 - Algorithme itératif pour l'évaluation des stratégies.mkv	MKV	104.65 MB
05 - Algorithme d'amélioration des stratégies.mkv	MKV	75.82 MB
06 - Algorithme final d'itération des stratégies.mkv	MKV	23.13 MB
07 - Exemple Frozen Lake non déterministe.mkv	MKV	127.8 MB
08 - Exemple Frozen Lake quasi-déterministe.mkv	MKV	15.9 MB
09 - Algorithme par itération des valeurs.mkv	MKV	35.87 MB
10 - Application sur le projet du magasin.mkv	MKV	110.72 MB

05 - Méthodes de Monte Carlo

01 - Introduction aux méthodes de Monte Carlo.mkv	MKV	50.98 MB
02 - Estimation de la fonction des valeurs des états.mkv	MKV	38.23 MB
03 - Exemple présentation du jeu et création des trajectoires.mkv	MKV	90.74 MB
04 - Estimation des valeurs des états avec les algorithmes FVMC et EVMC.mkv	MKV	56.45 MB
05 - Blackjack - Règles du jeu et avantage de la méthode de Monte Carlo.mkv	MKV	90.12 MB
06 - Blackjack - Création des stratégies initiales et des trajectoires.mkv	MKV	98.67 MB
07 - Blackjack - Estimation de la fonction des valeurs des états.mkv	MKV	119.5 MB
08 - Estimation de la fonction des valeurs des actions.mkv	MKV	66.4 MB
09 - Blackjack - Estimation de la fonction des valeurs des actions.mkv	MKV	89.11 MB
10 - Approximation des stratégies optimales.mkv	MKV	52.57 MB
11 - Blackjack - Approximation des stratégies optimales.mkv	MKV	114.34 MB
12 - Stratégies de type epsilon-soft.mkv	MKV	30.51 MB
13 - Blackjack - Stratégies de type epsilon soft.mkv	MKV	81.97 MB
14 - Prédictions avec échantillonnage préférentiel - On-policy et Off-policy.mkv	MKV	68.83 MB
15 - Ratio d'échantillonnage préférentiel.mkv	MKV	58.83 MB
16 - Méthode de calcul de la prédiction.mkv	MKV	55.34 MB
17 - Algorithme itératif de prédiction.mkv	MKV	58.81 MB
18 - Test de convergence des algorithmes d'échantillonnage préférentiel et ordina.mkv	MKV	182.3 MB
19 - Contrôle Monte Carlo de type Off Policy.mkv	MKV	57.28 MB

06 - Apprentissage par différences temporelles (TD Methods) - Sarsa et Q-learning

01 - Introduction à l'apprentissage de type TD.mkv	MKV	26.72 MB
02 - Petit retour sur la méthode de Monte-Carlo.mkv	MKV	45.29 MB
03 - Prédiction par différences temporelles.mkv	MKV	75.32 MB
04 - Exemple d'illustration.mkv	MKV	91.13 MB
05 - Avantages des méthodes TD.mkv	MKV	23.16 MB
06 - Explications de l'algorithme TD(0) sur la marche aléatoire.mkv	MKV	43.93 MB
07 - Expérimentations avec les méthodes TD(0) et MC-alpha constant.mkv	MKV	90.51 MB
08 - L'apprentissage par lots.mkv	MKV	22.11 MB
09 - Expériences avec la marche aléatoire.mkv	MKV	52.08 MB
10 - Analyse des résultats.mkv	MKV	40.87 MB
11 - Méthode Sarsa.mkv	MKV	64.53 MB
12 - 12. Exemple d'illustration.mkv	MKV	40.71 MB
13 - Exemple d'application Sarsa avec stratégie epsilon greedy.mkv	MKV	85.8 MB
14 - Méthode Q-learning.mkv	MKV	32.99 MB
15 - 15. Exemple d'illustration.mkv	MKV	19.66 MB
16 - Exemple d'application Q-learning avec stratégie epsilon-soft.mkv	MKV	81.69 MB
17 - Comparaison Sarsa et Q-learning avec stratégie epsilon-soft.mkv	MKV	70.03 MB
18 - Comparaison Sarsa et Q-learning avec stratégie epsilon-greedy.mkv	MKV	39.48 MB

07 - Méthodes par différences temporelles n-Step (n-step TD Methods)

01 - Introduction aux méthodes n-step.mkv	MKV	7.57 MB
02 - Prédiction avec les méthodes TD n-step.mkv	MKV	71.03 MB
03 - Exemple - Présentation de la problématique.mkv	MKV	46.76 MB
04 - Applicaton de l'algorithme n-step.mkv	MKV	47.69 MB
05 - Avantage des méthodes n-step sur les erreurs d'estimation commises.mkv	MKV	40.13 MB
06 - Contrôle avec la méthode Sarsa n-step.mkv	MKV	35.89 MB
07 - Exemple d'application Sarsa n-step.mkv	MKV	94.19 MB
08 - Apprentissage de type Off-policy avec les méthodes n-step.mkv	MKV	51.32 MB
09 - Exemple d'application Off-policy Sarsa n-step.mkv	MKV	109.64 MB
10 - Apprentissage de type Off-policy sans échantillonnage préférentiel.mkv	MKV	46.01 MB
11 - Mise en équation et construction de l'algorithme n-step à Arbre.mkv	MKV	52.57 MB
12 - Exemple d'application n-step à Arbre.mkv	MKV	65.04 MB
13 - Conclusion.mkv	MKV	10.87 MB

Fichiers source

1.1 1. Présentation.pdf	PDF	815.55 KB
10.1 6. Problématique du bandit manchot.html	HTML	273.43 KB
11.1 7. Simulations avec Python.ipynb	IPYNB	14.86 KB
12.1 7. Simulations avec Python.ipynb	IPYNB	14.86 KB
13.1 7. Simulations avec Python.ipynb	IPYNB	14.86 KB
14.1 7.4. Les tenseurs avec Numpy.ipynb	IPYNB	7.27 KB
15.1 7. Simulations avec Python.ipynb	IPYNB	14.86 KB
16.1 7. Simulations avec Python.ipynb	IPYNB	14.86 KB
17.1 7. Simulations avec Python.ipynb	IPYNB	14.86 KB
2.1 2. Problématiques et concepts en RL.html	HTML	277.37 KB
3.1 2. Problématiques et concepts en RL.html	HTML	277.37 KB
4.1 2. Problématiques et concepts en RL.html	HTML	277.37 KB
5.1 3. Processus de décision Markovien.html	HTML	272.8 KB
6.1 3. Processus de décision Markovien.html	HTML	272.8 KB
7.1 4_Exemple_de_MDP_en_2D.ipynb	IPYNB	7.11 KB
8.1 4_Exemple_de_MDP_en_2D.ipynb	IPYNB	7.11 KB
9.1 5. Formulation mathématique des MDP.html	HTML	269.01 KB

1.1 1. Fonction de valeur d'état et d'action.html	HTML	273.8 KB
2.1 1. Fonction de valeur d'état et d'action.html	HTML	273.8 KB
3.1 2. Equation de Bellman.html	HTML	269.95 KB
4.1 3. Equation de Bellman pour la valeur d'action.html	HTML	269.6 KB
5.1 4. Optimalité.html	HTML	268.13 KB
6.1 Exemple_Simple_Bellman.ipynb	IPYNB	23.11 KB
7.1 Exemple_Simple_Bellman.ipynb	IPYNB	23.11 KB
8.1 Exemple_Simple_Bellman.ipynb	IPYNB	33.11 KB

1.1 1. Présentation du projet.pdf	PDF	2.37 MB
2.1 2. Exemple application Bellman.ipynb	IPYNB	20.48 KB
3.1 2. Exemple application Bellman.ipynb	IPYNB	20.48 KB
4.1 2. Exemple application Bellman.ipynb	IPYNB	20.48 KB
5.1 2. Exemple application Bellman.ipynb	IPYNB	30.48 KB

1.1 1. Introduction à la programmation dynamique.html	HTML	268.16 KB
10.1 10. Application sur le projet du magasin.ipynb	IPYNB	11.31 KB
2.1 2. Exemple d'algorithme récursif et dynamique.ipynb	IPYNB	5.85 KB
4.1 4. Algorithme itératif pour l'évaluation des stratégies.html	HTML	275.56 KB
5.1 5. Algorithme d'amélioration des stratégies.html	HTML	275.05 KB
6.1 6. Algorithme final d'itération des stratégies.html	HTML	269.54 KB
7.1 7. Exemple Frozen Lake.ipynb	IPYNB	18.18 KB
8.1 7. Exemple Frozen Lake.ipynb	IPYNB	18.18 KB
9.1 9. Algorithme par itération des valeurs.html	HTML	272.42 KB

1.1 1. Introduction aux méthodes de Monte Carlo.html	HTML	270.26 KB
10.1 7. Approximation des stratégies optimales.html	HTML	272.92 KB
11.1 8. Blackjack - Approximation des stratégies optimales.ipynb	IPYNB	24.56 KB
12.1 9. Stratégies de type epsilon-soft.html	HTML	268.93 KB
13.1 10. Blackjack - Stratégies de type epsilon soft.ipynb	IPYNB	22.88 KB
14.1 11. Prédictions avec échantillonnage préférentiel - On-policy et Off-policy.html	HTML	270.81 KB
15.1 12. Ratio d'échantillonnage préférentiel.html	HTML	271.7 KB
16.1 13. Méthode de calcul de la prédiction.html	HTML	274.27 KB
17.1 14. Algorithme itératif de prédiction.html	HTML	274.96 KB
18.1 15. Test de convergence des algorithmes d'échantillonnage préférentiel et ordinaires.ipynb	IPYNB	29.02 KB
19.1 16. Contrôle Monte Carlo de type Off Policy.ipynb	IPYNB	20.81 KB
2.1 2. Estimation de la fonction des valeurs des états.html	HTML	269.27 KB
3.1 3. Exemple avec une marche aléatoire.ipynb	IPYNB	16.19 KB
4.1 3. Exemple avec une marche aléatoire.ipynb	IPYNB	16.19 KB
5.1 4. Blackjack - Estimation des valeurs des états.ipynb	IPYNB	24.79 KB
6.1 4. Blackjack - Estimation des valeurs des états.ipynb	IPYNB	34.79 KB
7.1 4. Blackjack - Estimation des valeurs des états.ipynb	IPYNB	24.79 KB
8.1 5. Estimation de la fonction des valeurs des actions.html	HTML	270.31 KB
9.1 6. Blackjack - Estimation de la fonction des valeurs des actions.ipynb	IPYNB	23.39 KB

1.1 1. Introduction à l'apprentissage de type TD.html	HTML	268.31 KB
10.1 5. Apprentissage par lots.ipynb	IPYNB	19.16 KB
11.1 6. Méthode Sarsa.html	HTML	281.07 KB
12.1 7. Exemple d'illustration.html	HTML	269.57 KB
13.1 8. Exemple d'application Sarsa avec stratégie epsilon greedy.ipynb	IPYNB	22.88 KB
14.1 9. Méthode Q-learning.html	HTML	271.59 KB
15.1 10. Exemple d'illustration.html	HTML	268.59 KB
16.1 11. Exemple d'application Q-learning avec stratégie epsilon-soft.ipynb	IPYNB	12.31 KB
17.1 12. Comparaison Sarsa et Q-learning avec stratégie epsilon-soft.ipynb	IPYNB	14.4 KB
18.1 13. Comparaison Sarsa et Q-learning avec stratégie epsilon-greedy.ipynb	IPYNB	14.22 KB
2.1 2. Prédiction par différences temporelles.html	HTML	287.93 KB
3.1 2. Prédiction par différences temporelles.html	HTML	277.93 KB
4.1 3. Exemple d'illustration.html	HTML	286.24 KB
5.1 4. Avantages des méthodes TD pour la prédiction.ipynb	IPYNB	18.07 KB
6.1 4. Avantages des méthodes TD pour la prédiction.ipynb	IPYNB	18.07 KB
7.1 4. Avantages des méthodes TD pour la prédiction.ipynb	IPYNB	18.07 KB
8.1 5. Apprentissage par lots.ipynb	IPYNB	19.16 KB
9.1 5. Apprentissage par lots.ipynb	IPYNB	19.16 KB

1.1 1. Introduction aux méthodes n-step.html	HTML	267.26 KB
10.1 8. Apprentissage de type Off-policy sans échantillonnage préférentiel.html	HTML	275.17 KB
11.1 8. Apprentissage de type Off-policy sans échantillonnage préférentiel.html	HTML	275.17 KB
12.1 9. Exemple d'application n-step à Arbre.ipynb	IPYNB	15.17 KB
13.1 10. Conclusion.pdf	PDF	195.35 KB
2.1 2. Prédiction avec les méthodes TD n-step.html	HTML	275.22 KB
3.1 3. Exemple avec une marche aléatoire.ipynb	IPYNB	13.75 KB
4.1 3. Exemple avec une marche aléatoire.ipynb	IPYNB	13.75 KB
5.1 3. Exemple avec une marche aléatoire.ipynb	IPYNB	13.75 KB
6.1 4. Contrôle avec la méthode Sarsa n-step.html	HTML	279.44 KB
7.1 5. Exemple d'application Sarsa n-step.ipynb	IPYNB	23.91 KB
8.1 6. Apprentissage de type Off-policy avec les méthodes n-step.html	HTML	281.07 KB
9.1 7. Exemple d'application Off-policy Sarsa n-step.ipynb	IPYNB	17.17 KB

Partie 02

01 - Prédiction de type on-policy par approximations

01 - Introduction.mkv	MKV	64.3 MB
02 - Approximation de la fonction des valeurs des états.mkv	MKV	74.29 MB
03 - Fonction objectif de prédiction.mkv	MKV	112.89 MB
04 - Principe de la méthode SGD.mkv	MKV	63.08 MB
05 - Méthodes du gradient et du semi-gradient.mkv	MKV	81.88 MB
06 - Technique d'agrégation des états.mkv	MKV	23.95 MB
07 - Exemple d'application - Mise en place de l'environnement.mkv	MKV	55.84 MB
08 - Calcul des vraies valeurs des états par programmation dynamique.mkv	MKV	47.51 MB
09 - Application de l'algorithme SGD par agrégation des états.mkv	MKV	58.45 MB
10 - Analyse des résultats.mkv	MKV	57.51 MB
11 - Principe d'approximation par les méthodes linéaires.mkv	MKV	24.18 MB
12 - Convergence des méthodes linéaire et majoration de l'erreur.mkv	MKV	81.24 MB
13 - Algorithme du semi-gradient TD n-step.mkv	MKV	20.87 MB
14 - Exemple d'application semi-gradient TD(0).mkv	MKV	42.88 MB
15 - Analyse des erreurs obtenues pour différentes valeurs de alpha et de n.mkv	MKV	18.78 MB

02 - Construction des fonctions d'approximations linéaires

01 - Introduction.mkv	MKV	46.44 MB
02 - Bases polynomiales.mkv	MKV	64.64 MB
03 - Exemple avec les bases polynomiales - implantation du modèle.mkv	MKV	121.1 MB
04 - Exécution du modèle et analyse des résultats.mkv	MKV	105.92 MB
05 - Les bases de Fourier en 1D.mkv	MKV	46.76 MB
06 - Exemple de base de Fourier et d'approximation de fonction en 1D.mkv	MKV	32.71 MB
07 - Exemple de base de Fourier et d'approximation de fonction en 2D.mkv	MKV	102.14 MB
08 - Exemple avec les bases de Fourier.mkv	MKV	98.91 MB
09 - Comparaison bases Polynomiales et de Fourier.mkv	MKV	27.88 MB

03 - Approximation des fonctions non linéaires avec les réseaux neuronaux artificiels

01 - Intelligence artificielle, machine learning et deep learning.mkv	MKV	27.97 MB
02 - Les types d'apprentissages en deep learning.mkv	MKV	69.72 MB
03 - Structure d'un réseau de neurones artificiels.mkv	MKV	51.36 MB
04 - Fonction d'activation de type Sigmoide.mkv	MKV	25.18 MB
05 - Fonction de prédiction, de perte et de coût.mkv	MKV	66.3 MB
06 - Algorithme du gradient.mkv	MKV	38.3 MB
07 - Utiliser un réseau de neurones avec Tensorflow-Keras Introduction.mkv	MKV	51.27 MB
08 - Utiliser un réseau de neurones avec Tensorflow-Keras - Création du modèle.mkv	MKV	76.73 MB
09 - Utiliser un réseau de neurones avec Tensorflow-Keras - Entrainement + prédiction.mkv	MKV	48.5 MB
10 - Exemple d'application avec un réseau de neurones - Création du réseau.mkv	MKV	40.85 MB
11 - Exemple d'application avec un réseau de neurones - Algorithme n-step TD.mkv	MKV	143.74 MB
12 - Exemple d'application avec un réseau de neurones - Configuration de l'optimiseur.mkv	MKV	88.47 MB
13 - Exemple d'application avec un réseau de neurones - Entrainement du modèle.mkv	MKV	68.02 MB

04 - Contrôle de type on-policy par approximations

01 - Introduction.mkv	MKV	30.89 MB
02 - Contrôle semi-gradient sur des tâches épisodiques.mkv	MKV	67.94 MB
03 - Exemple d'application Sarsa 1-pas épisodique avec Fourier - Environnement du jeu.mkv	MKV	149.42 MB
04 - Exemple d'application Sarsa 1-pas épisodique avec Fourier - Fnc. d'approximation.mkv	MKV	173.39 MB
05 - Exemple d'application Sarsa 1-pas épisodique avec Fourier - Algorithme avec.mkv	MKV	162.07 MB
06 - Exemple d'application Sarsa 1-pas épisodique avec Fourier - Résultats.mkv	MKV	131.61 MB
07 - Contrôle semi-gradient sur des tâches continues.mkv	MKV	92.65 MB
08 - Exemple de tâche continue - Présentation de l'environnement.mkv	MKV	100.87 MB
09 - Exemple de tâche continue - Entrainement avec l'algorithme Sarsa différentiel.mkv	MKV	102.66 MB
10 - Exemple de tâche continue - Analyse des résultats.mkv	MKV	38.26 MB
11 - Algorithme différentiel semi gradient Sarsa n-step.mkv	MKV	36.87 MB
12 - Exemple de contrôle différentiel semi gradient Sarsa n-step.mkv	MKV	100.63 MB

05 - Contrôle on-policy Deep-Sarsa (Méthode Sarsa avec les réseaux de neurones)

01 - Présentation du problème.mkv	MKV	68.83 MB
02 - Construction du réseau de neurones.mkv	MKV	91.97 MB
03 - Algorithme d'apprentissage.mkv	MKV	81.68 MB
04 - Présentation de l'algorithme Python.mkv	MKV	85.41 MB
05 - Explications de l'algorithme Python.mkv	MKV	104.62 MB
06 - Résultats et analyse.mkv	MKV	24.25 MB

06 - Méthodes off-policy avec approximations

01 - Introduction.mkv	MKV	59.9 MB
02 - Méthodes semi gradient.mkv	MKV	52.66 MB
03 - Exemples d'instabilités.mkv	MKV	103.15 MB
04 - Exemple de Baird.mkv	MKV	52.99 MB
05 - Méthode TD(0) off-policy sur l'exemple de Baird.mkv	MKV	103.72 MB
06 - Méthode Q-learning sur l'exemple de Baird.mkv	MKV	46.2 MB
07 - La triade de la mort.mkv	MKV	59.95 MB
08 - Aspect géométrique des fonctions des valeurs.mkv	MKV	53.37 MB
09 - Aspect géométrique de la méthode de Monte-Carlo.mkv	MKV	31.02 MB
10 - Aspect géométrique de la méthode par programmation dynamique.mkv	MKV	50.72 MB
11 - Aspect géométrique de la méthode par différences temporelles.mkv	MKV	41.49 MB
12 - Méthode SGD sur l'erreur TD(0).mkv	MKV	50.34 MB
13 - Exemple de mauvaise convergence de l'algorithme naïf résiduel du gradient.mkv	MKV	49.48 MB
14 - Méthode SGD sur l'erreur de Bellman.mkv	MKV	97.57 MB
15 - Exemple de mauvaise convergence de l'algorithme résiduel du gradient.mkv	MKV	29.08 MB
16 - Concept d'apprenabilité.mkv	MKV	44.63 MB
17 - La fonction objectif VE n'est pas apprenable.mkv	MKV	76.05 MB
18 - Présentation de l'environnement pour tester l'erreur de Bellman.mkv	MKV	52.18 MB
19 - L'erreur de Bellman n'est pas apprenable.mkv	MKV	46.73 MB
20 - L'erreur de Bellman ne partage pas les paramètres optimaux.mkv	MKV	70.4 MB
21 - Méthodes par gradient TD - Notations matricielles et rappels géométriques.mkv	MKV	135.62 MB
22 - Méthodes par gradient TD - Expression du projecteur orthogonal.mkv	MKV	45.84 MB
23 - Méthodes par gradient TD - Construction de l'algorithme.mkv	MKV	84.38 MB
24 - Méthode Gradient TD - Exemple de Baird.mkv	MKV	89.59 MB
25 - Méthodes Emphatic-TD.mkv	MKV	109.47 MB
26 - Méthode Emphatic TD - Exemple de Baird.mkv	MKV	69.55 MB

07 - Contrôle off-policy Deep Q-learning

01 - Présentation de l'environnement.mkv	MKV	22.58 MB
02 - Illustration animée de l'environnement.mkv	MKV	19.85 MB
03 - Entrainement du modèle.mkv	MKV	104.55 MB
04 - Animation des résultats.mkv	MKV	24.78 MB

Fichiers source

1.1 1. Introduction.html	HTML	268.84 KB
10.1 5. Exemple d'application - agrégation d'états d'une marche aléatoire.ipynb	IPYNB	18.69 KB
11.1 6. Méthodes linéaires.ipynb	IPYNB	13.48 KB
12.1 6. Méthodes linéaires.ipynb	IPYNB	13.48 KB
13.1 6. Méthodes linéaires.ipynb	IPYNB	13.48 KB
14.1 7. Exemple d'application semi_gradient TD(0) et n-step.ipynb	IPYNB	20.27 KB
15.1 7. Exemple d'application semi_gradient TD(0) et n-step.ipynb	IPYNB	20.27 KB
2.1 2. Approximation de la fonction des valeurs des états.html	HTML	271.47 KB
3.1 3. Fonction objectif de prédiction.html	HTML	275.01 KB
4.1 4. Méthodes du gradient stochastique et du semi-gradient.html	HTML	281.62 KB
5.1 4. Méthodes du gradient stochastique et du semi-gradient.html	HTML	281.62 KB
6.1 4. Méthodes du gradient stochastique et du semi-gradient.html	HTML	281.62 KB
7.1 5. Exemple d'application - agrégation d'états d'une marche aléatoire.ipynb	IPYNB	18.69 KB
8.1 5. Exemple d'application - agrégation d'états d'une marche aléatoire.ipynb	IPYNB	18.69 KB
9.1 5. Exemple d'application - agrégation d'états d'une marche aléatoire.ipynb	IPYNB	18.69 KB

1.1 1. Introduction.html	HTML	269.85 KB
2.1 2. Bases polynomiales.html	HTML	270.12 KB
3.1 3. Exemple avec les bases polynomiales.ipynb	IPYNB	20.07 KB
4.1 3. Exemple avec les bases polynomiales.ipynb	IPYNB	20.07 KB
5.1 4. Bases de Fourier.ipynb	IPYNB	20.24 KB
6.1 4. Bases de Fourier.ipynb	IPYNB	20.24 KB
7.1 4. Bases de Fourier.ipynb	IPYNB	20.24 KB
8.1 5. Exemple avec les bases de Fourier.ipynb	IPYNB	21.2 KB
9.1 6. Comparaison bases Polynomes et Fourier.ipynb	IPYNB	22.79 KB

10.1 5. Exemple d'approximation non linéaire avec un réseau de neurones.ipynb	IPYNB	20.44 KB
11.1 5. Exemple d'approximation non linéaire avec un réseau de neurones.ipynb	IPYNB	20.44 KB
12.1 5. Exemple d'approximation non linéaire avec un réseau de neurones.ipynb	IPYNB	20.44 KB
3.1 4. Concepts liés aux réseaux de neurones artificiels.ipynb	IPYNB	13 KB
4.1 4. Concepts liés aux réseaux de neurones artificiels.ipynb	IPYNB	13 KB
5.1 4. Concepts liés aux réseaux de neurones artificiels.ipynb	IPYNB	13 KB
6.1 3. Concepts liés aux réseaux de neurones artificiels.ipynb	IPYNB	13 KB
7.1 4. Utilisation de Keras-Tensorflow pour mettre en oeuvre des réseaux de neurones.ipynb	IPYNB	10.61 KB
8.1 4. Utilisation de Keras-Tensorflow pour mettre en oeuvre des réseaux de neurones.ipynb	IPYNB	10.61 KB
9.1 4. Utilisation de Keras-Tensorflow pour mettre en oeuvre des réseaux de neurones.ipynb	IPYNB	10.61 KB

1.1 1. Introduction.html	HTML	268.44 KB
10.1 6. Exemple de contrôle semi gradient sur des tâches continues.ipynb	IPYNB	29.71 KB
11.1 7. Algorithme différentiel semi gradient Sarsa n-step.html	HTML	270.91 KB
12.1 8. Exemple de contrôle différentiel semi gradient Sarsa n-step.ipynb	IPYNB	27.94 KB
3.1 3. Exemple d'application de l'algorithme semi gradient Sarsa 1-pas épisodique avec bases de Fourier.ipynb	IPYNB	30.76 KB
4.1 3. Exemple d'application de l'algorithme semi gradient Sarsa 1-pas épisodique avec bases de Fourier.ipynb	IPYNB	30.76 KB
5.1 3. Exemple d'application de l'algorithme semi gradient Sarsa 1-pas épisodique avec bases de Fourier.ipynb	IPYNB	30.76 KB
6.1 3. Exemple d'application de l'algorithme semi gradient Sarsa 1-pas épisodique avec bases de Fourier.ipynb	IPYNB	30.76 KB
7.1 5. Contrôle semi-gradient sur des tâches continues.html	HTML	280.01 KB
8.1 6. Exemple de contrôle semi gradient sur des tâches continues.ipynb	IPYNB	29.71 KB
9.1 6. Exemple de contrôle semi gradient sur des tâches continues.ipynb	IPYNB	29.71 KB

1.1 Deep-Sarsa.ipynb	IPYNB	30.28 KB
2.1 Deep-Sarsa.ipynb	IPYNB	30.28 KB
3.1 Deep-Sarsa.ipynb	IPYNB	40.28 KB
4.1 Deep-Sarsa.ipynb	IPYNB	30.28 KB
5.1 Deep-Sarsa.ipynb	IPYNB	30.28 KB
6.1 Deep-Sarsa.ipynb	IPYNB	30.28 KB

1.1 1. Introduction.html	HTML	270.12 KB
10.1 7. Aspect géométrique des fonctions des valeurs.html	HTML	288.76 KB
11.1 7. Aspect géométrique des fonctions des valeurs.html	HTML	288.76 KB
12.1 8. Méthode par descente du gradient sur l'erreur de Bellman.html	HTML	294.9 KB
13.1 8. Méthode par descente du gradient sur l'erreur de Bellman.html	HTML	294.9 KB
14.1 8. Méthode par descente du gradient sur l'erreur de Bellman.html	HTML	294.9 KB
15.1 8. Méthode par descente du gradient sur l'erreur de Bellman.html	HTML	294.9 KB
16.1 9. L'erreur de Bellman n'est pas apprenable.html	HTML	297.48 KB
17.1 9. L'erreur de Bellman n'est pas apprenable.html	HTML	297.48 KB
18.1 9. L'erreur de Bellman n'est pas apprenable.html	HTML	297.48 KB
19.1 9. L'erreur de Bellman n'est pas apprenable.html	HTML	297.48 KB
2.1 2. Méthodes semi gradient.html	HTML	275.99 KB
20.1 9. L'erreur de Bellman n'est pas apprenable.html	HTML	297.48 KB
21.1 10. Méthodes par gradient TD - Introduction des concepts mathématiques.html	HTML	286.77 KB
22.1 10. Méthodes par gradient TD - Introduction des concepts mathématiques.html	HTML	286.77 KB
23.1 11. Méthodes par gradient TD - Construction de l'algorithme.html	HTML	289.68 KB
24.1 12. Méthode Gradient TD - Exemple de Baird.ipynb	IPYNB	16.51 KB
25.1 13. Méthodes Emphatic-TD.html	HTML	281.94 KB
26.1 14. Méthode Emphatic TD - Exemple de Baird.ipynb	IPYNB	35.36 KB
3.1 3. Exemples d'instabilités.html	HTML	279.46 KB
4.1 3. Exemples d'instabilités.html	HTML	279.46 KB
5.1 4. Méthode TD(0) off-policy sur l'exemple de Baird.ipynb	IPYNB	12.38 KB
6.1 5. Méthode Q-learning sur l'exemple de Baird.ipynb	IPYNB	24.4 KB
7.1 6. La triade de la mort.html	HTML	271.51 KB
8.1 7. Aspect géométrique des fonctions des valeurs.html	HTML	288.76 KB
9.1 7. Aspect géométrique des fonctions des valeurs.html	HTML	288.76 KB

1.1 Deep Q-Learning.ipynb	IPYNB	29.31 KB
2.1 Deep Q-Learning.ipynb	IPYNB	29.31 KB
3.1 Deep Q-Learning.ipynb	IPYNB	29.31 KB
4.1 Deep Q-Learning.ipynb	IPYNB	29.31 KB

Description

Show full description

Related Torrents

TORRENT NAME	SIZE	FILES	AGE	SEED	LEECH	SOURCE
STARTER PACK - FORMATION ENTREPRENEUR / TRADING / SEO / RESEAUX SOCIAUX Posted by Pti__Math in Other Posted in Other 0 272.95 GB 1 year ago Pti__Math	Size 272.95 GB	Files 1961	Age 1 year ago	Seeds 0	Leechs 0	Source
Théophile Eliet - Formation Mega Pack V2 Webmarketing 2020 FRENCH WEB 720p x264 Posted by Merci_Yumi in Other Posted in Other 7 19.08 GB 1 year ago Merci_Yumi	Size 19.08 GB	Files 288	Age 1 year ago	Seeds 7	Leechs 0	Source
Elephorm - Pack.de.4.formation.Studio.One.6.Professional.FR.2023.WEB-DL.1080P.X264 Posted by Nawel087 in Other Posted in Other 0 4.55 GB 2 years ago Nawel087	Size 4.55 GB	Files 110	Age 2 years ago	Seeds 0	Leechs 2	Source
Linkedin-Pack formation Microsoft Teams.FR.WEB-DL.MP4.720p.H264 Posted by Nawel087 in Other Posted in Other 25 5.7 GB 3 years ago Nawel087	Size 5.7 GB	Files 398	Age 3 years ago	Seeds 25	Leechs 0	Source
Linkedin-Pack formation PowerPoint.FR.WEB-DL.MP4.720p.H264 Posted by Nawel087 in Other Posted in Other 15 3.15 GB 3 years ago Nawel087	Size 3.15 GB	Files 255	Age 3 years ago	Seeds 15	Leechs 0	Source

Pack formation - Udemy - Apprentissage par renforcement avec Python

Torrent Contents Size: 10.79 GB

Description

Related Torrents

Location

Trackers

Latest News

Latest Searches

Sites In Our Index

Popular Tags

Tracker name
https://tracker.yggleak.top/announce
udp://tracker.opentrackr.org:1337/announce
udp://open.demonii.com:1337/announce
udp://open.stealth.si:80/announce
udp://exodus.desync.com:6969/announce
https://torrent.tracker.durukanbal.com:443/announce
udp://tracker1.myporn.club:9337/announce
udp://tracker.torrent.eu.org:451/announce
udp://tracker.theoks.net:6969/announce
udp://tracker.srv00.com:6969/announce
udp://tracker.filemail.com:6969/announce
udp://tracker.dler.org:6969/announce
udp://tracker.corpscorp.online:80/announce
udp://tracker.alaskantf.com:6969/announce
udp://tracker-udp.gbitt.info:80/announce
udp://t.overflow.biz:6969/announce
udp://open.dstud.io:6969/announce
udp://leet-tracker.moe:1337/announce
udp://explodie.org:6969/announce
udp://bittorrent-tracker.e-n-c-r-y-p-t.net:1337/announce
udp://6ahddutb1ucc3cp.ru:6969/announce
udp://94.23.207.177:6969/announce
udp://37.59.48.81:6969/announce
udp://54.36.179.216:6969/announce
udp://193.42.111.57:9337/announce
udp://43.250.54.137:6969/announce
udp://91.216.110.53:451/announce
udp://45.134.88.121:6969/announce
udp://135.125.236.64:6969/announce
udp://5.255.124.190:6969/announce
udp://93.158.213.92:1337/announce
udp://107.189.4.235:1337/announce
udp://tracker.qu.ax:6969/announce
udp://107.189.7.165:6969/announce
udp://103.251.166.126:6969/announce
udp://185.243.218.213:80/announce
http://tracker.zhuqiy.com:80/announce
udp://81.230.84.201:6969/announce
udp://212.42.38.197:6969/announce
http://193.31.26.113:6969/announce