Pack formation - Udemy - Apprentissage par renforcement avec Python

seeders: 27 leechers: 0
Added 1 year ago by Francese in Other
Downloaded 2 times.
YggTorrent
Pack formation - Udemy - Apprentissage par renforcement avec Python

Torrent Contents Size: 10.79 GB

Pack formation - Udemy - Apprentissage par renforcement avec Python
Partie 01
01 - Introduction à la problématique de l'apprentissage par renforcement
01 - Présentation.mkv
MKV
79.84 MB
02 - Concepts et terminologie.mkv
MKV
55.47 MB
03 - Fonctionnement de l'apprentissage par renforcement.mkv
MKV
29.75 MB
04 - Autres concepts.mkv
MKV
59.08 MB
05 - Processus de décision Markovien (MDP) déterministes.mkv
MKV
51.35 MB
06 - MDP stochastiques.mkv
MKV
13.59 MB
07 - Exemple de MDP en 2D sous Python.mkv
MKV
28.98 MB
08 - Table des transitions stochastiques.mkv
MKV
66.7 MB
09 - Formulation mathématique des MDP.mkv
MKV
58.58 MB
10 - Problématique du bandit manchot.mkv
MKV
75.94 MB
11 - Paramétrage des distributions (loi normale).mkv
MKV
40.36 MB
12 - Calcul de la valeur d'une action.mkv
MKV
41.14 MB
13 - Programme Python du bandit manchot.mkv
MKV
82.72 MB
14 - Utiliser les tenseurs en Python avec Numpy.mkv
MKV
68.57 MB
15 - Programme de simulation.mkv
MKV
32.19 MB
16 - Simulation avec la méthode Epsilon-Greedy.mkv
MKV
30.37 MB
17 - Simulation avec la méthode UCB.mkv
MKV
30.13 MB
02 - Approche avec les équations de Bellman
01 - Fonction valeur d'état.mkv
MKV
69.88 MB
02 - Fonction valeur d'action.mkv
MKV
21.77 MB
03 - Equation de Bellman pour la valeur d'état.mkv
MKV
61.13 MB
04 - Equation de Bellman pour la valeur d'action.mkv
MKV
25.45 MB
05 - Optimalité.mkv
MKV
9.44 MB
06 - Exemple en Python - Présentation du problème.mkv
MKV
27.48 MB
07 - Exemple en Python - Construction de la table de transition.mkv
MKV
87.82 MB
08 - Exemple en Python - Application de l'algorithme.mkv
MKV
127.51 MB
03 - Application sur un projet réel
01 - Présentation du projet.mkv
MKV
92.64 MB
02 - Instanciation de la classe et table des transitions.mkv
MKV
52.38 MB
03 - Table des valeurs des actions et des états.mkv
MKV
9.43 MB
04 - Application Bellman avec stratégie Greddy.mkv
MKV
78.24 MB
05 - Application Bellman avec stratégie Epsilon-Greedy.mkv
MKV
42.25 MB
04 - Méthodes d'optimisation basées sur la programmation dynamique
01 - Introduction à la programmation dynamique.mkv
MKV
32.97 MB
02 - Exemple d'algorithme récursif et dynamique.mkv
MKV
34.74 MB
03 - Rappels sur l'optimalité des fonctions de valeurs d'actions et d'états.mkv
MKV
29.36 MB
04 - Algorithme itératif pour l'évaluation des stratégies.mkv
MKV
104.65 MB
05 - Algorithme d'amélioration des stratégies.mkv
MKV
75.82 MB
06 - Algorithme final d'itération des stratégies.mkv
MKV
23.13 MB
07 - Exemple Frozen Lake non déterministe.mkv
MKV
127.8 MB
08 - Exemple Frozen Lake quasi-déterministe.mkv
MKV
15.9 MB
09 - Algorithme par itération des valeurs.mkv
MKV
35.87 MB
10 - Application sur le projet du magasin.mkv
MKV
110.72 MB
05 - Méthodes de Monte Carlo
01 - Introduction aux méthodes de Monte Carlo.mkv
MKV
50.98 MB
02 - Estimation de la fonction des valeurs des états.mkv
MKV
38.23 MB
03 - Exemple présentation du jeu et création des trajectoires.mkv
MKV
90.74 MB
04 - Estimation des valeurs des états avec les algorithmes FVMC et EVMC.mkv
MKV
56.45 MB
05 - Blackjack - Règles du jeu et avantage de la méthode de Monte Carlo.mkv
MKV
90.12 MB
06 - Blackjack - Création des stratégies initiales et des trajectoires.mkv
MKV
98.67 MB
07 - Blackjack - Estimation de la fonction des valeurs des états.mkv
MKV
119.5 MB
08 - Estimation de la fonction des valeurs des actions.mkv
MKV
66.4 MB
09 - Blackjack - Estimation de la fonction des valeurs des actions.mkv
MKV
89.11 MB
10 - Approximation des stratégies optimales.mkv
MKV
52.57 MB
11 - Blackjack - Approximation des stratégies optimales.mkv
MKV
114.34 MB
12 - Stratégies de type epsilon-soft.mkv
MKV
30.51 MB
13 - Blackjack - Stratégies de type epsilon soft.mkv
MKV
81.97 MB
14 - Prédictions avec échantillonnage préférentiel - On-policy et Off-policy.mkv
MKV
68.83 MB
15 - Ratio d'échantillonnage préférentiel.mkv
MKV
58.83 MB
16 - Méthode de calcul de la prédiction.mkv
MKV
55.34 MB
17 - Algorithme itératif de prédiction.mkv
MKV
58.81 MB
18 - Test de convergence des algorithmes d'échantillonnage préférentiel et ordina.mkv
MKV
182.3 MB
19 - Contrôle Monte Carlo de type Off Policy.mkv
MKV
57.28 MB
06 - Apprentissage par différences temporelles (TD Methods) - Sarsa et Q-learning
01 - Introduction à l'apprentissage de type TD.mkv
MKV
26.72 MB
02 - Petit retour sur la méthode de Monte-Carlo.mkv
MKV
45.29 MB
03 - Prédiction par différences temporelles.mkv
MKV
75.32 MB
04 - Exemple d'illustration.mkv
MKV
91.13 MB
05 - Avantages des méthodes TD.mkv
MKV
23.16 MB
06 - Explications de l'algorithme TD(0) sur la marche aléatoire.mkv
MKV
43.93 MB
07 - Expérimentations avec les méthodes TD(0) et MC-alpha constant.mkv
MKV
90.51 MB
08 - L'apprentissage par lots.mkv
MKV
22.11 MB
09 - Expériences avec la marche aléatoire.mkv
MKV
52.08 MB
10 - Analyse des résultats.mkv
MKV
40.87 MB
11 - Méthode Sarsa.mkv
MKV
64.53 MB
12 - 12. Exemple d'illustration.mkv
MKV
40.71 MB
13 - Exemple d'application Sarsa avec stratégie epsilon greedy.mkv
MKV
85.8 MB
14 - Méthode Q-learning.mkv
MKV
32.99 MB
15 - 15. Exemple d'illustration.mkv
MKV
19.66 MB
16 - Exemple d'application Q-learning avec stratégie epsilon-soft.mkv
MKV
81.69 MB
17 - Comparaison Sarsa et Q-learning avec stratégie epsilon-soft.mkv
MKV
70.03 MB
18 - Comparaison Sarsa et Q-learning avec stratégie epsilon-greedy.mkv
MKV
39.48 MB
07 - Méthodes par différences temporelles n-Step (n-step TD Methods)
01 - Introduction aux méthodes n-step.mkv
MKV
7.57 MB
02 - Prédiction avec les méthodes TD n-step.mkv
MKV
71.03 MB
03 - Exemple - Présentation de la problématique.mkv
MKV
46.76 MB
04 - Applicaton de l'algorithme n-step.mkv
MKV
47.69 MB
05 - Avantage des méthodes n-step sur les erreurs d'estimation commises.mkv
MKV
40.13 MB
06 - Contrôle avec la méthode Sarsa n-step.mkv
MKV
35.89 MB
07 - Exemple d'application Sarsa n-step.mkv
MKV
94.19 MB
08 - Apprentissage de type Off-policy avec les méthodes n-step.mkv
MKV
51.32 MB
09 - Exemple d'application Off-policy Sarsa n-step.mkv
MKV
109.64 MB
10 - Apprentissage de type Off-policy sans échantillonnage préférentiel.mkv
MKV
46.01 MB
11 - Mise en équation et construction de l'algorithme n-step à Arbre.mkv
MKV
52.57 MB
12 - Exemple d'application n-step à Arbre.mkv
MKV
65.04 MB
13 - Conclusion.mkv
MKV
10.87 MB
Fichiers source
01
1.1 1. Présentation.pdf
PDF
815.55 KB
10.1 6. Problématique du bandit manchot.html
HTML
273.43 KB
11.1 7. Simulations avec Python.ipynb
IPYNB
14.86 KB
12.1 7. Simulations avec Python.ipynb
IPYNB
14.86 KB
13.1 7. Simulations avec Python.ipynb
IPYNB
14.86 KB
14.1 7.4. Les tenseurs avec Numpy.ipynb
IPYNB
7.27 KB
15.1 7. Simulations avec Python.ipynb
IPYNB
14.86 KB
16.1 7. Simulations avec Python.ipynb
IPYNB
14.86 KB
17.1 7. Simulations avec Python.ipynb
IPYNB
14.86 KB
2.1 2. Problématiques et concepts en RL.html
HTML
277.37 KB
3.1 2. Problématiques et concepts en RL.html
HTML
277.37 KB
4.1 2. Problématiques et concepts en RL.html
HTML
277.37 KB
5.1 3. Processus de décision Markovien.html
HTML
272.8 KB
6.1 3. Processus de décision Markovien.html
HTML
272.8 KB
7.1 4_Exemple_de_MDP_en_2D.ipynb
IPYNB
7.11 KB
8.1 4_Exemple_de_MDP_en_2D.ipynb
IPYNB
7.11 KB
9.1 5. Formulation mathématique des MDP.html
HTML
269.01 KB
02
1.1 1. Fonction de valeur d'état et d'action.html
HTML
273.8 KB
2.1 1. Fonction de valeur d'état et d'action.html
HTML
273.8 KB
3.1 2. Equation de Bellman.html
HTML
269.95 KB
4.1 3. Equation de Bellman pour la valeur d'action.html
HTML
269.6 KB
5.1 4. Optimalité.html
HTML
268.13 KB
6.1 Exemple_Simple_Bellman.ipynb
IPYNB
23.11 KB
7.1 Exemple_Simple_Bellman.ipynb
IPYNB
23.11 KB
8.1 Exemple_Simple_Bellman.ipynb
IPYNB
33.11 KB
03
1.1 1. Présentation du projet.pdf
PDF
2.37 MB
2.1 2. Exemple application Bellman.ipynb
IPYNB
20.48 KB
3.1 2. Exemple application Bellman.ipynb
IPYNB
20.48 KB
4.1 2. Exemple application Bellman.ipynb
IPYNB
20.48 KB
5.1 2. Exemple application Bellman.ipynb
IPYNB
30.48 KB
04
1.1 1. Introduction à la programmation dynamique.html
HTML
268.16 KB
10.1 10. Application sur le projet du magasin.ipynb
IPYNB
11.31 KB
2.1 2. Exemple d'algorithme récursif et dynamique.ipynb
IPYNB
5.85 KB
4.1 4. Algorithme itératif pour l'évaluation des stratégies.html
HTML
275.56 KB
5.1 5. Algorithme d'amélioration des stratégies.html
HTML
275.05 KB
6.1 6. Algorithme final d'itération des stratégies.html
HTML
269.54 KB
7.1 7. Exemple Frozen Lake.ipynb
IPYNB
18.18 KB
8.1 7. Exemple Frozen Lake.ipynb
IPYNB
18.18 KB
9.1 9. Algorithme par itération des valeurs.html
HTML
272.42 KB
05
1.1 1. Introduction aux méthodes de Monte Carlo.html
HTML
270.26 KB
10.1 7. Approximation des stratégies optimales.html
HTML
272.92 KB
11.1 8. Blackjack - Approximation des stratégies optimales.ipynb
IPYNB
24.56 KB
12.1 9. Stratégies de type epsilon-soft.html
HTML
268.93 KB
13.1 10. Blackjack - Stratégies de type epsilon soft.ipynb
IPYNB
22.88 KB
14.1 11. Prédictions avec échantillonnage préférentiel - On-policy et Off-policy.html
HTML
270.81 KB
15.1 12. Ratio d'échantillonnage préférentiel.html
HTML
271.7 KB
16.1 13. Méthode de calcul de la prédiction.html
HTML
274.27 KB
17.1 14. Algorithme itératif de prédiction.html
HTML
274.96 KB
18.1 15. Test de convergence des algorithmes d'échantillonnage préférentiel et ordinaires.ipynb
IPYNB
29.02 KB
19.1 16. Contrôle Monte Carlo de type Off Policy.ipynb
IPYNB
20.81 KB
2.1 2. Estimation de la fonction des valeurs des états.html
HTML
269.27 KB
3.1 3. Exemple avec une marche aléatoire.ipynb
IPYNB
16.19 KB
4.1 3. Exemple avec une marche aléatoire.ipynb
IPYNB
16.19 KB
5.1 4. Blackjack - Estimation des valeurs des états.ipynb
IPYNB
24.79 KB
6.1 4. Blackjack - Estimation des valeurs des états.ipynb
IPYNB
34.79 KB
7.1 4. Blackjack - Estimation des valeurs des états.ipynb
IPYNB
24.79 KB
8.1 5. Estimation de la fonction des valeurs des actions.html
HTML
270.31 KB
9.1 6. Blackjack - Estimation de la fonction des valeurs des actions.ipynb
IPYNB
23.39 KB
06
1.1 1. Introduction à l'apprentissage de type TD.html
HTML
268.31 KB
10.1 5. Apprentissage par lots.ipynb
IPYNB
19.16 KB
11.1 6. Méthode Sarsa.html
HTML
281.07 KB
12.1 7. Exemple d'illustration.html
HTML
269.57 KB
13.1 8. Exemple d'application Sarsa avec stratégie epsilon greedy.ipynb
IPYNB
22.88 KB
14.1 9. Méthode Q-learning.html
HTML
271.59 KB
15.1 10. Exemple d'illustration.html
HTML
268.59 KB
16.1 11. Exemple d'application Q-learning avec stratégie epsilon-soft.ipynb
IPYNB
12.31 KB
17.1 12. Comparaison Sarsa et Q-learning avec stratégie epsilon-soft.ipynb
IPYNB
14.4 KB
18.1 13. Comparaison Sarsa et Q-learning avec stratégie epsilon-greedy.ipynb
IPYNB
14.22 KB
2.1 2. Prédiction par différences temporelles.html
HTML
287.93 KB
3.1 2. Prédiction par différences temporelles.html
HTML
277.93 KB
4.1 3. Exemple d'illustration.html
HTML
286.24 KB
5.1 4. Avantages des méthodes TD pour la prédiction.ipynb
IPYNB
18.07 KB
6.1 4. Avantages des méthodes TD pour la prédiction.ipynb
IPYNB
18.07 KB
7.1 4. Avantages des méthodes TD pour la prédiction.ipynb
IPYNB
18.07 KB
8.1 5. Apprentissage par lots.ipynb
IPYNB
19.16 KB
9.1 5. Apprentissage par lots.ipynb
IPYNB
19.16 KB
07
1.1 1. Introduction aux méthodes n-step.html
HTML
267.26 KB
10.1 8. Apprentissage de type Off-policy sans échantillonnage préférentiel.html
HTML
275.17 KB
11.1 8. Apprentissage de type Off-policy sans échantillonnage préférentiel.html
HTML
275.17 KB
12.1 9. Exemple d'application n-step à Arbre.ipynb
IPYNB
15.17 KB
13.1 10. Conclusion.pdf
PDF
195.35 KB
2.1 2. Prédiction avec les méthodes TD n-step.html
HTML
275.22 KB
3.1 3. Exemple avec une marche aléatoire.ipynb
IPYNB
13.75 KB
4.1 3. Exemple avec une marche aléatoire.ipynb
IPYNB
13.75 KB
5.1 3. Exemple avec une marche aléatoire.ipynb
IPYNB
13.75 KB
6.1 4. Contrôle avec la méthode Sarsa n-step.html
HTML
279.44 KB
7.1 5. Exemple d'application Sarsa n-step.ipynb
IPYNB
23.91 KB
8.1 6. Apprentissage de type Off-policy avec les méthodes n-step.html
HTML
281.07 KB
9.1 7. Exemple d'application Off-policy Sarsa n-step.ipynb
IPYNB
17.17 KB
Partie 02
01 - Prédiction de type on-policy par approximations
01 - Introduction.mkv
MKV
64.3 MB
02 - Approximation de la fonction des valeurs des états.mkv
MKV
74.29 MB
03 - Fonction objectif de prédiction.mkv
MKV
112.89 MB
04 - Principe de la méthode SGD.mkv
MKV
63.08 MB
05 - Méthodes du gradient et du semi-gradient.mkv
MKV
81.88 MB
06 - Technique d'agrégation des états.mkv
MKV
23.95 MB
07 - Exemple d'application - Mise en place de l'environnement.mkv
MKV
55.84 MB
08 - Calcul des vraies valeurs des états par programmation dynamique.mkv
MKV
47.51 MB
09 - Application de l'algorithme SGD par agrégation des états.mkv
MKV
58.45 MB
10 - Analyse des résultats.mkv
MKV
57.51 MB
11 - Principe d'approximation par les méthodes linéaires.mkv
MKV
24.18 MB
12 - Convergence des méthodes linéaire et majoration de l'erreur.mkv
MKV
81.24 MB
13 - Algorithme du semi-gradient TD n-step.mkv
MKV
20.87 MB
14 - Exemple d'application semi-gradient TD(0).mkv
MKV
42.88 MB
15 - Analyse des erreurs obtenues pour différentes valeurs de alpha et de n.mkv
MKV
18.78 MB
02 - Construction des fonctions d'approximations linéaires
01 - Introduction.mkv
MKV
46.44 MB
02 - Bases polynomiales.mkv
MKV
64.64 MB
03 - Exemple avec les bases polynomiales - implantation du modèle.mkv
MKV
121.1 MB
04 - Exécution du modèle et analyse des résultats.mkv
MKV
105.92 MB
05 - Les bases de Fourier en 1D.mkv
MKV
46.76 MB
06 - Exemple de base de Fourier et d'approximation de fonction en 1D.mkv
MKV
32.71 MB
07 - Exemple de base de Fourier et d'approximation de fonction en 2D.mkv
MKV
102.14 MB
08 - Exemple avec les bases de Fourier.mkv
MKV
98.91 MB
09 - Comparaison bases Polynomiales et de Fourier.mkv
MKV
27.88 MB
03 - Approximation des fonctions non linéaires avec les réseaux neuronaux artificiels
01 - Intelligence artificielle, machine learning et deep learning.mkv
MKV
27.97 MB
02 - Les types d'apprentissages en deep learning.mkv
MKV
69.72 MB
03 - Structure d'un réseau de neurones artificiels.mkv
MKV
51.36 MB
04 - Fonction d'activation de type Sigmoide.mkv
MKV
25.18 MB
05 - Fonction de prédiction, de perte et de coût.mkv
MKV
66.3 MB
06 - Algorithme du gradient.mkv
MKV
38.3 MB
07 - Utiliser un réseau de neurones avec Tensorflow-Keras Introduction.mkv
MKV
51.27 MB
08 - Utiliser un réseau de neurones avec Tensorflow-Keras - Création du modèle.mkv
MKV
76.73 MB
09 - Utiliser un réseau de neurones avec Tensorflow-Keras - Entrainement + prédiction.mkv
MKV
48.5 MB
10 - Exemple d'application avec un réseau de neurones - Création du réseau.mkv
MKV
40.85 MB
11 - Exemple d'application avec un réseau de neurones - Algorithme n-step TD.mkv
MKV
143.74 MB
12 - Exemple d'application avec un réseau de neurones - Configuration de l'optimiseur.mkv
MKV
88.47 MB
13 - Exemple d'application avec un réseau de neurones - Entrainement du modèle.mkv
MKV
68.02 MB
04 - Contrôle de type on-policy par approximations
01 - Introduction.mkv
MKV
30.89 MB
02 - Contrôle semi-gradient sur des tâches épisodiques.mkv
MKV
67.94 MB
03 - Exemple d'application Sarsa 1-pas épisodique avec Fourier - Environnement du jeu.mkv
MKV
149.42 MB
04 - Exemple d'application Sarsa 1-pas épisodique avec Fourier - Fnc. d'approximation.mkv
MKV
173.39 MB
05 - Exemple d'application Sarsa 1-pas épisodique avec Fourier - Algorithme avec.mkv
MKV
162.07 MB
06 - Exemple d'application Sarsa 1-pas épisodique avec Fourier - Résultats.mkv
MKV
131.61 MB
07 - Contrôle semi-gradient sur des tâches continues.mkv
MKV
92.65 MB
08 - Exemple de tâche continue - Présentation de l'environnement.mkv
MKV
100.87 MB
09 - Exemple de tâche continue - Entrainement avec l'algorithme Sarsa différentiel.mkv
MKV
102.66 MB
10 - Exemple de tâche continue - Analyse des résultats.mkv
MKV
38.26 MB
11 - Algorithme différentiel semi gradient Sarsa n-step.mkv
MKV
36.87 MB
12 - Exemple de contrôle différentiel semi gradient Sarsa n-step.mkv
MKV
100.63 MB
05 - Contrôle on-policy Deep-Sarsa (Méthode Sarsa avec les réseaux de neurones)
01 - Présentation du problème.mkv
MKV
68.83 MB
02 - Construction du réseau de neurones.mkv
MKV
91.97 MB
03 - Algorithme d'apprentissage.mkv
MKV
81.68 MB
04 - Présentation de l'algorithme Python.mkv
MKV
85.41 MB
05 - Explications de l'algorithme Python.mkv
MKV
104.62 MB
06 - Résultats et analyse.mkv
MKV
24.25 MB
06 - Méthodes off-policy avec approximations
01 - Introduction.mkv
MKV
59.9 MB
02 - Méthodes semi gradient.mkv
MKV
52.66 MB
03 - Exemples d'instabilités.mkv
MKV
103.15 MB
04 - Exemple de Baird.mkv
MKV
52.99 MB
05 - Méthode TD(0) off-policy sur l'exemple de Baird.mkv
MKV
103.72 MB
06 - Méthode Q-learning sur l'exemple de Baird.mkv
MKV
46.2 MB
07 - La triade de la mort.mkv
MKV
59.95 MB
08 - Aspect géométrique des fonctions des valeurs.mkv
MKV
53.37 MB
09 - Aspect géométrique de la méthode de Monte-Carlo.mkv
MKV
31.02 MB
10 - Aspect géométrique de la méthode par programmation dynamique.mkv
MKV
50.72 MB
11 - Aspect géométrique de la méthode par différences temporelles.mkv
MKV
41.49 MB
12 - Méthode SGD sur l'erreur TD(0).mkv
MKV
50.34 MB
13 - Exemple de mauvaise convergence de l'algorithme naïf résiduel du gradient.mkv
MKV
49.48 MB
14 - Méthode SGD sur l'erreur de Bellman.mkv
MKV
97.57 MB
15 - Exemple de mauvaise convergence de l'algorithme résiduel du gradient.mkv
MKV
29.08 MB
16 - Concept d'apprenabilité.mkv
MKV
44.63 MB
17 - La fonction objectif VE n'est pas apprenable.mkv
MKV
76.05 MB
18 - Présentation de l'environnement pour tester l'erreur de Bellman.mkv
MKV
52.18 MB
19 - L'erreur de Bellman n'est pas apprenable.mkv
MKV
46.73 MB
20 - L'erreur de Bellman ne partage pas les paramètres optimaux.mkv
MKV
70.4 MB
21 - Méthodes par gradient TD - Notations matricielles et rappels géométriques.mkv
MKV
135.62 MB
22 - Méthodes par gradient TD - Expression du projecteur orthogonal.mkv
MKV
45.84 MB
23 - Méthodes par gradient TD - Construction de l'algorithme.mkv
MKV
84.38 MB
24 - Méthode Gradient TD - Exemple de Baird.mkv
MKV
89.59 MB
25 - Méthodes Emphatic-TD.mkv
MKV
109.47 MB
26 - Méthode Emphatic TD - Exemple de Baird.mkv
MKV
69.55 MB
07 - Contrôle off-policy Deep Q-learning
01 - Présentation de l'environnement.mkv
MKV
22.58 MB
02 - Illustration animée de l'environnement.mkv
MKV
19.85 MB
03 - Entrainement du modèle.mkv
MKV
104.55 MB
04 - Animation des résultats.mkv
MKV
24.78 MB
Fichiers source
01
1.1 1. Introduction.html
HTML
268.84 KB
10.1 5. Exemple d'application - agrégation d'états d'une marche aléatoire.ipynb
IPYNB
18.69 KB
11.1 6. Méthodes linéaires.ipynb
IPYNB
13.48 KB
12.1 6. Méthodes linéaires.ipynb
IPYNB
13.48 KB
13.1 6. Méthodes linéaires.ipynb
IPYNB
13.48 KB
14.1 7. Exemple d'application semi_gradient TD(0) et n-step.ipynb
IPYNB
20.27 KB
15.1 7. Exemple d'application semi_gradient TD(0) et n-step.ipynb
IPYNB
20.27 KB
2.1 2. Approximation de la fonction des valeurs des états.html
HTML
271.47 KB
3.1 3. Fonction objectif de prédiction.html
HTML
275.01 KB
4.1 4. Méthodes du gradient stochastique et du semi-gradient.html
HTML
281.62 KB
5.1 4. Méthodes du gradient stochastique et du semi-gradient.html
HTML
281.62 KB
6.1 4. Méthodes du gradient stochastique et du semi-gradient.html
HTML
281.62 KB
7.1 5. Exemple d'application - agrégation d'états d'une marche aléatoire.ipynb
IPYNB
18.69 KB
8.1 5. Exemple d'application - agrégation d'états d'une marche aléatoire.ipynb
IPYNB
18.69 KB
9.1 5. Exemple d'application - agrégation d'états d'une marche aléatoire.ipynb
IPYNB
18.69 KB
02
1.1 1. Introduction.html
HTML
269.85 KB
2.1 2. Bases polynomiales.html
HTML
270.12 KB
3.1 3. Exemple avec les bases polynomiales.ipynb
IPYNB
20.07 KB
4.1 3. Exemple avec les bases polynomiales.ipynb
IPYNB
20.07 KB
5.1 4. Bases de Fourier.ipynb
IPYNB
20.24 KB
6.1 4. Bases de Fourier.ipynb
IPYNB
20.24 KB
7.1 4. Bases de Fourier.ipynb
IPYNB
20.24 KB
8.1 5. Exemple avec les bases de Fourier.ipynb
IPYNB
21.2 KB
9.1 6. Comparaison bases Polynomes et Fourier.ipynb
IPYNB
22.79 KB
03
10.1 5. Exemple d'approximation non linéaire avec un réseau de neurones.ipynb
IPYNB
20.44 KB
11.1 5. Exemple d'approximation non linéaire avec un réseau de neurones.ipynb
IPYNB
20.44 KB
12.1 5. Exemple d'approximation non linéaire avec un réseau de neurones.ipynb
IPYNB
20.44 KB
3.1 4. Concepts liés aux réseaux de neurones artificiels.ipynb
IPYNB
13 KB
4.1 4. Concepts liés aux réseaux de neurones artificiels.ipynb
IPYNB
13 KB
5.1 4. Concepts liés aux réseaux de neurones artificiels.ipynb
IPYNB
13 KB
6.1 3. Concepts liés aux réseaux de neurones artificiels.ipynb
IPYNB
13 KB
7.1 4. Utilisation de Keras-Tensorflow pour mettre en oeuvre des réseaux de neurones.ipynb
IPYNB
10.61 KB
8.1 4. Utilisation de Keras-Tensorflow pour mettre en oeuvre des réseaux de neurones.ipynb
IPYNB
10.61 KB
9.1 4. Utilisation de Keras-Tensorflow pour mettre en oeuvre des réseaux de neurones.ipynb
IPYNB
10.61 KB
04
1.1 1. Introduction.html
HTML
268.44 KB
10.1 6. Exemple de contrôle semi gradient sur des tâches continues.ipynb
IPYNB
29.71 KB
11.1 7. Algorithme différentiel semi gradient Sarsa n-step.html
HTML
270.91 KB
12.1 8. Exemple de contrôle différentiel semi gradient Sarsa n-step.ipynb
IPYNB
27.94 KB
3.1 3. Exemple d'application de l'algorithme semi gradient Sarsa 1-pas épisodique avec bases de Fourier.ipynb
IPYNB
30.76 KB
4.1 3. Exemple d'application de l'algorithme semi gradient Sarsa 1-pas épisodique avec bases de Fourier.ipynb
IPYNB
30.76 KB
5.1 3. Exemple d'application de l'algorithme semi gradient Sarsa 1-pas épisodique avec bases de Fourier.ipynb
IPYNB
30.76 KB
6.1 3. Exemple d'application de l'algorithme semi gradient Sarsa 1-pas épisodique avec bases de Fourier.ipynb
IPYNB
30.76 KB
7.1 5. Contrôle semi-gradient sur des tâches continues.html
HTML
280.01 KB
8.1 6. Exemple de contrôle semi gradient sur des tâches continues.ipynb
IPYNB
29.71 KB
9.1 6. Exemple de contrôle semi gradient sur des tâches continues.ipynb
IPYNB
29.71 KB
05
1.1 Deep-Sarsa.ipynb
IPYNB
30.28 KB
2.1 Deep-Sarsa.ipynb
IPYNB
30.28 KB
3.1 Deep-Sarsa.ipynb
IPYNB
40.28 KB
4.1 Deep-Sarsa.ipynb
IPYNB
30.28 KB
5.1 Deep-Sarsa.ipynb
IPYNB
30.28 KB
6.1 Deep-Sarsa.ipynb
IPYNB
30.28 KB
06
1.1 1. Introduction.html
HTML
270.12 KB
10.1 7. Aspect géométrique des fonctions des valeurs.html
HTML
288.76 KB
11.1 7. Aspect géométrique des fonctions des valeurs.html
HTML
288.76 KB
12.1 8. Méthode par descente du gradient sur l'erreur de Bellman.html
HTML
294.9 KB
13.1 8. Méthode par descente du gradient sur l'erreur de Bellman.html
HTML
294.9 KB
14.1 8. Méthode par descente du gradient sur l'erreur de Bellman.html
HTML
294.9 KB
15.1 8. Méthode par descente du gradient sur l'erreur de Bellman.html
HTML
294.9 KB
16.1 9. L'erreur de Bellman n'est pas apprenable.html
HTML
297.48 KB
17.1 9. L'erreur de Bellman n'est pas apprenable.html
HTML
297.48 KB
18.1 9. L'erreur de Bellman n'est pas apprenable.html
HTML
297.48 KB
19.1 9. L'erreur de Bellman n'est pas apprenable.html
HTML
297.48 KB
2.1 2. Méthodes semi gradient.html
HTML
275.99 KB
20.1 9. L'erreur de Bellman n'est pas apprenable.html
HTML
297.48 KB
21.1 10. Méthodes par gradient TD - Introduction des concepts mathématiques.html
HTML
286.77 KB
22.1 10. Méthodes par gradient TD - Introduction des concepts mathématiques.html
HTML
286.77 KB
23.1 11. Méthodes par gradient TD - Construction de l'algorithme.html
HTML
289.68 KB
24.1 12. Méthode Gradient TD - Exemple de Baird.ipynb
IPYNB
16.51 KB
25.1 13. Méthodes Emphatic-TD.html
HTML
281.94 KB
26.1 14. Méthode Emphatic TD - Exemple de Baird.ipynb
IPYNB
35.36 KB
3.1 3. Exemples d'instabilités.html
HTML
279.46 KB
4.1 3. Exemples d'instabilités.html
HTML
279.46 KB
5.1 4. Méthode TD(0) off-policy sur l'exemple de Baird.ipynb
IPYNB
12.38 KB
6.1 5. Méthode Q-learning sur l'exemple de Baird.ipynb
IPYNB
24.4 KB
7.1 6. La triade de la mort.html
HTML
271.51 KB
8.1 7. Aspect géométrique des fonctions des valeurs.html
HTML
288.76 KB
9.1 7. Aspect géométrique des fonctions des valeurs.html
HTML
288.76 KB
07
1.1 Deep Q-Learning.ipynb
IPYNB
29.31 KB
2.1 Deep Q-Learning.ipynb
IPYNB
29.31 KB
3.1 Deep Q-Learning.ipynb
IPYNB
29.31 KB
4.1 Deep Q-Learning.ipynb
IPYNB
29.31 KB

Description

Related Torrents

Location

Trackers

Tracker name
https://tracker.yggleak.top/announce
udp://tracker.opentrackr.org:1337/announce
udp://open.demonii.com:1337/announce
udp://open.stealth.si:80/announce
udp://exodus.desync.com:6969/announce
https://torrent.tracker.durukanbal.com:443/announce
udp://tracker1.myporn.club:9337/announce
udp://tracker.torrent.eu.org:451/announce
udp://tracker.theoks.net:6969/announce
udp://tracker.srv00.com:6969/announce
udp://tracker.filemail.com:6969/announce
udp://tracker.dler.org:6969/announce
udp://tracker.corpscorp.online:80/announce
udp://tracker.alaskantf.com:6969/announce
udp://tracker-udp.gbitt.info:80/announce
udp://t.overflow.biz:6969/announce
udp://open.dstud.io:6969/announce
udp://leet-tracker.moe:1337/announce
udp://explodie.org:6969/announce
udp://bittorrent-tracker.e-n-c-r-y-p-t.net:1337/announce
udp://6ahddutb1ucc3cp.ru:6969/announce
udp://94.23.207.177:6969/announce
udp://37.59.48.81:6969/announce
udp://54.36.179.216:6969/announce
udp://193.42.111.57:9337/announce
udp://43.250.54.137:6969/announce
udp://91.216.110.53:451/announce
udp://45.134.88.121:6969/announce
udp://135.125.236.64:6969/announce
udp://5.255.124.190:6969/announce
udp://93.158.213.92:1337/announce
udp://107.189.4.235:1337/announce
udp://tracker.qu.ax:6969/announce
udp://107.189.7.165:6969/announce
udp://103.251.166.126:6969/announce
udp://185.243.218.213:80/announce
http://tracker.zhuqiy.com:80/announce
udp://81.230.84.201:6969/announce
udp://212.42.38.197:6969/announce
http://193.31.26.113:6969/announce
udp://176.99.7.59:6969/announce
http://tr.nyacat.pw:80/announce
http://tracker.p2p-world.net:8080/7IknUIVzbHfYVKGgeTDEyiNIOYL7N0JI/announce
Torrent hash: