Reinforcement
Reinforcement Schedules
Velocity and Position by Integral Method
Observational Learning
Average and Instantaneous Velocity Vectors
Instantaneous Velocity - I
También podría leer
Artículos vinculados a este trabajo por autores compartidos, revista y gráfico de citas.
Updated: Feb 24, 2026

Tracking Rats in Operant Conditioning Chambers Using a Versatile Homemade Video Camera and DeepLabCut
Published on: June 15, 2020
1Department of Statistics, Purdue University, West Lafayette, IN 47907, USA.
Este estudio presenta Langevinized Kalman Temporal-Difference (LKTD), un novedoso algoritmo de aprendizaje por refuerzo (RL). LKTD cuantifica la incertidumbre en el aprendizaje profundo por refuerzo aprovechando los métodos de filtrado de Kalman y Muestreo de Monte Carlo de Markov de Gradiente Estocástico.
Área de la Ciencia:
Sus antecedentes:
Objetivo del estudio:
Principales métodos:
Principales resultados:
Conclusiones: