Search research articles

关于 JoVE

概览领导团队博客 JoVE 帮助中心

作者

出版流程编辑委员会范围与政策同行评审常见问题投稿

图书馆员

用户评价订阅访问资源图书馆顾问委员会常见问题

研究

JoVE Journal Methods Collections JoVE Encyclopedia of Experiments 存档

教育

JoVE Core JoVE Business JoVE Science Education JoVE Lab Manual 教师资源中心教师网站

使用条款与条件

相关概念视频

Reinforcement Schedules

Reinforcement Schedules

Positive reinforcement is a powerful method for teaching new behaviors to both animals and humans. B.F. Skinner demonstrated this with his experiments using rats in a Skinner box. When a rat pressed a lever, it received a food pellet. This immediate reward encouraged the rat to repeat the behavior. This method, where a reward follows every instance of the behavior, is known as continuous reinforcement. It is highly effective for establishing new behaviors quickly.
Once a behavior is learned,...

您也可能阅读

相关文章

通过共同作者、期刊和引用图与本文相关的文章。

排序

Same author

Incorporation of Chlorophyllin-Loaded, Copper-Doped Cyclodextrin-Based Metal-Organic Framework into Microporous Polylactic Acid Coatings for Enhanced Light-Activated Microbial Inactivation.

ACS applied materials & interfaces·2026

Same author

Medical Referring Image Segmentation via Next-Token Mask Prediction.

IEEE transactions on medical imaging·2026

Same author

All-in-One Graphene-Based Integrated Cathode for Li─O<sub>2</sub> Battery: Harmonizing High Energy, High Power, and Longevity.

Small (Weinheim an der Bergstrasse, Germany)·2026

Same author

Spectroscopic Dynamic Digital-Twin Model Reveals Practical Optimization Strategy of SHJ Solar Cells.

Small methods·2026

Same author

Ubc9-mediated SUMOylation of Ninj1 alleviates inflammatory responses in hepatic ischaemia/reperfusion injury.

Clinical and translational medicine·2026

Same author

Ultrafast Anion-Hopping Conduction in Organic Solvent via Imidazolium-Grafted Dynamic Ion-Conducting Spacers for Stable Non-Aqueous Flow Batteries.

Angewandte Chemie (International ed. in English)·2026

Same journal

An Evolutionary Algorithm Assisted by an Ensemble of Pareto-Optimal Surrogate Models.

IEEE transactions on cybernetics·2026

Same journal

A Quantum Self-Attention Neural Network Model on Quantum Circuits.

IEEE transactions on cybernetics·2026

Same journal

Semi-Explicit Solution of Some Discrete-Time Higher-Order-Cost Mean-Field-Type Control.

IEEE transactions on cybernetics·2026

Same journal

A Novel One-Step Small Object Detector for Autonomous Aerial Vehicles.

IEEE transactions on cybernetics·2026

Same journal

Online Data-Driven-Based Optimal Output Tracking Control Without Initial Stabilizing Policy.

IEEE transactions on cybernetics·2026

Same journal

Digital Redesign-Based Interval State Estimation for Continuous Systems With Aperiodic Discrete Measurements.

IEEE transactions on cybernetics·2026

查看所有相关文章

Search research articles

相关实验视频

Updated: May 22, 2025

Large Scale Energy Efficient Sensor Network Routing Using a Quantum Processor Unit

Large Scale Energy Efficient Sensor Network Routing Using a Quantum Processor Unit

Published on: September 8, 2023

在分布式网络控制中用于无线调度的深度强化学习.

Gaoyang Pang, Kang Huang, Daniel E Quevedo

IEEE transactions on cybernetics

|May 20, 2025

概括

此摘要是机器生成的。

本研究引入了一种深度强化学习方法,用于优化无线网络控制系统 (WNCS) 调度. 拟议的方法确保了系统的稳定性,并优于现有的政策.

更多相关视频

Closed-loop Neuro-robotic Experiments to Test Computational Properties of Neuronal Networks

Closed-loop Neuro-robotic Experiments to Test Computational Properties of Neuronal Networks

Published on: March 2, 2015

Author Spotlight: Enhancing Engineering Education via WebVR-Based Online Laboratories

Author Spotlight: Enhancing Engineering Education via WebVR-Based Online Laboratories

Published on: February 23, 2024

相关实验视频

Last Updated: May 22, 2025

Large Scale Energy Efficient Sensor Network Routing Using a Quantum Processor Unit

Large Scale Energy Efficient Sensor Network Routing Using a Quantum Processor Unit

Published on: September 8, 2023

Closed-loop Neuro-robotic Experiments to Test Computational Properties of Neuronal Networks

Closed-loop Neuro-robotic Experiments to Test Computational Properties of Neuronal Networks

Published on: March 2, 2015

Author Spotlight: Enhancing Engineering Education via WebVR-Based Online Laboratories

Author Spotlight: Enhancing Engineering Education via WebVR-Based Online Laboratories

Published on: February 23, 2024

科学领域:

控制系统工程控制系统工程
无线通信网络无线通信网络
随机系统理论随机系统理论

背景情况:

无线网络控制系统 (WNCS) 面临着在有限频率通道的联合上下链路调度方面的挑战.
确保WNCS中的系统稳定性需要考虑控制和通信参数.

研究的目的:

为完全分布的WNCS制定稳定和最佳的传输调度政策.
为了解决WNCS调度的强化学习中大型行动空间的复杂性.

主要方法:

通过随机系统理论来推导WNCS的足够稳定条件.
制定日程安排问题作为马尔科夫决策过程.
开发一个深度强化学习 (DRL) 框架,采用新的行动空间缩小和嵌入技术.

主要成果:

一个静止和决定性的调度策略被证明可以在满足衍生稳定性条件时稳定WNCS.
拟议的DRL框架有效地处理大型行动空间.
数字结果表明,与基准政策相比,表现优越.

结论:

基于DRL的框架提供了一个有效的解决方案,用于WNCS.中联合上链/下链调度.
拟议的行动空间管理技术提高了DRL对复杂的调度问题的适用性.
该研究确定了系统稳定条件和WNCS.中可实现的调度策略之间的联系.