Build software better, together

hsvgbkhgbv / SQDDPG

This is a framework for the research on multi-agent reinforcement learning and the implementation of the experiments in the paper titled by ''Shapley Q-value: A Local Reward Approach to Solve Global Reward Games''.

framework reinforcement-learning openai-gym pytorch policy-gradient multiagent-reinforcement-learning multi-agent-reinforcement-learning marl sqddpg shapley-q-value multi-agent-rl

Updated Nov 4, 2024
Python

tk-yasuno / dql-bridge-maintenance

Star

A deep reinforcement learning system for optimizing bridge maintenance decisions across municipal infrastructure fleets, implementing cross-subsidy budget sharing and cooperative multi-agent learning.

reinforcement-learning deep-q-learning decision-support-system predictive-maintenance cbm resource-sharing large-scale-optimization markov-decision-process multi-agent-rl prognostics-health-management budget-allocation bridge-maintenance disaster-resilience infrastructure-maintenance-management infrastructure-resilience municipal-infrastructure hadr-ai cooperative-rl cross-subsidy

Updated Dec 5, 2025
Python

Nikelroid / adversarial-coevolution

Star

Adversarial Co-Evolution of RL and LLM Agents: A framework for training high-performance PPO agents against Large Language Models in Gin Rummy, utilizing curriculum learning and knowledge distillation.

reinforcement-learning pytorch knowledge-distillation gin-rummy curriculum-learning ppo multi-agent-rl pettingzoo stable-baselines3 llm ollama

Updated Dec 13, 2025
Python

buhsnn / curator-accel-overcooked-marl

Star

Curator-guided curriculum learning for zero-shot coordination in Overcooked-AI using multi-agent reinforcement learning.

reinforcement-learning curriculum-learning ppo multi-agent-rl unsupervised-environment-design zero-shot-coordination overcooked-ai

Updated Mar 10, 2026
Jupyter Notebook

Devanik21 / Dark-Thermodynamic-Mind

Star

Dark Zero Point Genesis: PPO Latent World Models Under Thermodynamic Scarcity 256 agents. 128D Latent Manifolds. Zero supervision. Agents utilize PPO-clipped surrogate objectives. Survival = Predictive Error Coding (PEC) × Energy Efficiency across a 50/15 Seasonal Cycle.

energy-efficiency cognitive-architecture neuromorphic-computing free-energy-principle multi-agent-rl ppo-reinforcement-learning autopoietic-systems latent-world-models predictive-error-coding thermodynamic-science

Updated Feb 26, 2026
Python

chizkidd / huggingface-deep-RL-course

Star

Going through the Hugging Face Deep Reinforcement Learning course.

Updated Mar 4, 2026
Jupyter Notebook

Vaioskn / adversarial-soccer-rl

Star

Deterministic hex-grid soccer environment with two adversarial agents. Implements Q-Learning, Minimax-Q (via LP), and Belief-Q with online belief updates; trains in SE2G/SE6G to reduce state space and evaluates behaviors in the full environment with comprehensive visualizations.

reinforcement-learning linear-programming q-learning game-theory markov-games markov-decision-process multi-agent-rl adversarial-rl minimax-q belief-q state-space-reduction

Updated Sep 28, 2024
Python

SarathL754 / Multi-agent-RL-texas-holdem-aec

Star

An engineering-focused multi-agent reinforcement learning system for Texas Hold’em using PettingZoo AEC and a custom PyTorch PPO self-play setup.

reinforcement-learning self-play multi-agent-rl ppo-pytorch pettingzoo

Updated Jan 24, 2026
Python

julesser / DeepRL-P3-Collaboration-Competition

Star

Project 3 of Udacity's Deep Reinforcement Learning Nanodegree Program

unity-ml-agents multi-agent-rl reinforcment-learning

Updated Oct 25, 2021
Python

JEONGHEESIK / CrazyArcade

Star

크레이지아케이드 모작 + Reinforcement Learning ( DQN, PPO )

python reinforcement-learning pytorch sensor-fusion game-ai actor-critic deep-rl client-server-architecture experience-replay tcp-sockets multi-agent-rl

Updated Dec 6, 2025
Python

Devanik21 / Tic-Tac-Toe-RL-Battle-Arena

Star

🎯 Key Features 1. Flexible Game Configuration Adjustable grid size (3×3 up to 10×10) Customizable win condition (e.g., 5-in-a-row on a 7×7 board) 2. Two Competing RL Agents Agent 1 (Blue X) vs Agent 2 (Red O) Each has independent Q-Learning parameters Watch them evolve different strategies over time

reinforcement-learning tic-tac-toe q-learning game-theory deep-rl self-play multi-agent-rl multi-agent-games competitive-rl

Updated Dec 13, 2025
Python

Devanik21 / Hexapawn-RL

Star

Hexapawn Game Engine Proper 3×3 board with pawn movement Strategic RL Agents Minimax with Alpha-Beta Pruning (depth configurable 1-7) Q-Learning with temporal difference updates Experience replay for efficient learning Epsilon-greedy exploration with decay Multi-level decision hierarchy (immediate threats → strategic planning)

reinforcement-learning q-learning epsilon-greedy game-theory deep-rl temporal-difference multi-agent-rl minimax-alpha-beta hexapawn-game

Updated Dec 14, 2025
Python

alizangeneh / multiagent-warehouse-navigation-dqn

Star

Research-grade Reinforcement Learning framework for single-agent and multi-agent warehouse navigation using Deep Q-Networks (DQN), PyTorch, replay buffer, target networks, logging, and full test suite. Built for PhD-level RL and autonomous systems research.

machine-learning reinforcement-learning robotics decision-making deep-reinforcement-learning path-planning pytorch dqn multiagent-systems gridworld deep-q-network ai-research target-network autonomous-navigation experience-replay multi-agent-rl cooperative-agents multi-agent-navigation warehouse-robotics

Updated Dec 11, 2025
Python

KANziyang / 6G_EdgeCloudComputing_For_MAPPO

Star

Multi-Agent Reinforcement Learning based Edge-Cloud Computing Offloading Framework using MAPPO and PureEdgeSim for 6G Networks.

reinforcement-learning resource-allocation multi-agent-rl mappo task-offloading 6g-networks edge-cloud-computing

Updated Mar 17, 2026
Java

Devanik21 / The-Game-of-Nim-RL

Star

Classic Nim Rules - 3 customizable piles, take any number from one pile per turn, last to take loses Q-Learning Agents - Two independent agents that learn optimal strategy through self-play

reinforcement-learning q-learning game-theory deep-rl nim-game self-play combinatorial-game-theory multi-agent-rl

Updated Dec 14, 2025
Python

tk-yasuno / dql-multi-equipments-cbm

Star

Multi-Equipment CBM system using QR-DQN with advanced probability distribution analysis. Coordinated maintenance decision-making for 4 industrial equipment units with realistic anomaly rates (1.9-2.2%), comprehensive risk analysis (VaR/CVaR), and 51-quantile distribution visualization.

reinforcement-learning risk-analysis uncertainty-estimation value-at-risk deep-q-learning predictive-maintenance qr-dqn distributional-rl condition-based-maintenance multi-agent-rl cvar prognostics-health-management disaster-resilience equipment-maintenance infrastructure-prognostics

Updated Dec 21, 2025
Python

Devanik21 / CoNnEcTX

Star

Pure RL Agents: I implemented Q-Learning agents that learn through Self-Play. They play against each other to get smarter without human help! Symmetry Optimization: To make them "genius" faster, I added logic so they understand that a board mirrored left-to-right is the same situation. This cuts the learning time in half!

reinforcement-learning q-learning game-theory autonomous-agents deep-rl self-play multi-agent-rl self-improving-systems symmetry-optimization

Updated Dec 13, 2025
Python

Devanik21 / general-gamer-ai-lite

Star

A specialized Reinforcement Learning (RL) project focused on multi-task mastery across 10 distinct gaming environments. General-Gamer-AI-Lite implements a lightweight multi-task agent designed to learn shared representations and transfer knowledge between varied game mechanics, from classic arcade challenges to strategic grid worlds.

reinforcement-learning deep-reinforcement-learning game-theory multi-task-learning multi-agent-rl curiosity-driven-exploration ppo-algorithm hierarchical-rl self-play-rl game-environment-simulation

Updated Jan 26, 2026
Python

mwasifanwar / multi_agent_rl

Star

Coordinated multi-agent systems that learn to solve complex collaborative and competitive tasks.

game-theory emergent-behavior game-theory-model game-theory-algorithms game-theory-framework multi-agent-rl cooperative-ai distributed-ai

Updated Nov 4, 2025
Python

tk-yasuno / dql-aged-multi-equipment-cbm

Star

Multi-Equipment CBM (Condition-Based Maintenance) optimization using Deep Q-Learning with cost leveling and scenario comparison. Advanced RL system with QR-DQN, N-step learning, and parallel environments for HVAC equipment predictive maintenance.

reinforcement-learning deep-q-learning cost-optimization predictive-maintenance qr-dqn scenario-analysis distributional-rl condition-based-maintenance multi-agent-rl prognostics-health-management disaster-resilience n-step-learning infrastructure-prognostics hvac-maintenance

Updated Dec 25, 2025
Python

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

multi-agent-rl

Here are 21 public repositories matching this topic...

hsvgbkhgbv / SQDDPG

tk-yasuno / dql-bridge-maintenance

Nikelroid / adversarial-coevolution

buhsnn / curator-accel-overcooked-marl

Devanik21 / Dark-Thermodynamic-Mind

chizkidd / huggingface-deep-RL-course

Vaioskn / adversarial-soccer-rl

SarathL754 / Multi-agent-RL-texas-holdem-aec

julesser / DeepRL-P3-Collaboration-Competition

JEONGHEESIK / CrazyArcade

Devanik21 / Tic-Tac-Toe-RL-Battle-Arena

Devanik21 / Hexapawn-RL

alizangeneh / multiagent-warehouse-navigation-dqn

KANziyang / 6G_EdgeCloudComputing_For_MAPPO

Devanik21 / The-Game-of-Nim-RL

tk-yasuno / dql-multi-equipments-cbm

Devanik21 / CoNnEcTX

Devanik21 / general-gamer-ai-lite

mwasifanwar / multi_agent_rl

tk-yasuno / dql-aged-multi-equipment-cbm

Improve this page

Add this topic to your repo