realAsma

realAsma

Achievements

AgentInProduction AgentInProduction Public

1
cleanrl cleanrl Public

Forked from vwxyzjn/cleanrl

High-quality single file implementation of Deep Reinforcement Learning algorithms with research-friendly features (PPO, DQN, C51, DDPG, TD3, SAC, PPG)

Python
NVIDIA/Megatron-LM NVIDIA/Megatron-LM Public

Ongoing research training transformer models at scale

Python 16.7k 4.1k
NVIDIA/Model-Optimizer NVIDIA/Model-Optimizer Public

A unified library of SOTA model optimization techniques like quantization, distillation, pruning, neural architecture search, speculative decoding, etc. It compresses deep learning models for downs…

Python 2.9k 440
NVIDIA-NeMo/RL NVIDIA-NeMo/RL Public

Scalable toolkit for efficient model reinforcement

Python 1.7k 423