hybrid-reasoning

Star

Here are 4 public repositories matching this topic...

VainF / Thinkless

Star

[NeurIPS 2025] Thinkless: LLM Learns When to Think

reinforcement-learning llms grpo hybrid-reasoning adaptive-reasoning

Updated Sep 26, 2025
Python

mbeps / qwen3_fine-tune_mult-it

Star

Parameter Efficient Fine-Tuning of various Qwen3 family of models on the Mult-It dataset using various approaches

nlp machine-learning natural-language-processing deep-learning pytorch artificial-intelligence lora fine-tuning large-language-models llms low-rank-adaptation qwen parameter-efficient-fine-tuning reasoning-language-models qwen3 hybrid-reasoning

Updated Nov 12, 2025
Jupyter Notebook

flamehaven01 / HRPO-X

Star

Hybrid Reasoning Policy Optimization (HRPO): a research prototype for hybrid latent reasoning with RL.

python machine-learning research reinforcement-learning deep-learning pytorch neural-networks cognitive-architecture deductive-reasoning policy-optimization ml-framework inductive-reasoning ai-reasoning hybrid-reasoning

Updated Jan 8, 2026
Python

Local AI workbench for embeddings, summarization, and OpenAI Agent SDK–compatible workflows. Supports Gemma models, GPT-OSS tool-calling, hardware acceleration, caching, and rate limiting, plus cloud-offloaded, persona-driven summarization through Gemini.

secure-access production-ai code-summarization code-intelligence fastapi text-embeddings local-ai gemma3 rate-limiting-caching hybrid-reasoning gpt-oss-20b multimodel-llm matryoshka-embeddings persona-engineering

Updated Dec 21, 2025
Python

Improve this page

Add a description, image, and links to the hybrid-reasoning topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the hybrid-reasoning topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

hybrid-reasoning

Here are 4 public repositories matching this topic...

VainF / Thinkless

mbeps / qwen3_fine-tune_mult-it

flamehaven01 / HRPO-X

mirzahusadzic / egemma

Improve this page

Add this topic to your repo