Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

nm-research updated a dataset about 7 hours ago

inference-optimization/laguna-xs-ultrachat-responses

ChibuUkachi updated a model about 10 hours ago

inference-optimization/MiniMax-M2.5.w8a8

MeganEFlynn updated a dataset about 10 hours ago

inference-optimization/laguna-xs-ultrachat-responses

View all activity

Collections 3

View 3 collections

models 307

inference-optimization/MiniMax-M2.5.w8a8

229B • Updated about 10 hours ago

inference-optimization/MiniMax-M2.5.w4a16

34B • Updated about 13 hours ago • 111

inference-optimization/MiniMax-M2.5-BF16

Text Generation • 229B • Updated about 14 hours ago • 137

inference-optimization/DeepSeek-V4-Flash-FP8-NVFP4

163B • Updated about 18 hours ago

inference-optimization/DeepSeek-V4-Flash-bf16-NVFP4-FP8-BLOCK

Updated about 18 hours ago

inference-optimization/DeepSeek-V4-Flash-bf16

Updated about 24 hours ago

inference-optimization/ctest-Qwen3-8B-speculator.dflash

2B • Updated 1 day ago

inference-optimization/MiniMax-M2.5-NVFP4

130B • Updated 1 day ago • 285

inference-optimization/DeepSeek-V4-Flash-5layers-nvfp4moe

20B • Updated 2 days ago

inference-optimization/DeepSeek-V4-Flash-bf16-dequantized-5layers

Updated 2 days ago

View 307 models

datasets 13

inference-optimization/laguna-xs-ultrachat-responses

Preview • Updated about 7 hours ago • 20

inference-optimization/laguna-xs-ultrachat-conversations

Viewer • Updated 7 days ago • 205k • 21

inference-optimization/laguna-xs-magpie-300k-responses

Viewer • Updated 7 days ago • 300k • 27

inference-optimization/laguna-xs-magpie-300k-conversations

Viewer • Updated 7 days ago • 298k • 26

inference-optimization/Qwen3-8b-sharegpt-5k

Preview • Updated 11 days ago • 86

inference-optimization/speculators_benchmarks_tool_call

Viewer • Updated 14 days ago • 4.9k • 67

inference-optimization/speculators-qwen3-30b-a3b-instruct-2507

Preview • Updated 23 days ago • 33

inference-optimization/speculators-qwen3-30b-a3b-instruct

Preview • Updated Mar 26 • 28

inference-optimization/speculators-qwen3-32b-instruct

Preview • Updated Mar 26 • 40

inference-optimization/gpt-oss-20b-nan-hidden-states-repro

Updated Mar 19 • 59

View 13 datasets