Share your thoughts, 1 month free Claude Pro on usSee more

Root Cause Analysis on SFT data Easy (seen)

77.4Accuracy (%)

OpsLLM-32B

Updated 2mo ago

Evaluation Results

Method	Links
OpsLLM-32B 2026.04		77.4
OpsLLM-14B 2026.04		53.2
OpsLLM-7B 2026.04		38.7
GPT-5.2 2026.04		23.3
Qwen3-Next-80b-a3b-Thinking 2026.04		21.8
Qwen-Plus-2025-09-11 2026.04		21.5
Qwen3-Max-2025-09-23 2026.04		20.8
Zhiyu-32B 2026.04		14.1
R1-Distill-SRE-Qwen-32B-INT8 2026.04		12.6
Moonshot-Kimi-K2-Instruct 2026.04		11.6
Deepseek-v3.2-exp 2026.04		10.4
Qwen2.5-32B-Instruct 2026.04		10.1
Qwen2.5-14B-Instruct 2026.04		9
Qwen2.5-7B-Instruct 2026.04		8
aiops-qwen-4b 2026.04		7.9
Qwen-Turbo-2025-07-15 2026.04		7.2
R1-Distill-SRE-Qwen-7B 2026.04		3