LLM Judge Evaluation on LLM-to-LLM Evaluation Reference: GPT-5.2

0.84Global Correlation (r)

GPT-5-mini

Updated 4mo ago

Evaluation Results

Method	Links
GPT-5-mini 2026.03		0.84	0.54	35	52
GPT-4.1-nano 2026.03		0.49	0.29	42	2