Share your thoughts, 1 month free Claude Pro on usSee more

Calvin

Benchmarks

Task Name	Dataset Name	SOTA Result
Long-horizon robot manipulation	Calvin ABCD→D	Task 1 Completion Rate99.4	140
Robotic Manipulation	CALVIN ABCD->D	Avg Length0.4	139
Long-horizon task completion	Calvin ABC->D	Success Rate (1)98.1	72
Robotic Manipulation	Calvin ABC-D	Task-1 Score100	71
Sequential Robotic Manipulation	CALVIN	Success Rate (1 task)99.8	63
Robot Manipulation	CALVIN (ABC->D)	Average Successful Length4.75	62
Long-horizon robotic manipulation	CALVIN ABC-D	Average Trajectory Length0.27	48
Robotic Manipulation	CALVIN D→D	Average Length4.52	40
Instruction-following robotic manipulation	CALVIN ABC→D (unseen environment D)	Success Rate (Length 1)98.5	29
Language-conditioned long-horizon robotic manipulation	CALVIN ABC→D	Success Rate (1 Task)99.6	22
Long-horizon language-conditioned manipulation	Calvin ABC→D	Average Sequence Length4.43	18
Robot Manipulation	CALVIN ABC->D 1.0	Success Rate (1 Inst)96.8	18
Long-horizon Robot Manipulation	CALVIN long-horizon	Success Rate 196.9	17
Long-horizon language-conditioned policy learning	CALVIN	Success Rate (Step 5/5)98.4	16
Long-horizon robotic manipulation	CALVIN ABC→D Zero-shot	Task 1 Success Rate98.8	16
Long-horizon robot manipulation	CALVIN	Task Completion Rate (1)96.3	15
Long-horizon task completion	CALVIN	Success Rate (1 Task)93.8	15
Robotic Manipulation	CALVIN	Average Length2.55	13
Long-Horizon Multi-Task Language Control	CALVIN ABC→D (test)	Seq Success (1)96	13
Long-Horizon TAMP	Calvin Unconstrained	SR (3/5)100	12
Long-Horizon TAMP	Calvin Causal	Success Rate (3/5)100	12
Language-Conditioned Manipulation	CALVIN MTLC	Success Rate95	12
Long-horizon task success	CALVIN D→D long-horizon	Success Rate (LH-1)99.5	11
Robot manipulation	CALVIN 10% ABCD → D	Success Rate (L=1)84.1	11
turn off lightbulb	CALVIN	Success Rate100	10

Showing 25 of 66 rows