Language Understanding and Code Generation

Benchmarks

Dataset Name	SOTA Method	Metric	Trend
Llama 1B Evaluation Suite (ARC, HellaSwag, MMLU, TruthfulQA, WinoGrande, Humaneval) 3.2	QLoRA w/ TOKENTUNE (Random)	ARC39.33		6	5mo ago

Showing 1 of 1 rows