Llama3

Benchmarks

Task Name	Dataset Name	SOTA Result
Multi-bit LLM Watermarking	LLaMA3-8B-Base Max 256 Tokens	AUC1	20
Multi-bit LLM Watermarking	LLaMA3-8B-Base Max 128 Tokens	AUC1	20
Jailbreak attack	Llama3-8b	Average ASR0	16
Jailbreak Attack	llama3-8b pretrained v1	ASR0	13
Defending against gradient-based attacks	Llama3 AutoDAN Attack (test)	ASR10.57	10
Steganography	Llama3	Entropy (bit/token)0.7941	9
Style Manipulation Attack	Llama3-8B-Inst	Score1.481	6
LLM Jailbreaking	Llama3-CB	Success Rate First (SRF)70	6
Training Throughput	Llama3 8B (train)	Throughput (128K SeqLen)2,320.47	5
Training Memory Usage Profiling	Llama3-8B 8×H100s	Peak Memory Usage (128K)21.1	5
Model Merging for Safety and Utility	LLaMA3-8B-Instruct	HS Score12.4	4
Quantization	LLaMA3-8B	Averaged Quantization Time (s)27	4
In-Context Learning	Llama3-8B Scenario 5 ICL prompts	Accuracy82.8	3
In-Context Learning	Llama3-8B Scenario 2: More Pos. (P={-5,...,-1})	Accuracy78.18	3
In-Context Learning	Llama3-8B Baseline (P={-1}, L={14})	Accuracy78.65	3
Training Efficiency	Llama3-8x70B Coarse-grained	MFU41.6	3
Model Compression	Llama3-1b	Energy Consumed (kWh)0.0765	2

Showing 17 of 17 rows