MentorAI Evaluation Dashboard - original-aggregated

Per-Criteria Results

Human Spot-Check Agreement

Overall Agreement

-

Conversations Rated

-

Conversation	Persona	Rater	Agreement	Disagreements

Criterion Deep-Dive

Show failures for:

ID	Persona	Criterion	Evidence	Transcript

Per-Conversation Results

Filter by persona: Group by persona

ID	Persona	Critical	Quality Score	Status