TopAIRanked
Til hverdagenModellerKategorierGratis VærktøjerStatistik
KodningSkrivningVideoLydBilledgenereringChatbotsProduktivitetAI-AgenterAlle Kategorier
Hjem / Kategorier / Llm Evaluation:

Bedste AI-værktøjer til Llm Evaluation:

8 værktøjer placeret efter fællesskabssignaler og data.

1
lm-evaluation-harness

A framework for few-shot evaluation of language models.

Gratis8 pt
2
lighteval

a lightweight LLM evaluation suite that Hugging Face has been using internally.

Gratis8 pt
3
simple-evals

Eval tools by OpenAI.

Gratis8 pt
4
OLMO-eval

a repository for evaluating open language models.

Gratis8 pt
5
HELM

Holistic Evaluation of Language Models (HELM), a framework to increase the transparency of language models.

Gratis8 pt
6
instruct-eval

This repository contains code to quantitatively evaluate instruction-tuned models such as Alpaca and Flan-T5 on held-out

Gratis8 pt
7
Giskard

Testing & evaluation library for LLM applications, in particular RAGs

Gratis8 pt
8
Ragas

a framework that helps you evaluate your Retrieval Augmented Generation (RAG) pipelines.

Gratis8 pt
TopAIRanked

Find de Bedste AI-Værktøjer. Sammenlign priser, funktioner og fællesskabsvurderinger for over 1.300 AI-værktøjer.

Gennemse

  • Alle Kategorier
  • AI-Modeller
  • Gratis Værktøjer
  • Søg
  • Statistik

Topkategorier

  • Kodning
  • Skrivning
  • Video
  • Billedgenerering
  • AI-Agenter

Virksomhed

  • Om os
  • Kontakt
  • Vilkår
  • Privatliv

Rangeringer baseret på offentligt tilgængelige data inklusiv GitHub-stjerner og fællesskabssignaler.

© 2025 TopAIRanked by WebLab LLC