TopAIRanked
Til hverdagsModellerKategorierGratis VerktøyStatistikk
KodingSkrivingVideoLydBildegenereringChatboterProduktivitetAI-AgenterAlle Kategorier
Hjem / Kategorier / Llm Evaluation:

Beste AI-verktøy for Llm Evaluation:

8 verktøy rangert etter fellesskapssignaler og data.

1
lm-evaluation-harness

A framework for few-shot evaluation of language models.

Gratis8 pt
2
lighteval

a lightweight LLM evaluation suite that Hugging Face has been using internally.

Gratis8 pt
3
simple-evals

Eval tools by OpenAI.

Gratis8 pt
4
OLMO-eval

a repository for evaluating open language models.

Gratis8 pt
5
HELM

Holistic Evaluation of Language Models (HELM), a framework to increase the transparency of language models.

Gratis8 pt
6
instruct-eval

This repository contains code to quantitatively evaluate instruction-tuned models such as Alpaca and Flan-T5 on held-out

Gratis8 pt
7
Giskard

Testing & evaluation library for LLM applications, in particular RAGs

Gratis8 pt
8
Ragas

a framework that helps you evaluate your Retrieval Augmented Generation (RAG) pipelines.

Gratis8 pt
TopAIRanked

Finn de Beste AI-Verktøyene. Sammenlign priser, funksjoner og fellesskapsvurderinger for over 1 300 AI-verktøy.

Bla gjennom

  • Alle Kategorier
  • AI-Modeller
  • Gratis Verktøy
  • Søk
  • Statistikk

Toppkategorier

  • Koding
  • Skriving
  • Video
  • Bildegenerering
  • AI-Agenter

Selskap

  • Om oss
  • Kontakt
  • Vilkår
  • Personvern

Rangeringer basert på offentlig tilgjengelige data inkludert GitHub-stjerner og fellesskapssignaler.

© 2025 TopAIRanked by WebLab LLC