exllama
Llm Inference| Samlet placering #1030
A more memory-efficient rewrite of the HF transformers implementation of Llama for use with quantized weights.
Placering
#6 i Llm Inference
Pris
Data
Hvad er exllama?
exllama er et AI-drevet llm inference-værktøj. A more memory-efficient rewrite of the HF transformers implementation of Llama for use with quantized weights.
Vigtigste funktioner
- AI-drevet automatisering
- Brugervenlig grænseflade
- Skybaseret adgang
- Regelmæssige opdateringer
- Kundesupport
Anvendelser
- Automatisering af gentagne opgaver
- Forbedre produktiviteten
- Reducere manuelt arbejde
- Få AI-drevet indsigt
- Strømline arbejdsgange
Priser for exllama
Gratis version: ja — exllama tilbyder en gratis plan.
Besøg exllama-websitet for alle detaljer om priser.
Ofte stillede spørgsmål
Hvad er exllama?
exllama er et AI-drevet værktøj i kategorien Llm Inference. A more memory-efficient rewrite of the HF transformers implementation of Llama for use with quantized weights.
Er exllama gratis?
Ja, exllama tilbyder et gratis niveau. Tjek deres websted for detaljer om, hvad der er inkluderet i det gratis abonnement.
Hvilken kategori er exllama i?
exllama er kategoriseret under Llm Inference på Top AI Ranked. Det er rangeret #6 i denne kategori baseret på vores pointsystem.
Hvad er alternativer til exllama?
Du kan finde lignende værktøjer på vores kategoriside for Llm Inference. Top AI Ranked viser flere alternativer, som du kan sammenligne efter rangering, pris og funktioner.
Alternativer til exllama
Andre gode værktøjer i kategorien llm inference:
SGLang is a fast serving framework for large language models and vision language models.
A high-throughput and memory-efficient inference and serving engine for LLMs.
Nvidia Framework for LLM Inference
NVIDIA Framework for LLM Inference(Transitioned to TensorRT-LLM)
To speed up Long-context LLMs' inference, approximate and dynamic sparse calculate the attention, which reduces inferenc
A distributed multi-model LLM serving system with web UI and OpenAI-compatible RESTful APIs.