exllama
Llm Inference| Samlet rangering #1030
A more memory-efficient rewrite of the HF transformers implementation of Llama for use with quantized weights.
Rangering
#6 i Llm Inference
Pris
Data
Hva er exllama?
exllama er et AI-drevet llm inference-verktøy. A more memory-efficient rewrite of the HF transformers implementation of Llama for use with quantized weights.
Viktigste funksjoner
- AI-drevet automatisering
- Brukervennlig grensesnitt
- Skybasert tilgang
- Regelmessige oppdateringer
- Kundestøtte
Bruksområder
- Automatisering av repetitive oppgaver
- Forbedre produktiviteten
- Redusere manuelt arbeid
- Få AI-drevet innsikt
- Effektivisere arbeidsflyter
Priser for exllama
Gratisversjon: ja — exllama tilbyr en gratisplan.
Besøk nettstedet til exllama for alle detaljer om priser.
Vanlige spørsmål
Hva er exllama?
exllama er et AI-drevet verktøy i kategorien Llm Inference. A more memory-efficient rewrite of the HF transformers implementation of Llama for use with quantized weights.
Er exllama gratis?
Ja, exllama tilbyr et gratisnivå. Sjekk nettstedet deres for detaljer om hva som er inkludert i gratisabonnementet.
Hvilken kategori er exllama i?
exllama er kategorisert under Llm Inference på Top AI Ranked. Det er rangert #6 i denne kategorien basert på poengsystemet vårt.
Hva er alternativer til exllama?
Du finner lignende verktøy på kategorisiden vår for Llm Inference. Top AI Ranked lister opp flere alternativer som du kan sammenligne etter rangering, pris og funksjoner.
Alternativer til exllama
Andre gode verktøy i kategorien llm inference:
SGLang is a fast serving framework for large language models and vision language models.
A high-throughput and memory-efficient inference and serving engine for LLMs.
Nvidia Framework for LLM Inference
NVIDIA Framework for LLM Inference(Transitioned to TensorRT-LLM)
To speed up Long-context LLMs' inference, approximate and dynamic sparse calculate the attention, which reduces inferenc
A distributed multi-model LLM serving system with web UI and OpenAI-compatible RESTful APIs.