ISTA-DASLab
/

Meta-Llama-3-8B-AQLM-2Bit-1x16

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Meta-Llama-3-8B-AQLM-2Bit-1x16

1 contributor

History: 6 commits

SpiridonSunRotator's picture

SpiridonSunRotator

Update README.md

2d9717e verified about 1 month ago

.gitattributes

1.52 kB

initial commit about 1 month ago
README.md

758 Bytes

Update README.md about 1 month ago
config.json

4.34 kB

Uploaded improved version of quantized model about 1 month ago
generation_config.json

126 Bytes

Uploaded Meta-Llama-3-8B with AQLM 1x16 quantization about 1 month ago
model.safetensors

4.08 GB
LFS

Uploaded improved version of quantized model about 1 month ago
special_tokens_map.json

73 Bytes

Uploaded Meta-Llama-3-8B with AQLM 1x16 quantization about 1 month ago
tokenizer.json

9.08 MB

Uploaded Meta-Llama-3-8B with AQLM 1x16 quantization about 1 month ago
tokenizer_config.json

50.6 kB

Uploaded Meta-Llama-3-8B with AQLM 1x16 quantization about 1 month ago