Jim Lai

grimjim

AI & ML interests

Experimenting with 7B-9B parameter text completion models. Not all models are intended for direct use, but for educational and/or merge purposes.

Organizations

Posts 4

Post

1610

We explore extremely low-weight merger as an alternative to fine-tuning. Merge formula details here:
grimjim/kukulemon-v3-soul_mix-32k-7B

Post

1261

I propose "merge densification", a style of merger which attempts to transfer the benefits of a denser model to a base model. The model weight in this case is 0.02, which is atypically small for mergers, but high compared to the learning rate used during training. In this case, the expectation is more creative text-generation. More details below:
grimjim/kunoichi-lemon-royale-v3-32K-7B

View all posts

Collections 4

models 61

Jim Lai

AI & ML interests

Organizations

Posts 4

Collections 4

grimjim/kuno-kunoichi-v1-DPO-v2-SLERP-7B-GGUF

Lewdiculous/kuno-kunoichi-v1-DPO-v2-SLERP-7B-GGUF-IQ-Imatrix

grimjim/kuno-kunoichi-v1-DPO-v2-SLERP-7B-8.0bpw_h8_exl2

grimjim/kukulemon-7B-GGUF

grimjim/kuno-kunoichi-v1-DPO-v2-SLERP-7B

grimjim/kukulemon-7B

grimjim/kukulemon-spiked-9B

grimjim/kukulemon-32K-7B

models 61

grimjim/Llama-3-Luminurse-v0.1-OAS-8B-GGUF

grimjim/Llama-3-Luminurse-v0.1-OAS-8B

grimjim/kukulemon-v3-soul_mix-32k-7B

grimjim/kukulemon-v3-soul_mix-32k-7B-GGUF

grimjim/koboldai-holodeck-extended-32k-7B

grimjim/koboldai-erebus-extended-32k-7B

grimjim/llama-3-aaditya-OpenBioLLM-8B

grimjim/kunoichi-lemon-royale-v3-32K-7B

grimjim/kunoichi-lemon-royale-v3-32K-7B-GGUF

grimjim/wizard-elem-to-32k-7B

datasets 1

grimjim/adversarial-10-alpaca

Jim Lai

AI & ML interests

Organizations

Posts 4

Collections 4

models 61 Sort: Recently updated

datasets 1

models 61