BEEspoke Data

community

https://www.bees.org/

AI & ML interests

'an LLM is only as good as the dataset it was trained on' - Sun Tzu

Organization Card

About org cards

🐝📊💁

Collections 6

spaces 1

pinned

Sleeping

🐝

BeeCoder Demo

models 39

BEE-spoke-data/bert-plus-L8-v1.0-allNLI_matryoshka

BEE-spoke-data/bert-plus-L8-v1.0-synthSTSv3-4k

BEE-spoke-data/mega-encoder-small-16k-v1

Fill-Mask • Updated Mar 17 • 12 • 4

BEE-spoke-data/mega-small-embed-synthSTS-16384-v1

BEE-spoke-data/bert-plus-L8-v1.0-syntheticSTS-4k

BEE-spoke-data/smol_llama-220M-openhermes

Text Generation • Updated Mar 4 • 4.32k • 2

datasets 50

BEE-spoke-data/beeweb-5k

Viewer • Updated 34 minutes ago

BEE-spoke-data/fineweb-synergy-20k

Updated about 11 hours ago

BEE-spoke-data/FineMeme-100k

Viewer • Updated about 22 hours ago

BEE-spoke-data/SaunaWeb-50k

Viewer • Updated 1 day ago

BEE-spoke-data/UltraTextbooks-2.1-fw_mix

Viewer • Updated 4 days ago • 36 • 2

BEE-spoke-data/rp_books-en

Viewer • Updated 5 days ago • 6 • 1

BEE-spoke-data/gutenberg-en-v1-clean

Viewer • Updated 5 days ago • 36 • 2

BEE-spoke-data/napierone-epub-raw

Viewer • Updated 6 days ago • 21

BEE-spoke-data/napierone-pdf-raw

Viewer • Updated 6 days ago • 4

BEE-spoke-data/fineweb-1000_64k

Viewer • Updated 11 days ago

BEEspoke Data

AI & ML interests

Collections 6

BEE-spoke-data/smol_llama-101M-GQA

BEE-spoke-data/smol_llama-81M-tied

BEE-spoke-data/smol_llama-220M-GQA

BEE-spoke-data/verysmol_llama-v11-KIx2

BEE-spoke-data/smol_llama-220M-openhermes

BEE-spoke-data/smol_llama-220M-open_instruct

BEE-spoke-data/beecoder-220M-python

BEE-spoke-data/zephyr-220m-sft-full

spaces 1

BeeCoder Demo

models 39

BEE-spoke-data/mega-ar-350m-L3t-v0.08-ultraTBfw

BEE-spoke-data/Meta-Llama-3-8Bee

BEE-spoke-data/claude-tokenizer

BEE-spoke-data/TinyLlama-3T-1.1bee

BEE-spoke-data/bert-plus-L8-v1.0-allNLI_matryoshka

BEE-spoke-data/bert-plus-L8-v1.0-synthSTSv3-4k

BEE-spoke-data/mega-encoder-small-16k-v1

BEE-spoke-data/mega-small-embed-synthSTS-16384-v1

BEE-spoke-data/bert-plus-L8-v1.0-syntheticSTS-4k

BEE-spoke-data/smol_llama-220M-openhermes

datasets 50

BEE-spoke-data/beeweb-5k

BEE-spoke-data/fineweb-synergy-20k

BEE-spoke-data/FineMeme-100k

BEE-spoke-data/SaunaWeb-50k

BEE-spoke-data/UltraTextbooks-2.1-fw_mix

BEE-spoke-data/rp_books-en

BEE-spoke-data/gutenberg-en-v1-clean

BEE-spoke-data/napierone-epub-raw

BEE-spoke-data/napierone-pdf-raw

BEE-spoke-data/fineweb-1000_64k

AI & ML interests

Team members 6

Collections 6

spaces 1

BeeCoder Demo

models 39 Sort: Recently updated

datasets 50 Sort: Recently updated

models 39

datasets 50