SmolVLM - a HuggingFaceTB Collection

HuggingFaceTB 's Collections

SmolLM3 pretraining datasets

SmolLM3 evaluation datasets

Dolma LongAttn Graded

Reasoning datasets

SmolVLM2 📺 Smallest video LM ever 🤏🏻

📚 LLM pretraining datasets

🧩 SmolLM2 Intermediate Checkpoints

The Ultimate Collection of Code Classifiers

SmolVLM 256M & 500M

💻 Local SmolLMs

Instruct datasets

🌌 Cosmopedia

Find textbooks in FineWeb with a classifier

FineWeb clustering & synthetic generations

Other: Stanford, OpenStax, khanAcademy, wikihow...

FW generation prompts

Wikipedia Science topics

Wikipedia textbooks

SFT Experiments

Decay mixture experiments

SmolVLM

updated May 5, 2025

State-of-the-art compact VLMs for on-device applications: Base, Synthetic, and Instruct. Check our blog: https://huggingface.co/blog/smolvlm