Jiarui Yao's picture

Jiarui Yao

FlippyDora

·

AI & ML interests

None yet

Recent Activity

published a model about 16 hours ago

rb-dev/rubrics_train_data

upvoted a paper about 21 hours ago

Supervised Fine-Tuning versus Reinforcement Learning: A Study of Post-Training Methods for Large Language Models

submitted a paper about 21 hours ago

Supervised Fine-Tuning versus Reinforcement Learning: A Study of Post-Training Methods for Large Language Models

View all activity

Organizations

FlippyDora 's models 64

FlippyDora/gemma-2b-it_lora_r128_lr5e-4_dpo

Updated Oct 23, 2024 • 1

FlippyDora/gemma-2b-it_lora_r32_lr5e-4_dpo

Updated Oct 22, 2024

FlippyDora/gemma-2b-it_lora_r16_lr5e-4_dpo

Updated Oct 22, 2024 • 1

FlippyDora/gemma-2b-it_lr1e-5_ultrafeedback

3B • Updated Oct 16, 2024