Jiarui Yao's picture

Jiarui Yao

FlippyDora

·

AI & ML interests

None yet

Recent Activity

published a model about 13 hours ago

harnessRL/game-2d-cases

upvoted a paper 6 days ago

Flow-DPPO: Divergence Proximal Policy Optimization for Flow Matching Models

upvoted a paper 6 days ago

Rethinking the Divergence Regularization in LLM RL

View all activity

Organizations

Papers 9

arxiv:2601.10201

arxiv:2604.13346

arxiv:2603.13985

arxiv:2510.12693

models 65

FlippyDora/CorrectKLinRL

FlippyDora/qwen3-asr-1.7b-GGUF

2B • Updated Feb 11 • 984 • 2

FlippyDora/qwen3-asr-0.6b-GGUF

0.9B • Updated Feb 10 • 14 • 1

FlippyDora/anlp-hw2-outputs

Updated Oct 21, 2025

FlippyDora/all-MiniLM-L6-v2-imdb-sentiment

Text Classification • 22.7M • Updated Sep 23, 2025 • 1

FlippyDora/Qwen2_5_3B_inst_hrm_init

Text Generation • 4B • Updated Aug 5, 2025 • 4 • 1

FlippyDora/slimpajama-train-1280k

Updated May 10, 2025

FlippyDora/Qwen2.5-Math-1.5B-ppo_numina_math-step_120

2B • Updated Mar 17, 2025 • 5

FlippyDora/Qwen2.5-Math-1.5B-ppo_numina_math-step_100

2B • Updated Mar 17, 2025 • 3

FlippyDora/Qwen2.5-Math-1.5B-ppo_numina_math-step_80

2B • Updated Mar 17, 2025 • 3

datasets 117

FlippyDora/dapo-filter

Viewer • Updated Apr 21 • 9.45k • 31

FlippyDora/olympiad_bench

Viewer • Updated May 1, 2025 • 675 • 54

FlippyDora/minerva_math

Viewer • Updated May 1, 2025 • 272 • 13

FlippyDora/math500

Viewer • Updated May 1, 2025 • 500 • 28

FlippyDora/amc23

Viewer • Updated May 1, 2025 • 40 • 13

FlippyDora/aime24

Viewer • Updated May 1, 2025 • 30 • 16

FlippyDora/raft_train_numia_prompt_iter5_0_2000

Viewer • Updated Mar 11, 2025 • 6.75k • 14

FlippyDora/numia_prompt_reward_iter5_0-2000

Viewer • Updated Mar 11, 2025 • 2k • 9

FlippyDora/raft_train_numia_prompt_iter4_0_2000

Viewer • Updated Mar 11, 2025 • 6.86k • 21

FlippyDora/numia_prompt_reward_iter4_0-2000

Viewer • Updated Mar 11, 2025 • 2k • 11

View 117 datasets