1 31 9

Xuanlang Dai

XuanlangDai

AI & ML interests

None yet

Recent Activity

upvoted a paper about 18 hours ago

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

upvoted a paper 3 days ago

MinerU-Diffusion: Rethinking Document OCR as Inverse Rendering via Diffusion Decoding

liked a dataset 3 days ago

internlm/WildClawBench

View all activity

Organizations

None yet

upvoted a paper about 18 hours ago

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

Paper • 2603.25040 • Published 2 days ago • 87

upvoted a paper 3 days ago

MinerU-Diffusion: Rethinking Document OCR as Inverse Rendering via Diffusion Decoding

Paper • 2603.22458 • Published 4 days ago • 123

liked a dataset 3 days ago

internlm/WildClawBench

Updated about 9 hours ago • 2.79k • 28

authored a paper 5 days ago

EndoCoT: Scaling Endogenous Chain-of-Thought Reasoning in Diffusion Models

Paper • 2603.12252 • Published 15 days ago • 10

liked a dataset 12 days ago

internlm/VC-RewardBench

Viewer • Updated 4 days ago • 2.67k • 1.85k • 6

liked a model 12 days ago

internlm/Visual-ERM

770k • Updated 4 days ago • 90 • 10

upvoted a paper 12 days ago

Visual-ERM: Reward Modeling for Visual Equivalence

Paper • 2603.13224 • Published 14 days ago • 21

upvoted a paper 15 days ago

EndoCoT: Scaling Endogenous Chain-of-Thought Reasoning in Diffusion Models

Paper • 2603.12252 • Published 15 days ago • 10

liked a dataset 15 days ago

internlm/EndoCoT-Data

Preview • Updated 10 days ago • 1.85k • 7

liked a model 15 days ago

internlm/EndoCoT

Image-to-Image • Updated 11 days ago • 14 • 10

upvoted a paper 17 days ago

Fish Audio S2 Technical Report

Paper • 2603.08823 • Published 18 days ago • 36

upvoted a paper 24 days ago

Beyond Language Modeling: An Exploration of Multimodal Pretraining

Paper • 2603.03276 • Published 24 days ago • 100

upvoted a paper about 2 months ago

Thinking in Frames: How Visual Context and Test-Time Scaling Empower Video Reasoning

Paper • 2601.21037 • Published Jan 28 • 15

commented a paper about 2 months ago

Thinking in Frames: How Visual Context and Test-Time Scaling Empower Video Reasoning

Paper • 2601.21037 • Published Jan 28 • 15 •

upvoted 2 papers about 2 months ago

DiffThinker: Towards Generative Multimodal Reasoning with Diffusion Models

Paper • 2512.24165 • Published Dec 30, 2025 • 52

AR-Omni: A Unified Autoregressive Model for Any-to-Any Generation

Paper • 2601.17761 • Published Jan 25 • 14

upvoted a paper 2 months ago

BabyVision: Visual Reasoning Beyond Language

Paper • 2601.06521 • Published Jan 10 • 200

upvoted a collection 3 months ago

TwinFlow

Collection

A collection of TwinFlow-accelerated diffusion models • 4 items • Updated 3 days ago • 6

liked a model 3 months ago

inclusionAI/TwinFlow-Z-Image-Turbo

Text-to-Image • Updated Dec 29, 2025 • 34 • 211

upvoted a paper 3 months ago

Qwen3-VL Technical Report

Paper • 2511.21631 • Published Nov 26, 2025 • 161

Xuanlang Dai

AI & ML interests

Recent Activity

Organizations

XuanlangDai's activity