Shengyuan Ding's picture

Shengyuan Ding

ChrisDing1105

·

https://github.com/SYuan03

SYuan03

AI & ML interests

None yet

Recent Activity

authored a paper about 22 hours ago

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

updated a collection 3 days ago

updated a collection 3 days ago

View all activity

Organizations

None yet

upvoted a paper 3 days ago

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

Paper • 2603.25040 • Published 5 days ago • 119

upvoted a paper 15 days ago

Visual-ERM: Reward Modeling for Visual Equivalence

Paper • 2603.13224 • Published 18 days ago • 21

upvoted 3 papers 18 days ago

Spatial-TTT: Streaming Visual-based Spatial Intelligence with Test-Time Training

Paper • 2603.12255 • Published 19 days ago • 90

EndoCoT: Scaling Endogenous Chain-of-Thought Reasoning in Diffusion Models

Paper • 2603.12252 • Published 19 days ago • 10

Trust Your Critic: Robust Reward Modeling and Reinforcement Learning for Faithful Image Editing and Generation

Paper • 2603.12247 • Published 19 days ago • 23

upvoted 2 papers about 2 months ago

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

Paper • 2602.12205 • Published Feb 12 • 81

UniReason 1.0: A Unified Reasoning Framework for World Knowledge Aligned Image Generation and Editing

Paper • 2602.02437 • Published Feb 2 • 80

upvoted 4 papers 3 months ago

SmartSearch: Process Reward-Guided Query Refinement for Search Agents

Paper • 2601.04888 • Published Jan 8 • 10

PaCoRe: Learning to Scale Test-Time Compute with Parallel Coordinated Reasoning

Paper • 2601.05593 • Published Jan 9 • 86

BabyVision: Visual Reasoning Beyond Language

Paper • 2601.06521 • Published Jan 10 • 200

DEER: Draft with Diffusion, Verify with Autoregressive Models

Paper • 2512.15176 • Published Dec 17, 2025 • 45

upvoted 4 papers 4 months ago

V-RGBX: Video Editing with Accurate Controls over Intrinsic Properties

Paper • 2512.11799 • Published Dec 12, 2025 • 30

Beyond Real: Imaginary Extension of Rotary Position Embeddings for Long-Context LLMs

Paper • 2512.07525 • Published Dec 8, 2025 • 60

ARM-Thinker: Reinforcing Multimodal Generative Reward Models with Agentic Tool Use and Visual Reasoning

Paper • 2512.05111 • Published Dec 4, 2025 • 50

ViSAudio: End-to-End Video-Driven Binaural Spatial Audio Generation

Paper • 2512.03036 • Published Dec 2, 2025 • 22

upvoted 4 papers 5 months ago

DeepEyesV2: Toward Agentic Multimodal Model

Paper • 2511.05271 • Published Nov 7, 2025 • 46

UniREditBench: A Unified Reasoning-based Image Editing Benchmark

Paper • 2511.01295 • Published Nov 3, 2025 • 39

Spatial-SSRL: Enhancing Spatial Understanding via Self-Supervised Reinforcement Learning

Paper • 2510.27606 • Published Oct 31, 2025 • 31

STAR-Bench: Probing Deep Spatio-Temporal Reasoning as Audio 4D Intelligence

Paper • 2510.24693 • Published Oct 28, 2025 • 19

upvoted a paper 6 months ago

InternSVG: Towards Unified SVG Tasks with Multimodal Large Language Models

Paper • 2510.11341 • Published Oct 13, 2025 • 35