14 11

Claire Duval

abc-456

AI & ML interests

None yet

Recent Activity

liked a dataset about 13 hours ago

KakologArchives/KakologArchives

liked a dataset 2 days ago

DCAgent2/terminal_bench_2_GLM_4_6_stackexchange_overflow_sandboxes_32eps_65k_reasoning_Q53942cdc

liked a model 2 days ago

globcy/pi0_no_dac_no_planner_subset

View all activity

Organizations

None yet

liked a dataset about 13 hours ago

KakologArchives/KakologArchives

Updated 2 minutes ago • 814k • 32

liked a dataset 2 days ago

DCAgent2/terminal_bench_2_GLM_4_6_stackexchange_overflow_sandboxes_32eps_65k_reasoning_Q53942cdc

Viewer • Updated 2 days ago • 267 • 12

liked a model 2 days ago

globcy/pi0_no_dac_no_planner_subset

Robotics • Updated 2 days ago • 28

upvoted a paper 5 days ago

DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models

Paper • 2603.26164 • Published 18 days ago • 351

liked 2 models 6 days ago

rghosh8/arc-grpo-deepseek-llm-7b-chat-seed-42-G-16-merged

7B • Updated 6 days ago • 15

meta-llama/Llama-3.3-70B-Instruct

Text Generation • 71B • Updated Dec 21, 2024 • 449k • • 2.7k

liked a model 10 days ago

facebook/contriever

Updated Jan 19, 2022 • 7.37M • 78

liked a dataset 11 days ago

ankile/threading-dagger-sobol-v1-r13

Viewer • Updated 11 days ago • 13.5k • 49

upvoted 2 papers 13 days ago

Ghost-FWL: A Large-Scale Full-Waveform LiDAR Dataset for Ghost Detection and Removal

Paper • 2603.28224 • Published 15 days ago • 5

CARLA-Air: Fly Drones Inside a CARLA World -- A Unified Infrastructure for Air-Ground Embodied Intelligence

Paper • 2603.28032 • Published 15 days ago • 339

liked a model 14 days ago

zengxianyu/ssl-heatmap-v3-7-coco-glow-s12-dist-grpo

Updated 13 days ago

upvoted a paper 26 days ago

Demystifing Video Reasoning

Paper • 2603.16870 • Published 28 days ago • 368

upvoted a paper about 1 month ago

Bootstrapping Exploration with Group-Level Natural Language Feedback in Reinforcement Learning

Paper • 2603.04597 • Published Mar 4 • 210

liked a dataset about 1 month ago

LeeXiangNO1/DyNativeGaussian_sequence

Preview • Updated 21 days ago • 5.54k • 53

upvoted a paper about 1 month ago

Heterogeneous Agent Collaborative Reinforcement Learning

Paper • 2603.02604 • Published Mar 3 • 194

liked a model about 1 month ago

Nanbeige/Nanbeige4.1-3B

Text Generation • 4B • Updated 21 days ago • 352k • • 1.03k

upvoted 4 papers about 2 months ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

Paper • 2602.08354 • Published Feb 9 • 263

A Very Big Video Reasoning Suite

Paper • 2602.20159 • Published Feb 23 • 519

VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training

Paper • 2602.10693 • Published Feb 11 • 220

SQuTR: A Robustness Benchmark for Spoken Query to Text Retrieval under Acoustic Noise

Paper • 2602.12783 • Published Feb 13 • 216

Claire Duval

AI & ML interests

Recent Activity

Organizations

abc-456's activity