Patronus AI

Team

company

Verified

https://patronus.ai

patronusai

Activity Feed Request to join this org

AI & ML interests

LLM Evaluation

Recent Activity

DarshanDeshpande submitted a paper 2 days ago

Benchmarking Reward Hack Detection in Code Environments via Contrastive Analysis

DarshanDeshpande published a dataset 3 days ago

PatronusAI/trace-dataset

DarshanDeshpande updated a dataset 3 days ago

PatronusAI/trace-dataset

View all activity

Papers

Benchmarking Reward Hack Detection in Code Environments via Contrastive Analysis

MEMTRACK: Evaluating Long-Term Memory and State Tracking in Multi-Platform Dynamic Agent Environments

View all Papers

PatronusAI 's Papers 2

Submitted by

Darshan Deshpande

Benchmarking Reward Hack Detection in Code Environments via Contrastive Analysis

PatronusAI

Submitted by

Darshan Deshpande

MEMTRACK: Evaluating Long-Term Memory and State Tracking in Multi-Platform Dynamic Agent Environments

PatronusAI

2