EASE-DETR: Easing the Competition among Object Queries

Link
Abstract

This paper views the DETR’s non-duplicate detection ability as a competition result among object queries. Around each object, there are usually multiple queries, within which only a single one can win the chance to become the final detection. Such a competition is hard: while some competing queries initially have very close prediction scores, their leading query has to dramatically enlarge its score superiority after several decoder layers. To help the leading query stands out, this paper proposes EASEDETR, which eases the competition by introducing bias that favours the leading one. EASE-DETR is very simple: in every intermediate decoder layer, we identify the “leading / trailing” relationship between any two queries, and encode this binary relationship into the following decoder layer to amplify the superiority of the leading one. More concretely, the leading query is to be protected from mutual query suppression in the self-attention layer and encouraged to absorb more object features in the cross-attention layer, therefore accelerating to win. Experimental results show that EASE-DETR brings consistent and remarkable improvement to various DETRs.

Synth

Problem:: DETR 모델에서는 동일 객체를 탐지하기 위해 다수의 쿼리들이 경쟁하면서 학습 비효율이 발생/초기 단계에서 근소한 차이를 갖는 선두 쿼리가 후발 쿼리와의 점수 차이를 크게 벌리기는 어려움

Solution:: 선두 쿼리에 유리한 편향을 제공하는 EASE-DETR 기법을 제안함

Novelty:: 논문은 최초로 “쿼리 간의 경쟁”을 성능 저하의 근본 원인으로 명확히 규명하고 해결/쿼리 간 경쟁 관계를 명시적으로 Self-Attention과 Cross-Attention 단계 모두에서 활용

Note:: 디테일한 설명이 부족하고, 코드가 공개되지 않음/자기 자신과의 Relation에 대한 정의가 불명확해 오해의 소지가 있음/Multi Class의 경우 상황에 대한 설명이 부족함

Summary

Motivation

Method

file-20250314125103028.png

자기 자신, 즉 i=j에 대한 설명이 부족함. 이 부분이 중요한게, 이 경우 DsDc가 낮아지며 이는 자기 자신과의 Attention Weight를 낮춰 오히려 선두 그룹의 학습을 억제하기 때문 → 구현 코드가 존재하지 않아 확인 할 수 없지만, 자기 자신에 대한 값은 건드리지 않는것으로 추정

Method 검증

RD의 관계

file-20250314125214364.png

file-20250314125343509.png|500

file-20250314125452173.png|350
Baseline에 비해 경쟁 그룹들이 뒤쳐짐을 볼 수 있음