Taskonomy: Disentangling Task Transfer Learning

Link
Abstract

Do visual tasks have a relationship, or are they unrelated? For instance, could having surface normals simplify estimating the depth of an image? Intuition answers these questions positively, implying existence of a structure among visual tasks. Knowing this structure has notable values; it is the concept underlying transfer learning and provides a principled way for identifying redundancies across tasks, e.g., to seamlessly reuse supervision among related tasks or solve many tasks in one system without piling up the complexity. We proposes a fully computational approach for modeling the structure of space of visual tasks. This is done via finding (first and higher-order) transfer learning dependencies across a dictionary of twenty six 2D, 2.5D, 3D, and semantic tasks in a latent space. The product is a computational taxonomic map for task transfer learning. We study the consequences of this structure, e.g. nontrivial emerged relationships, and exploit them to reduce the demand for labeled data. We provide a set of tools for computing and probing this taxonomical structure including a solver users can employ to find supervision policies for their use cases.

Synth

Problem:: 개별 시각 문제 해결 접근법은 많은 Labeled Data 필요 / 시각 문제들 간의 복잡한 관계 및 구조가 잘 알려져 있지 않음 / 사람의 직관과 신경망의 학습 방식이 다를 수 있음

Solution:: 다양한 26개 Task Dictionary 간 Transfer Learning으로 관계 매핑 / Task 간 전이 의존성을 나타내는 Taskonomy 그래프 생성 / 제한된 Supervision Budget 하에서 최적 전이 정책 탐색

Novelty:: 시각 문제 공간의 구조를 체계적으로 매핑한 최초의 완전 자동 계산 방식 / 이종 Task 간 전이 유사도 정규화를 위한 AHP(Analytic Hierarchy Process) 사용 / 최적 전이 정책 선택 문제를 BIP(Boolean Integer Program)로 공식화

Note:: 이런 생각을 선행 연구도 없이 떠올리고 실제로 실행에 옮긴 행동력이 부럽다 / 유사하게 Encoder 고정하고 Transfer시 성능 차이로 서로 다른 Task간의 의존성을 측정할 수 있을 듯

Summary

Motivation

Method

file-20250424193812439.png

Method 검증