Novinka

Dne: 10. května 2024

Článek o odhadování rotací kamery docenta Čadíka byl přijat na nejprestižnější konferenci v oboru

[img]

Vědecký článek docenta Martina Čadíka z výzkumné skupiny CPhoto@FIT, který vznikl ve spolupráci s kolegy z izraelské univerzity Bar Ilan, byl přijat na konferenci CVPR - Conference on Computer Vision and Pattern Recognition, která je hodnocena jako nejprestižnější v oblasti počítačového vidění.

Článek Estimating Extreme 3D Image Rotations using Cascaded Attention se zabývá odhadem rotace kamery z vizuální informace. To je jeden ze základních problémů počítačového vidění, který má řadu praktických aplikací. Mezi hlavní aplikace patří například navigace, rozšířená realita, autonomní řízení, rekonstrukce 3D objektů, lokalizace kamery, ale i syntéza nových pohledů na scénu či detekce deepfakes.

Tato úloha je velmi složitá, zvláště v případě, kdy mají snímky omezené nebo dokonce nepřekrývající se zorná pole. Odhad rotace kamery může být řešen pomocí vizuálních transformerů. Zatímco předchozí metody počítají 4D korelační objem (4DCV) kódující vztahy mezi snímky, autoři v článku navrhují využití křížové pozornosti (cross-attention) mezi aktivačními mapami, který vede na kvalitnější ekvivalent 4DCV. 

V článku dále představují kaskádovou techniku založenou na dekodéru pro iterativní zpřesňování křížové pozornosti a odhadu rotace. Tento přístup předčí současné nejmodernější metody odhadu extrémní rotace. Kód metody zpřístupňují autoři veřejnosti. 

Gratulujeme k velkému úspěchu!


Sdílet článek

Nahoru