
ATSS的核心思想:不要用固定的 IoU 閾值,而是根據每個物體的具體情況,動態地選擇正負樣本。這樣,模型能更好地學習不同物體和場景的特征。AT...
在YOLOv6中,使用了任務對齊學習(TAL)方法來進行預測框和真實框的匹配。這種方法綜合考慮了預測框與真實框的位置重疊度和分類得分,具體步驟如...
論文題目:Spatial Transformer Networks 這是一篇我在看文字識別時候看到的文章,STN的方法簡單講就是學習一個仿射變換...
論文題目:NRTR: A No-Recurrence Sequence-to-Sequence Model For Scene Text Rec...
論文題目:SVTR: Scene Text Recognition with a Single Visual Model OCR文本識別旨在將自...
1.什么是Ohem Cross Entropy Loss OHEM 全稱為 “Online Hard Example Mining”,含義是在線...
最近在看ppocrv4相關的代碼,看到里面運用了一種高效的backbone---PP-LCNet,目前這個模型有3個版本,V3網上沒有相關解析也...
論文:SEAFORMER: SQUEEZE-ENHANCED AXIAL TRANSFORMER FOR MOBILE SEMANTIC SEG...
在使用pytorch或paddlepaddle的時候會出現分布式多卡運行卡住的問題,下面是我的2種解決方案:1.pytorch多卡運行卡住解決方...