
ATSS的核心思想:不要用固定的 IoU 閾值,而是根據(jù)每個(gè)物體的具體情況,動(dòng)態(tài)地選擇正負(fù)樣本。這樣,模型能更好地學(xué)習(xí)不同物體和場(chǎng)景的特征。AT...
在YOLOv6中,使用了任務(wù)對(duì)齊學(xué)習(xí)(TAL)方法來(lái)進(jìn)行預(yù)測(cè)框和真實(shí)框的匹配。這種方法綜合考慮了預(yù)測(cè)框與真實(shí)框的位置重疊度和分類得分,具體步驟如...
論文題目:Spatial Transformer Networks 這是一篇我在看文字識(shí)別時(shí)候看到的文章,STN的方法簡(jiǎn)單講就是學(xué)習(xí)一個(gè)仿射變換...
論文題目:NRTR: A No-Recurrence Sequence-to-Sequence Model For Scene Text Rec...
論文題目:SVTR: Scene Text Recognition with a Single Visual Model OCR文本識(shí)別旨在將自...
1.什么是Ohem Cross Entropy Loss OHEM 全稱為 “Online Hard Example Mining”,含義是在線...
最近在看ppocrv4相關(guān)的代碼,看到里面運(yùn)用了一種高效的backbone---PP-LCNet,目前這個(gè)模型有3個(gè)版本,V3網(wǎng)上沒(méi)有相關(guān)解析也...
論文:SEAFORMER: SQUEEZE-ENHANCED AXIAL TRANSFORMER FOR MOBILE SEMANTIC SEG...
在使用pytorch或paddlepaddle的時(shí)候會(huì)出現(xiàn)分布式多卡運(yùn)行卡住的問(wèn)題,下面是我的2種解決方案:1.pytorch多卡運(yùn)行卡住解決方...