
IP屬地:寧夏
transformer decoder里的K和V為什么要用encoder輸出的K和Vimage.pngIn "encoder-decoder a...
2049 統計最高分的節點數目[https://leetcode-cn.com/problems/count-nodes-with-the-hi...
attention mask如何使用 attention_mask List[int] 0-mask,1-attentionforward(,a...
快速加 快速冪 二分圖的最大匹配 一次A掉
雙向模型只在encoder,不在decoder(前向預測)嗎?類的繼承github頁面上傳只有25M類的寫法,其中繼承自父類的構造方法寫作 fo...
1.9.10號每日一題,好的優化時間養成的好習慣,使得沒有被暴力卡住 一個班級里有 n 個學生,編號為 0 到 n - 1 。每個學生會依次回答...
思想沒錯,缺點是沒有理解題意+數據結構模糊+沒有預處理+取模和去除多余數 給你一個整數數組 nums 。如果 nums 的一個子集中,所有元素的...
動態規劃,僅僅與上一狀態有關的,可以滾動數組 滾動數組時,一般生成一個新的數組,當作新數組,因為記憶數組需要在外部設置全局變量去記憶,占用大量內...
代碼寫的亂,更容易被卡 思路:模擬棧,先把乘除計算完(合成數字),再算加減(需要做個逆序)超出時間限制因為使用sum(op_stack),所以要...