seq3中的一個oov處理方法

  • 單詞表只用15k的,但是有10oov相當于一個簡單的copy形式
  • 就是輸入到網絡之前將不在詞表中的詞替換成oov,然后decoder的時候將此事的oov替換回原來的詞
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 本文另兩篇系列 NLP的巨人肩膀(上) NLP的巨人肩膀(下) 3. 梯子的一級半 除了在word級別的embed...
    weizier閱讀 6,652評論 0 18
  • 轉載 序 文本摘要是自然語言處理中比較難的一個任務,別說是用機器來做文摘了,就連人類做文摘的時候都需要具備很強的語...
    城市中迷途小書童閱讀 527評論 0 2
  • 轉載 序 文本摘要是自然語言處理中比較難的一個任務,別說是用機器來做文摘了,就連人類做文摘的時候都需要具備很強的語...
    readilen閱讀 8,435評論 1 10
  • 官網 中文版本 好的網站 Content-type: text/htmlBASH Section: User ...
    不排版閱讀 4,433評論 0 5
  • 本文上兩篇系列 NLP的巨人肩膀(上) NLP的巨人肩膀(中) 4.6 Bidirectional Encoder...
    weizier閱讀 6,506評論 1 22