11
1
2
3731
前幾天細讀GPT的paper,里面使用的基礎模型和BERT一樣都是Transformer,區別就在于GPT用的是單向Transformer,而B...
這兩天能一本正經胡說的語言模型GPT-2.0大火,官方OPENAI以模型太強大擔心被壞人使用為由,也只公布了117M的模型,是不到號稱的15億參...