最近,需要抽提術語,已經從研發處獲取若干路徑下的資源文件,xaml格式,中英各一份(命名相同,文件夾不同)。現在需要把每個文件中的string抽提出來。
簡化一下,不考慮有中英文件不對應或者同一個文件中行數錯位的情況,準備通過如下步驟實現。
1. 遍歷zh文件夾下所有的文件,新建Excel表,將A1賦值為zh。
圖片發自簡書App
2.打開文件,找到每一行,用正則表達式讀取到特定字符串。
圖片發自簡書App
3.將某一個文件某一行的字符串賦予Ax,然后逐個文件遍歷。完成下所有文件遍歷和excel讀寫。
圖片發自簡書App
4.遍歷en文件夾下所有文件,將Excel的B1賦值為en。重復2,3。將讀取到的每一行賦予Bx,直至遍歷完成。
目前可能遇到的問題
1.Python是否支持xaml格式讀寫?可以考慮遍歷文件后將后綴強制修改成TXT,要驗證下是否會有亂碼。
圖片發自簡書App
2.如何對同一個xaml的zh和en進行匹配,保證不錯配?
3.如何對同一個key的zh和en的string進行匹配?保證不錯行?