省流:使用zip64進行解壓,文件數目太多windows默認zip16裝不下
我在使用THUCNews中文文本數據集時出現了問題,原數據集解壓后應該包含以下兩個文件夾:
其中THUCNews文件夾下有以新聞類別命名的子文件。官網下載的是一個1.56GB的zip壓縮包
而我用windows11默認解壓后出現了一個三字亂碼文件夾,這顯然是解壓錯誤的。然后使用7.zip進行解壓時彈出了一個警告,搜索后發現這是提示壓縮包文件數目太大了,普通的zip16只支持65536個文件的解壓,也就是2的16次方;而這玩意兒有多大呢。。。
?167萬個文件數目。因此偉大滴7z自動使用了zip64,將我從無能狂怒中帶了出來。