現象:
將perforce代碼庫遷移至SVN時log亂碼。
p42svn.pl在windows下運行至"-|"時會報錯,于是安裝了linux虛擬機,從虛擬linux中運行p42svn.pl生成dump文件,再傳至windows下用svnadmin load。可是在svn查看log時,中文卻是顯示亂碼。
解決過程:
最開始是懷疑perl對中文的支持,于是在網上查資料,了解到perl是用utf8字符流,看了《Perl對中文的處理問題》http://blog.chinaunix.net/u2/70049/showart_1225418.html才明白,于是修改p42svn.pl。
文件剛開始部份加上
use Encode;
將
$result{'log'}? = $change->{'desc'} ;
改成
$result{'log'}? = decode("GBK", $change->{'desc'} );
這時生成的dump文件卻無法load。
測試二, 用svnadmin dump出帶中文log的記錄,再load進版本庫是正常的。比較查看svnadmin與p42svn.pl生成的dump文件,發現log部分一樣,但是Prop-content-length、Content-length與log的V值不一樣。在網上游蕩了半天,看到一篇文章《PERL unicode》http://longer.spaces.eepw.com.cn/articles/article/item/48773才知道是perl取出的字符數而不是字節數,而svnadmin卻是要求字節數的。于是再次修改p42svn.pl
在
$result .= sprintf("V %d/n%s/n", length($val), $val);
前加上
Encode::_utf8_off($val);
在
my $ppty_len = length($ppty_txt) + 1;
前加上
Encode::_utf8_off($ppty_txt);
這樣就解決log亂碼的問題。