有這么個需求,將textarea中的重復行去掉。結果將每行join(",")。
最開始拿到這個需求時,想當然的這么寫了:
var s ="a\r\na\r\naa\r\nc\r\nc\r\nc\r\n\r\nb\r\nb\r\n";
var o={},//記錄不重復的行
arr= s.split(/\r?\n/gi),//取到textarea值時IE中的回車是\r\n,!IE只是\n
i=arr.length,
result="";
while(i--){
if(arr[i] && (!o[arr[i]])) o[arr[i]]=1;
}
for (var k in o ){
if(result!="") result=result+",";
result+=k;
}
alert(result);
沒有問題,很常規的做法。后來總想是不是可以用正則去做這個事情,順便可以溫習一下正則,經反復測試,寫出了一個下面的代碼:
var s ="a\r\na\r\naa\r\nc\r\nc\r\nc\r\n\r\nb\r\nb\r\n";
var regResult =s.replace(/\r?\n/gi,",") // \r\n->,
.replace(/((\,[^\,]+)|(^[^\,]+))(?=((.*\1\,)|(.*\1$)))/gi,"") //去除重復
.replace(/^\,|\,$|\,(?=\,)/gi,"");//去掉多余的,
alert(regResult);
就這么個正則折騰了一上午,當然,字符串也是取了一個比較極端的情況,比如即有a又有aa (行內容包含的情況),3次出現的情況,首尾重復的情況。
去除重復的正則用了寬度斷言和反響引用。所謂寬度斷言就是可以判斷后面/前面的匹配,但是不占用匹配的位置,也就是不影響后面的匹配,他只是一種斷言,比如上面的(?=
reg),就是正向寬度斷言,能斷言后面的出現了之前匹配組內容。反向引用時指可以引用之前匹配的引用組,比如上面的去除重復中的正則\1 就反向應用了第一個匹配組((\,[^\,]+)|(^[^\,]+)) 匹配的內容。
當然,上面的正則肯定不是最優的,希望大家指點了。
可以參考
正則表達式30分鐘教程正則的寬度斷言
http://deerchao.net/tutorials/regex/regex.htm#lookaround負向寬度斷言&反向引用:
http://deerchao.net/tutorials/regex/regex.htm#negativelookaround