Board logo

标题: 过滤出EMAIL 地址 『已结』 [打印本页]

作者: uiopuiop     时间: 2009-5-14 01:45    标题: 过滤出EMAIL 地址 『已结』

需要从一个文本文件里过滤出EMAIL 地址,但碰到点问题。

(work@home you can visit www.test.com)并不是我想要的EMAIL地址。希望能用纯批处理来实现这个功能,谢谢!

C:\temp>findstr "[a-z0-9]@[a-z0-9]." test.txt
  work@home you can visit www.test.com
  afdf@test.com
          test2@test2.com
                zzd@tests.com
                badbu@test.com.cn


文本如下:(email 两边或许会有些空格或TAB,前N行有些乱七八糟的文字)
luan ti ba zao de wen zi
  work@home you can visit www.test.com
[tab]afdf@test.com
       [tab]   [] test2@test2.com [tab] [tab]
       [tab]    [tab]     zzd@tests.com [tab][tab]
           []     badbu@test.com.cn [tab]

[ Last edited by uiopuiop on 2009-5-17 at 10:25 ]
作者: yishanju     时间: 2009-5-14 04:40
用FR 才是王道

type a.txt|fr -ric:"[ \t]*([a-z_0-9]*@[a-z_0-9].[a-z]*)[ \t]*" -t:"\1"

没有测试过,代码可能不对

FR 下载http://baiy.cn/utils/fr/index.htm

[ Last edited by yishanju on 2009-5-14 at 04:50 ]
作者: uiopuiop     时间: 2009-5-14 11:24
纯批处理不能做吗?
作者: everest79     时间: 2009-5-14 15:09
CODE:  [Copy to clipboard]
//var a=WScript.Arguments;if (a.Length > 0) WScript.Echo(a(0).match(/\w+@\w+\.\w+/));
var a=WScript.Arguments;
if (a.Length > 0){
var f=new ActiveXObject("Scripting.FileSystemObject");
var u=f.OpenTextFile(a(0).replace(/\\/g,"\\\\"),1).ReadAll().match(/\w+@\w+\.\w+/g);
//WScript.Echo(u);
for (i=0;i<u.length;i++)WScript.Echo(u[i]);
}
cscript my.js 1.txt
作者: uiopuiop     时间: 2009-5-14 23:42
多谢各位,但是我还是希望能用纯批处理来实现这个功能,谢谢!
作者: everest79     时间: 2009-5-15 03:49
CODE:  [Copy to clipboard]
@echo off
for /f "delims=" %%a in (b.txt) do (
echo %%a|findstr "[a-z0-9]*@[a-z0-9]*\.[a-z0-9]*" >nul&&set/ac+=1&&call :replace "%%a" %%c%%
)
set new
pause
goto :eof

:replace
set x=0
set src=%~1
set tmp=%src:*@=%
call set src=%%src:%tmp%=%%
for %%i in (%src%) do set tmp=%%i%tmp%
for %%i in (%tmp%) do set/ax+=1,1/(1/x)2>nul&&echo %%i&&set dst=%%i
set newmail%~2=%dst%
goto :eof
纯批的,不容错
作者: uiopuiop     时间: 2009-5-15 07:26    标题: 楼上你好!

不容错?什么意思?

高手!果然管用,但我没看懂你是如何把  空格,TAB 都给去掉的?

set/ax+=1,1/(1/x)2  何意 ?

set new 这个变量什么地方冒出来的?

[ Last edited by uiopuiop on 2009-5-15 at 10:58 ]
作者: everest79     时间: 2009-5-16 06:21
是使用set替换字符串时的通配方法,将你原来的字符串自"@"符号分成两部分
例如
    []     badbu@test.com.cn [tab]
就分成了
    []     badbu

@test.com.cn [tab]
然后使用for按空格分割输出,第一个字符串,保留最后一个
第二个字符串保留第一个
set /a x+=1,1/(1/x)&&echo %%i就是用来判断是不是第一个

set new是显示以new打头的变量
这些变量是
set newmail%~2=%dst%
来定义的
作者: uiopuiop     时间: 2009-5-16 11:07


  Quote:
Originally posted by everest79 at 2009-5-16 06:21 AM:
是使用set替换字符串时的通配方法,将你原来的字符串自"@"符号分成两部分
例如
    []     badbu@test.com.cn [tab]
就分成了
    []     ba ...

多谢啊,学习了。。。

用空格分隔,但你又是如何吧TAB去掉的?
作者: everest79     时间: 2009-5-17 07:42
你可以关掉回量,只输入一行文本来仔细观察下
作者: yangfengoo     时间: 2009-5-17 09:15
学习了.讲得很好.可惜我不能评分..




欢迎光临 中国DOS联盟论坛 (http://cndos.fam.cx/forum/) Powered by Discuz! 2.5