亚洲人成电影网站,亚洲欧美自偷自拍另类视,久久亚洲色一区二区三区

MacTex的pkuthss配置

Seraphi — Tue, 28 Feb 2017 14:13:00 GMT

今天换了Macbook pro来写毕业论文�Q�发现有一大堆中文相关的问题导致编译错误。经�q�一晚上的研�IӞ��l�于解决。主要有以下要点�Q?br />
1. �׃��MacTex对CTex的支持�ƈ不如TexLive那么好，在用pkuthss 1.7.3模板写论文的时候，首先需要对pkuthss.cls文�g�q�行修改�Q?br />

需要将原来的\LoadClass[hyperref, cs4size, fntef, fancyhdr]{ctexbook}[2011/03/11]一行改为如下�Ş式：

\LoadClass[fontset = windowsold,cs4size,UTF8,fancyhdr,hyperref,fntef,openany]{ctexbook}[2011/03/11]

2.在进行上�q�改动后�Q�发现还是不行。提�C�simhei.ttf, simsong.ttc, simfang.ttf找不到。这个时候，需要将上述三种字体��链接到tex的目录下�?br />
具体�Ҏ��如下�Q?br />�Q?�Q�在tex对应的下列目录徏立Chinese文�g夹：/usr/local/texlive/2016/texmf-dist/fonts/truetype/
�Q?�Q�将SimHei SimSong Fangsong三种字体��链接到上述目录。这三种字体可以�?Library/Fonts/Microsoft中找刎ͼ�注意的是攑ֈ�tex下时�Q�文件名需要小写，黑体和仿宋后�~�名�ؓ.ttf�Q�宋体�ؓ.ttc
�Q?�Q�sudo texhash

3.再编译的时候发现已�l�可以了�Q�Yeah~~~

Seraphi 2017-02-28 22:13 发表评论

pulp配置步骤�Q�安装GLPK

Seraphi — Fri, 27 May 2016 06:25:00 GMT

I have successfully run your code after doing the following two steps:

Download GLPK from
http://sourceforge.net/projects/winglpk/files/latest/download (as mentioned by oyvind)
Unzip it into (for example) : C:\glpk_is_here\
Add GLPK binaries to your system path before running python C:\>set PATH=%PATH%;C:\glpk_is_here\glpk-4.55\w64
Using the same cmd window from (3), use python/ipython to run your code:
C:\>ipython your_code.py
See the results Out[4]: 2.0

Good luck.

Seraphi 2016-05-27 14:25 发表评论

转：WINDOWS搭徏Discuz

Seraphi — Mon, 11 Mar 2013 03:09:00 GMT

Windows7&IIS7.5部��vDiscuz全攻�?/a>

原脓�Q?a >http://www.cnblogs.com/ajunForNet/archive/2012/09/12/2682063.html

�l�长说在内网部��v一个论坛，�q�可难不倒我�Q�装个Discuz嘛�?br style="margin: 0px; padding: 0px;" />部��v环境��׃��台普通的PC�Q�四核i3�Q�Windows7。这��开搞了�?/p>

准备工作

�pȝ��是Windows 7 专业版，自带IIS7.5�Q�家庭版不带�Q�。IIS7开始带了FastCgi�Q�对PHP支持好了许多�Q�所以也不必装Apache啦�?br style="margin: 0px; padding: 0px;" />下蝲 PHP 5.4�?nbsp;MySQL 5.5 以及Discuz X2�?/p>

对于IIS7 FastCgi�Q�我们应当选择VC9�~�译的线�E�安全的版本�?/p>

安装PHP

解压PHP�Q�我�l�的路径是C:\PHP�Q�大伙儿随意
把php.ini-production改名为php.ini�Q�用于开发环境的话，��改那个development�Q?/p>

修改扩展路径

extension_dir = "./ext"

启用MySQL扩展�Q�即��L��分号�Q?/span>

extension=php_MySQL.dll

修改时区

date.timezone=Asia/Shanghai

完了可以��试在命令行中执行以下PHP�Q?/p>

cd C:\PHP
php -v

可以看到php的版本信息，如果把dll文�g不存在的扩展打开了的话，会有提示�?/p>

配置IIS

IIS�Ҏ��对付�Q�不�q�先得把��保�q�几��已�l�装上：

1、添加模块映��?/strong>
启动IIS��理器，�Ҏ��务器讄��“处理�E�序映射”�Q?#8221;��d��模块映射“�Q?br style="margin: 0px; padding: 0px;" />�Q�图�Q?br style="margin: 0px; padding: 0px;" />注意�Q�设�|�可执行文�g路径的时候，要选择exe�?/p>

2、添加index.php为默认文�?/strong>
�Ҏ��务器讄��“默认文档”�Q�添加index.php

3、创建新站点
接着在创��Z��个新的站点，�q�创��Z��个目录存放你的网站，C:\Forum
��L��名填你想要绑定的域名�Q�对于一台服务器上有多个�|�站的情况，域名几乎是必��ȝ��?br style="margin: 0px; padding: 0px;" />当然啦，内网的话�Q�就改hosts随便弄个上去吧�?/p>

4、设�|�程序池
��d��用程序池�Q�设�|�刚才创建的站点对应的程序池�Q�把.Net framework版本设成无托��代码�?/p>

重启IIS�Q�在�|�站目录下放一个index.php�Q�内容很��单：

讉K��|�站�Q�设�|�无误的话应该能看到PHP的系�l�信息�?/p>

安装MySQL

安装MySQL挺容易的�Q�按�?a style="margin: 0px; padding: 0px; color: #075db3;">Discuz�l�出的教�E?/a>��可以了�?br style="margin: 0px; padding: 0px;" />因�ؓ我下的是UTF8版本的Discuz�Q�所以在选择字符�~�码那一步选的UTF8�?/p>

至于�Ҏ��据库目录以及�U�d��那个dll�Q�看上去完全没那个必要，我也��没弄�?/p>

安装Discuz

最烦的都搞定了�Q�最后把安装包里upload里面的东�?/span>都复制到�|�站目录下，
讉K��|�站下的install目录��p��看到安装界面
剩下的不用说了吧···

得记得安装完了以后，�q�UCenter->全局->域名讄��->应用域名�Q�把论坛的域名给讑֥�了，
否则论坛首页��是�?00

Over.

Seraphi 2013-03-11 11:09 发表评论

Seraphi — Wed, 06 Mar 2013 02:38:00 GMT
nohup + 命��o + & 后台�q�行�E�序�Q�连接服务器�Ӟ��q�行�E�序�Q?img src ="http://www.tkk7.com/katsutou/aggbug/396113.html" width = "1" height = "1" />

Seraphi 2013-03-06 10:38 发表评论

转：latex安装

Seraphi — Sat, 16 Feb 2013 05:51:00 GMT
     摘要: LaTeX�Q?nbsp;LATEX�Q�音�?#8220;拉泰�?#8221;�Q�是一�U�基于TeX的排版系�l�，�?nbsp;��国计算机学�?nbsp;莱斯�?#183;��C��特（Leslie Lamport�Q�在20世纪80�q�代初期开发，利用�q�种格式�Q�即使��用者没有排版和�E�序设计的知识也可以充分发挥由TeX所提供的强大功能，能在几天�Q�甚臛_��时内生成很多具有书�c�质量的印刷品�?nbsp;你可以在...  阅读全文

Seraphi 2013-02-16 13:51 发表评论

�?python正则表达式基��

Seraphi — Mon, 11 Feb 2013 08:28:00 GMT

Python正则
初学Python�Q�对Python的文字处理能力有很深的印象，除了str对象自带的一些方法外�Q�就是正则表辑ּ��q�个强大的模块了。但是对于初学者来��_��要用好这个功能还是有炚w��?br />
�Q�我�׃��好长旉��才摸��Z��炚w��道。由于我记性不好，很容易就忘事�Q�所以还是写下来比较好一些，同时也可以加深印象，整理思�\�?br />
�׃��我是初学�Q�所以肯定会有些错误�Q�还望高手不吝赐教，指出我的错误�?br />
1 Python正则式的基本用法

Python的正则表辑ּ�的模块是‘re’,它的基本语法规则��是指定一个字�W�序列，比如你要在一个字�W�串s=’123abc456’中查扑֭��W�串’abc’,只要�q�样写：

>>> import re

>>> s='123abc456eabc789'

>>> re.findall(r’abc’,s)

�l�果��是�Q?br />
['abc', 'abc']

�q�里用到的函�?#8221;findall(rule , target [,flag] )” 是个比较直观的函敎ͼ��是在目标字�W�串中查扄��合规则的字符丌Ӏ�第一个参数是规则�Q�第二个参数是目标字�W�串�Q�后�?br />
�q�可以跟一个规则选项�Q�选项功能��在compile函数的说明中详细说明�Q�。返回结果结果是一个列表，中间存放的是�W�合规则的字�W�串。如果没有符合规则的字符串被扑ֈ��Q�就�q?br />
回一个空列表�?br />

��Z��么要用r’ ..‘字符�Ԍ��raw字符�Ԍ��Q�由于正则式的规则也是由一个字�W�串定义的，而在正则式中大量使用转义字符’/’�Q�如果不用raw字符�Ԍ��则在需要写一�?#8217;/’的地

方，你必��d��写成’//’,那么在要从目标字�W�串中匹配一�?#8217;/’的时候，你就得写�?�?#8217;/’成�ؓ’////’�Q�这当然很麻烦，也不直观�Q�所以一般都使用r’’来定义规则字�W?br />
丌Ӏ�当�Ӟ��某些情况下，可能不用raw字符串比较好�?br />

以上是个最��单的例子。当然实际中�q�么��单的用法几乎没有意义。�ؓ了实现复杂的规则查找�Q�re规定了若�q�语法规则。它们分��么几�c�：

功能字符�Q?nbsp;   ‘.’ ‘*’ ‘+’ ‘|’ ‘?’ ‘^’ ‘$’ ‘/’�{�，它们有特�D�的功能含义。特别是’/’字符�Q�它是�{义引导符��P��跟在它后面的字符一般有�Ҏ��的含义�?br />
规则分界�W�： ‘[‘ ‘]’ ‘�Q?#8217; ‘�Q?#8217; ‘{‘ ‘}’�{�，也就是几�U�括号了�?br />
预定义�{义字�W�集�Q?#8220;/d” “/w” “/s” �{�等�Q�它们是以字�W?#8217;/’开��_��后面接一个特定字�W�的形式�Q�用来指�C�Z��个预定义好的含义�?br />
其它�Ҏ��功能字符�Q?#8217;#’ ‘!’ ‘:’ ‘-‘�{�，它们只在特定的情况下表示�Ҏ��的含义，比如(?# …)��p��C�Z��个注释，里面的内容会被忽略�?br />

下面来一个一个的说明�q�些规则的含义，不过说明的顺序�ƈ不是按照上面的顺序来的，而是我认为由��入深，由基本到复杂的顺序来�~�排的。同时�ؓ了直观，在说明的�q�程中尽�?br />
多�D些例子以方便理解�?br />
1.1基本规则

‘[‘ ‘]’字符集合讑֮��W?br />
首先说明一下字�W�集合设定的�Ҏ��。由一�Ҏ��括号括�v来的字符�Q�表明一个字�W�集合，能够匚w��包含在其中的��L��一个字�W�。比如[abc123]�Q�表明字�W?#8217;a’ ‘b’ ‘c’ ‘1’

‘2’ ‘3’都符合它的要求。可以被匚w��?br />
�?#8217;[‘ ‘]’中还可以通过’-‘ 减号来指定一个字�W�集合的范围�Q�比如可以用[a-zA-Z]来指定所以英文字母的大小写，因�ؓ英文字母是按照从��到大的��序来排的。你不可�?br />
把大��的��序颠倒了�Q�比如写成[z-a]��׃��对了�?br />
如果�?#8217;[‘ ‘]’里面的开头写一�?#8216;^’ ��P��则表�C�取非，卛_��括号里的字符都不匚w��。如[^a-zA-Z]表明不匹配所有英文字母。但是如�?#8216;^’不在开��_��则它��׃��再是表示

取非�Q�而表�C�其本��n�Q�如[a-z^A-Z]表明匚w��所有的英文字母和字�W?#8217;^’�?br />

‘|’    或规�?br />
��两个规则�ƈ列�v来，�?#8216;|’�q�接�Q�表�C�只要满��_��中之一��可以匹配。比�?br />
[a-zA-Z]|[0-9]表示满��数字或字母就可以匚w��Q�这个规则等价于[a-zA-Z0-9]

注意�Q�关�?#8217;|’要注意两点：

�W�一�Q?nbsp;          它在’[‘ ‘]’之中不再表示或，而表�C�Z��本��n的字�W�。如果要�?#8217;[‘ ‘]’外面表示一�?#8217;|’字符�Q�必��ȝ��反斜杠引��|��?#8217;/|’ ;

�W�二�Q?nbsp;          它的有效范围是它两边的整条规则，比如‘dog|cat’匚w��的是‘dog’�?#8217;cat’�Q�而不�?#8217;g’�?#8217;c’。如果想限定它的有效范围�Q�必需使用一个无捕获�l?#8216;

(?: )’包�v来。比如要匚w��‘I have a dog’�?#8217;I have a cat’�Q�需要写成r’I have a (?:dog|cat)’�Q�而不能写成r’I have a dog|cat’

�?br />
>>> s = ‘I have a dog , I have a cat’

>>> re.findall( r’I have a (?:dog|cat)’ , s )

['I have a dog', 'I have a cat']                #正如我们所要的

下面再看看不用无捕获�l�会是什么后果：

>>> re.findall( r’I have a dog|cat’ , s )

['I have a dog', 'cat']                                   #它将’I have a dog’�?#8217;cat’当成两个规则�?br />
至于无捕��L��的��用，后面��仔�l�说明。这里先跌��?br />

‘.’    匚w��所有字�W?br />
匚w��除换行符’/n’外的所有字�W�。如果��用了’S’选项�Q�匹配包�?#8217;/n’的所有字�W��?br />
      例：

       >>> s=’123 /n456 /n789’

       >>> findall(r‘.+’,s)

       ['123', '456', '789']

       >>> re.findall(r‘.+’ , s , re.S)

       ['123/n456/n789']

‘^’�?#8217;$’匚w��字符串开头和�l�尾

注意’^’不能�?#8216;[ ]’中，否则含意��发生变化，具体��L��上面�?#8217;[‘ ‘]’说明。在多行模式下，它们可以匚w��每一行的行首和行��。具体请看后面compile函数说明�?#8217;M

’选项部分

‘/d’匚w��数字

�q�是一个以’/’开头的转义字符�Q?#8217;/d’表示匚w��一个数字，即等价于[0-9]

‘/D’匚w��非数�?br />
�q�个是上面的反集�Q�即匚w��一个非数字的字�W�，�{��h于[^0-9]。注意它们的大小写。下面我们还��看到Python的正则规则中很多转义字符的大��写形式�Q�代表互补的关系。这样很

好记�?br />

‘/w’匚w��字母和数�?br />
匚w��所有的英文字母和数字，即等价于[a-zA-Z0-9]�?br />
‘/W’匚w��非英文字母和数字

�?#8217;/w’的补集，�{��h于[^a-zA-Z0-9]�?br />

‘/s’匚w��间隔�W?br />
卛_��配空格符、制表符、回车符�{�表�C�分隔意义的字符�Q�它�{��h于[ /t/r/n/f/v]。（注意最前面有个�I�格)

‘/S’匚w��非间隔符

即间隔符的补集，�{��h于[^ /t/r/n/f/v]

‘/A’匚w��字符串开�?br />
匚w��字符串的开头。它�?#8217;^’的区别是�Q?#8217;/A’只匹配整个字�W�串的开��_��即��?#8217;M’模式下，它也不会匚w��其它行的很首�?br />
‘/Z’匚w��字符串结��?br />
匚w��字符串的�l�尾。它�?#8217;$’的区别是�Q?#8217;/Z’只匹配整个字�W�串的结��，即��?#8217;M’模式下，它也不会匚w��其它各行的行��?br />
例：

>>> s= '12 34/n56 78/n90'

>>> re.findall( r'^/d+' , s , re.M )          #匚w��位于行首的数�?br />
['12', '56', '90']

>>> re.findall( r’/A/d+’, s , re.M )        #匚w��位于字符串开头的数字

['12']

>>> re.findall( r'/d+$' , s , re.M )          #匚w��位于行尾的数�?br />
['34', '78', '90']

>>> re.findall( r’/d+/Z’ , s , re.M )        #匚w��位于字符串尾的数�?br />
['90']

‘/b’匚w��单词边界

它匹配一个单词的边界�Q�比如空格等�Q�不�q�它是一�?#8216;0’长度字符�Q�它匚w��完的字符串不会包括那个分界的字符。而如果用’/s’来匹配的话，则匹配出的字�W�串中会包含那个

分界�W��?br />
例：

>>> s = 'abc abcde bc bcd'

>>> re.findall( r’/bbc/b’ , s )         #匚w��一个单独的单词‘bc’ �Q�而当它是其它单词的一部分的时候不匚w��

['bc']                                           �Q�只扑ֈ�了那个单独的’bc’

>>> re.findall( r’/sbc/s’ , s )          �Q�匹配一个单独的单词‘bc’

[' bc ']                                         #只找到那个单独的’bc’�Q�不�q�注意前后有两个�I�格�Q�可能有点看不清�?br />
‘/B’匚w��非边�?br />
�?#8217;/b’相反�Q�它只匹配非边界的字�W�。它同样是个0长度字符�?br />
接上例：

>>> re.findall( r’/Bbc/w+’ , s )     #匚w��包含’bc’但不�?#8217;bc’为开头的单词

['bcde']                                       #成功匚w��?#8217;abcde’中的’bcde’�Q�而没有匹�?#8217;bcd’

‘(?:)’无捕��L��

当你要将一部分规则作�ؓ一个整体对它进行某些操作，比如指定光��复次数时�Q�你需要将�q�部分规则用’(?:’ ‘)’把它包围��h��Q�而不能仅仅只用一�Ҏ��P��那样��得到绝�?br />
��Z�h意料的结果�?br />
例：匚w��字符串中重复�?#8217;ab’

>>> s=’ababab abbabb aabaab’

>>> re.findall( r’/b(?:ab)+/b’ , s )

['ababab']

如果仅��用一�Ҏ��P��看看会是什么结果：

>>> re.findall( r’/b(ab)+/b’ , s )

['ab']

�q�是因�ؓ如果只��用一�Ҏ��P��那么�q�就成�ؓ了一个组(group)。组的��用比较复杂，��在后面详细讲解�?br />

‘(?# )’注释

Python允许你在正则表达式中写入注释�Q�在’(?#’ ‘)’之间的内容将被忽略�?br />

(?iLmsux) �~�译选项指定

Python的正则式可以指定一些选项�Q�这个选项可以写在findall或compile的参��C��Q�也可以写在正则式里�Q�成为正则式的一部分。这在某些情况下会便利一些。具体的选项含义�?br />
看后面的compile函数的说明�?br />
此处�~�译选项’i’�{��h于IGNORECASE �Q�L �{��h�?LOCAL �Q�m �{��h�?MULTILINE�Q�s�{��h�?DOTALL �Q�u�{��h于UNICODE �Q?x �{��h�?VERBOSE�?br />
��h��意它们的大小写。在使用时可以只指定一部分�Q�比如只指定忽略大小写，可写�?#8216;(?i)’�Q�要同时忽略大小写�ƈ使用多行模式�Q�可以写�?#8216;(?im)’�?br />
另外要注意选项的有效范围是整条规则�Q�即写在规则的�Q何地方，选项都会对全部整条正则式有效�?br />

1.2重复

正则式需要匹配不定长的字�W�串�Q�那��׃��定需要表�C�重复的指示�W�。Python的正则式表示重复的功能很丰富灉|��。重复规则的一般的形式是在一条字�W�规则后面紧跟一个表�C�重�?br />
�ơ数的规则，已表明需要重复前面的规则一定的�ơ数。重复规则有�Q?br />
‘*’   0或多�ơ匹�?br />
表示匚w��前面的规�?�ơ或多次�?br />
‘+’   1�ơ或多次匚w��

表示匚w��前面的规则至��?�ơ，可以多次匚w��

例：匚w��以下字符串中的前一部分是字母，后一部分是数字或没有的变量名�?br />
>>> s = ‘ aaa bbb111 cc22cc 33dd ‘

>>> re.findall( r’/b[a-z]+/d*/b’ , s )             #必须臛_��1个字母开��_��以连�l�数字结��或没有数字

['aaa', 'bbb111']

注意上例中规则前后加了表�C�单词边界的’/b’指示�W�，如果不加的话�l�果��׃��变成�Q?br />
>>> re.findall( r’[a-z]+/d*’ , s )

['aaa', 'bbb111', 'cc22', 'cc', 'dd']    #把单词给拆开�?br />
大多数情况下�q�不是我们期望的�l�果�?br />

‘?’   0�?�ơ匹�?br />
只匹配前面的规则0�ơ或1�ơ�?br />
例，匚w��一个数字，�q�个数字可以是一个整敎ͼ�也可以是一个科学计数法记录的数字，比如123�?0e3都是正确的数字�?br />
>>> s = ‘ 123 10e3 20e4e4 30ee5 ‘

>>> re.findall( r’ /b/d+[eE]?/d*/b’ , s )

['123', '10e3']

它正��匹配了123�?0e3,正是我们期望的。注意前后的’/b’的��用，否则��得��C��期望的结果�?br />

1.2.1 �_��匚w��和最��匹�?br />
Python正则式还可以�_��指定匚w��的次数。指定的方式�?br />
‘{m}’      �_��匚w��m��?br />
‘{m,n}’   匚w��最��m�ơ，最多n�ơ�?n>m)

如果你只��x��定一个最��次数或只指定一个最多次敎ͼ�你可以把另外一个参数空��h��。比如你��x��定最��?�ơ，可以写成{3,}�Q�注意那个逗号�Q�，同样如果只想指定最大�ؓ5�ơ，�?br />
以写成{�Q?}�Q�也可以写成{0,5}�?br />
例寻找下面字�W�串�?br />
a�Q?位数

b: 2位数�?位数

c: 5位数以上的数

d: 4位数以下的数

>>> s= ‘ 1 22 333 4444 55555 666666 ‘

>>> re.findall( r’/b/d{3}/b’ , s )            # a�Q?位数

['333']

>>> re.findall( r’/b/d{2,4}/b’ , s )         # b: 2位数�?位数

['22', '333', '4444']

>>> re.findall( r’/b/d{5,}/b’, s )           # c: 5位数以上的数

['55555', '666666']

>>> re.findall( r’/b/d{1,4}/b’ , s )         # 4位数以下的数

['1', '22', '333', '4444']

‘*?’ ‘+?’ ‘??’最��匹�?br />
‘*’ ‘+’ ‘?’通常都是��可能多的匹配字�W�。有时候我们希望它��可能少的匹配。比如一个c语言的注�?#8216;/* part 1 */ /* part 2 */’�Q�如果��用最大规则：

>>> s =r ‘/* part 1 */ code /* part 2 */’

>>> re.findall( r’//*.*/*/’ , s )

[‘/* part 1 */ code /* part 2 */’]

�l�果把整个字�W�串都包括进��M��。如果把规则改写�?br />
>>> re.findall( r’//*.*?/*/’ , s )                    #�?后面加上?�Q�表�C�尽可能��的匚w��

['/* part 1 */', '/* part 2 */']

�l�果正确的匹配出了注释里的内�?br />

1.3   前向界定与后向界�?br />
有时候需要匹配一个跟在特定内容后面的或者在特定内容前面的字�W�串�Q�Python提供一个简便的前向界定和后向界定功能，或者叫前导指定和跟从指定功能。它们是�Q?br />
‘(?<=…)’前向界定

括号�?#8217;…’代表你希望匹配的字符串的前面应该出现的字�W�串�?br />
‘(?=…)’ 后向界定

括号中的’…’代表你希望匹配的字符串后面应该出现的字符丌Ӏ?br />
例：你希望找出c语言的注释中的内容，它们是包含在’/*’�?#8217;*/’之间�Q�不�q�你�q�不希望匚w��的结果把’/*’�?#8217;*/’也包括进来，那么你可以这��L��Q?br />
>>> s=r’/* comment 1 */ code /* comment 2 */’

>>> re.findall( r’(?<=//*).+?(?=/*/)’ , s )

[' comment 1 ', ' comment 2 ']

注意�q�里我们仍然使用了最��匹配，以避免把整个字符串给匚w��q�去了�?br />
要注意的是，前向界定括号中的表达式必��L��常��|��也即你不可以在前向界定的括号里写正则式。比如你如果在下面的字符串中��x��到被字母夹在中间的数字，你不可以用前向界

定：

例：

>>> s = ‘aaa111aaa , bbb222 , 333ccc ‘

>>> re.findall( r’(?<=[a-z]+)/d+(?=[a-z]+)' , s )          #错误的用�?br />
它会�l�出一个错误信息：

error: look-behind requires fixed-width pattern

不过如果你只要找出后面接着有字母的数字�Q�你可以在后向界定写正则式：

>>> re.findall( r’/d+(?=[a-z]+)’, s )

['111', '333']

如果你一定要匚w��包夹在字母中间的数字�Q�你可以使用�l�（group�Q�的方式

>>> re.findall (r'[a-z]+(/d+)[a-z]+' , s )

['111']

�l�的使用��在后面详细讲解�?br />

除了前向界定前向界定和后向界定外�Q�还有前向非界定和后向非界定�Q�它的写法�ؓ�Q?br />
‘(?
只有当你希望的字�W�串前面不是’…’的内�Ҏ��才匹�?br />
‘(?!...)’后向非界�?br />
只有当你希望的字�W�串后面不跟着’…’内容时才匚w��?br />
接上例，希望匚w��后面不跟着字母的数�?br />
>>> re.findall( r’/d+(?!/w+)’ , s )

['222']

注意�q�里我们使用�?w而不是像上面那样用[a-z]�Q�因为如果这样写的话�Q�结果会是：

>>> re.findall( r’/d+(?![a-z]+)’ , s )

['11', '222', '33']

�q�和我们期望的似乎有点不一栗��它的原因，是因�?#8217;111’�?#8217;222’中的前两个数字也是满��个要求的。因此可看出�Q�正则式的��用还是要相当��心的，因�ؓ我开始就是这�?br />
写的�Q�看到结果后才明白过来。不�q�Python试验��h��很方便，�q�也是脚本语�a�的一大优点，可以一步一步的试验�Q�快速得到结果，而不用经�q�烦琐的�~�译、链接过�E�。也因此学习

Python��p��多试�Q�跌跌撞撞的走过来，虽然曲折�Q�却也很有乐��?br />

1.4�l�的基本知识

上面我们已经看过了Python的正则式的很多基本用法。不�q�如果仅仅是上面那些规则的话�Q�还是有很多情况下会非常�ȝ��Q�比如上面在讲前向界定和后向界定�Ӟ��取夹在字母中�?br />
的数字的例子。用前面讲过的规则都很难辑ֈ�目的�Q�但是用了组以后��很��单了�?br />
‘(‘’)’       无命名组

最基本的组是由一对圆括号括�v来的正则式。比如上面匹配包夹在字母中间的数字的例子中��用的(/d+)�Q�我们再回顾一下这个例子：

>>> s = ‘aaa111aaa , bbb222 , 333ccc ‘

>>> re.findall (r'[a-z]+(/d+)[a-z]+' , s )

['111']

可以看到findall函数只返回了包含�?#8217;()’中的内容�Q�而虽然前面和后面的内定w��匚w��成功了，却�ƈ不包含在�l�果中�?br />

除了最基本的�Ş式外�Q�我们还可以�l�组起个名字�Q�它的�Ş式是

‘(?P…)’命名�l?br />
‘(?P’代表�q�是一个Python的语法扩�?#8217;<…>’里面是你�l�这个组��L��名字�Q�比如你可以�l�一个全部由数字�l�成的组叫做’num’�Q�它的�Ş式就�?#8217;(?P/d+)’。�v了名字之

后，我们��可以在后面的正则式中通过名字调用�q�个�l�，它的形式�?br />
‘(?P=name)’调用已匹配的命名�l?br />
要注意，再次调用的这个组是已被匹配的�l�，也就是说它里面的内容是和前面命名�l�里的内�Ҏ��一��L��?br />
我们可以看更多的例子�Q�请注意下面�q�个字符串各子串的特炏V�?br />
>>> s='aaa111aaa,bbb222,333ccc,444ddd444,555eee666,fff777ggg'

我们看看下面的正则式会返回什么样的结果：

>>> re.findall( r'([a-z]+)/d+([a-z]+)' , s )             #扑և�中间�Ҏ��数字的字�?br />
[('aaa', 'aaa'), ('fff', 'ggg')]

>>> re.findall( r '(?P[a-z]+)/d+(?P=g1)' , s ) #扑և�被中间夹有数字的前后同样的字�?br />
['aaa']

>>> re.findall( r'[a-z]+(/d+)([a-z]+)' , s )             #扑և�前面有字母引��|��中间是数字，后面是字母的字符串中的中间的数字和后面的字母

[('111', 'aaa'), ('777', 'ggg')]

我们可以通过命名�l�的名字在后面调用已匚w��的命名组�Q�不�q�名字也不是必需的�?br />
‘/number’             通过序号调用已匹配的�l?br />
正则式中的每个组都有一个序��P��序号是按�l�从左到叻I��?开始的数字�Q�你可以通过下面的�Ş式来调用已匹配的�l?br />
比如上面扑և�被中间夹有数字的前后同样的字母的例子�Q�也可以写成�Q?br />
>>> re.findall( r’([a-z]+)/d+/1’ , s )

['aaa']

�l�果是一��L��?br />
我们再看一个例�?br />
>>> s='111aaa222aaa111 , 333bbb444bb33'

>>> re.findall( r'(/d+)([a-z]+)(/d+)(/2)(/1)' , s )           #扑և�完全对称的数字－字母�Q�数字－字母�Q�数字中的数字和字母

[('111', 'aaa', '222', 'aaa', '111')]

Python2.4以后的re模块�Q�还加入了一个新的条件匹配功�?br />
‘(?(id/name)yes-pattern|no-pattern)’ 判断指定�l�是否已匚w��Q�执行相应的规则

�q�个规则的含义是�Q�如果id/name指定的组在前面匹配成功了�Q�则执行yes-pattern的正则式�Q�否则执行no-pattern的正则式�?br />
举个例子�Q�比如要匚w��一些�Ş如usr@mail的邮��地址�Q�不�q�有的写�?lt; usr@mail >即用一�?lt;>括�v来，有点则没有，要匹配这两种情况�Q�可以这样写

>>> s=' usr2@maill2'

>>> re.findall( r'(<)?/s*(/w+@/w+)/s*(?(1)>)' , s )

[('<', 'usr1@mail1'), ('', 'usr2@maill2')]

不过如果目标字符串如�?br />
>>> s=' usr2@maill2 < usr5@mail5 '

而你惛_��到要么由一�?lt;>包围��h��的一个邮件地址�Q�要么得��C��个没有被<>包围��h��的地址�Q�但不想得到一�?lt;>中间包围的多个地址或不完整�?lt;>中的地址�Q�那么��用这个式子�ƈ

不能得到你想要的�l�果

>>> re.findall( r'(<)?/s*(/w+@/w+)/s*(?(1)>)' , s )

[('<', 'usr1@mail1'), ('', 'usr2@maill2'), ('', 'usr3@mail3'), ('', 'usr4@mail4'), ('', 'usr5@mail5')]

它仍然找��C��所有的邮�g地址�?br />
惌��实现�q�个功能�Q�单�U�的使用findall有点吃力�Q�需要��用其它的一些函敎ͼ�比如match或search函数�Q�再配合一些控制功能。这部分的内容将在下面详�l�讲解�?br />

��结�Q�以上基本上讲述了Python正则式的语法规则。虽然大部分语法规则看上去都很简单，可是�E�不注意�Q�仍然会得到与期望大相径庭的�l�果�Q�所以要写好正则式，需要仔�l�的�?br />
会正则式规则的含义后不同规则之间�l�微的差别�?br />
详细的了解了规则后，再配合后面就要介�l�的功能函数�Q�就能最大的发挥正则式的威力了�?br />

2 re模块的基本函�?br />
在上面的说明中，我们已经对re模块的基本函�?#8216;findall’很熟悉了。当然如果光有findall的话�Q�很多功能是不能实现的。下面开始介�l�一下re模块其它的常用基本函数。灵�z?br />
搭配使用�q�些函数�Q�才能充分发挥Python正则式的强大功能�?br />
首先�q�是说下老熟人findall函数�?br />
findall(rule , target [,flag] )

在目标字�W�串中查扄��合规则的字符丌Ӏ?br />
�W�一个参数是规则�Q�第二个参数是目标字�W�串�Q�后面还可以跟一个规则选项�Q�选项功能��在compile函数的说明中详细说明�Q��?br />
�q�回�l�果�l�果是一个列表，中间存放的是�W�合规则的字�W�串。如果没有符合规则的字符串被扑ֈ��Q�就�q�回一个空列表�?br />
2.1使用compile加�?br />
compile( rule [,flag] )

��正则规则编译成一个Pattern对象�Q�以供接下来使用�?br />
�W�一个参数是规则式，�W�二个参数是规则选项�?br />
�q�回一个Pattern对象

直接使用findall ( rule , target )的方式来匚w��字符�Ԍ��一�ơ两�ơ没什么，如果是多�ơ��用的话，�׃��正则引擎每次都要把规则解释一遍，而规则的解释又是相当�Ҏ��间的�Q?br />
所以这��L��效率��很低了。如果要多次使用同一规则来进行匹配的话，可以使用re.compile函数来将规则预编译，使用�~�译�q�返回的Regular Expression Object或叫做Pattern�?br />
象来�q�行查找�?br />
�?br />
>>> s='111,222,aaa,bbb,ccc333,444ddd'

>>> rule=r’/b/d+/b’

>>> compiled_rule=re.compile(rule)

>>> compiled_rule.findall(s)

['111', '222']

可见使用compile�q�的规则使用和未�~�译的��用很�怼�。compile函数�q�可以指定一些规则标志，来指定一些特�D�选项。多个选项之间�?#8217;|’�Q�位或）�q�接��h��?br />
I      IGNORECASE 忽略大小写区别�?br />

L   LOCAL 字符集本地化。这个功能是��Z��支持多语�a�版本的字�W�集使用环境的，比如在�{义符/w�Q�在英文环境下，它代表[a-zA-Z0-9]�Q�即所以英文字�W�和数字。如果在一个法

语环境下使用�Q�缺省设�|�下�Q�不能匹�?é"�?ç"。加上这L选项和就可以匚w��了。不�q�这个对于中文环境似乎没有什么用�Q�它仍然不能匚w��中文字符�?br />

M    MULTILINE 多行匚w��。在�q�个模式�?#8217;^’(代表字符串开�?�?#8217;$’(代表字符串结��?��能够匹配多行的情况�Q�成��首和行尾标记。比�?br />
>>> s=’123 456/n789 012/n345 678’

>>> rc=re.compile(r’^/d+’)    #匚w��一个位于开头的数字�Q�没有��用M选项

>>> rc.findall(s)

['123']             #�l�果只能扑ֈ�位于�W�一个行首的’123’

>>> rcm=re.compile(r’^/d+’,re.M)       #使用M选项

>>> rcm.findall(s)

['123', '789', '345'] #扑ֈ�了三个行首的数字

同样�Q�对�?#8217;$’来说�Q�没有��用M选项�Q�它��匹配最后一个行��数字�Q�即’678’�Q�加上以后，��p��匚w��三个行尾的数�?56 012�?78�?

>>> rc=re.compile(r’/d+$’)

>>> rcm=re.compile(r’/d+$’,re.M)

>>> rc.findall(s)

['678']

>>> rcm.findall(s)

['456', '012', '678']

S     DOTALL       ‘.’号将匚w��所有的字符。缺省情况下’.’匚w��除换行符’/n’外的所有字�W�，使用�q�一选项以后�Q?#8217;.’��p��匚w��包括’/n’的�Q何字�W�了�?br />

U   UNICODE       /w,/W,/b,/B,/d,/D,/s�?S都将使用Unicode�?br />

X     VERBOSE     �q�个选项忽略规则表达式中的空白，�q�允�怋��?#8217;#’来引��g��个注释。这样可以让你把规则写得更美观些。比如你可以把规�?br />>>> rc = re.compile(r"/d+|[a-zA-Z]+")       #匚w��一个数字或者单�?br />
使用X选项写成�Q?br />>>> rc = re.compile(r""" # start a rule/d+                   # number| [a-zA-Z]+           # word""", re.VERBOSE)在这个模式下�Q�如果你惛_��配一个空��|��你必��?br />
�?/ '的�Ş式（'/'后面跟一个空��|��

2.2 match与search

match( rule , targetString [,flag] )

search( rule , targetString [,flag] )

�Q�注�Q�re的match与search函数同compile�q�的Pattern对象的match与search函数的参数是不一��L��。Pattern对象的match与search函数更�ؓ强大�Q�是真正最常用的函敎ͼ�

按照规则在目标字�W�串中进行匹配�?br />
�W�一个参数是正则规则�Q�第二个是目标字�W�串�Q�第三个是选项�Q�同compile函数的选项�Q?br />
�q�回�Q�若成功�q�回一个Match对象�Q�失败无�q�回

findall虽然很直观，但是在进行更复杂的操作时�Q�就有些力不从心了。此时更多的使用的是match和search函数。他们的参数和findall是一��L��Q�都是：

match( rule , targetString [,flag] )

search( rule , targetString [,flag] )

不过它们的返回不是一个简单的字符串列表，而是一个MatchObject�Q�如果匹配成功的话）.。通过操作�q�个matchObject�Q�我们可以得到更多的信息�?br />
需要注意的是，如果匚w��不成功，它们则返回一个NoneType。所以在对匹配完的结果进行操作之前，你必需先判断一下是否匹配成功了�Q�比如：

>>> m=re.match( rule , target )

>>> if m:                       #必需先判断是否成�?br />
        doSomethin

�q�两个函数唯一的区别是�Q�match从字�W�串的开头开始匹配，如果开头位�|�没有匹配成功，��q��p�|了；而search会蟩�q�开��_��l�箋向后��L��是否有匹配的字符丌Ӏ�针对不同的需

要，可以灉|��使用�q�两个函数�?br />
关于match�q�回的MatchObject如果使用的问题，是Python正则式的�_�N��所在，它与�l�的使用密切相关。我��在下一部分详细讲解�Q�这里只举个最��单的例子�Q?br />
例：

>>> s= 'Tom:9527 , Sharry:0003'

>>> m=re.match( r'(?P/w+):(?P/d+)' , s )

>>> m.group()

'Tom:9527'

>>> m.groups()

('Tom', '9527')

>>> m.group(‘name’)

'Tom'

>>> m.group(‘num’)

'9527'

2.3 finditer

finditer( rule , target [,flag] )

参数同findall

�q�回一个�P代器

finditer函数和findall函数的区别是�Q�findall�q�回所有匹配的字符�Ԍ��q�存��Z��个列表，而finditer则�ƈ不直接返回这些字�W�串�Q�而是�q�回一个�P代器。关于�P代器�Q�解释�v�?br />
有点复杂�Q�还是看看例子把�Q?br />
>>> s=’111 222 333 444’

>>> for i in re.finditer(r’/d+’ , s ):

        print i.group(),i.span()          #打印每次得到的字�W�串和�v始结束位�|?br />
�l�果�?br />
111 (0, 3)

222 (4, 7)

333 (8, 11)

444 (12, 15)

��单的说吧�Q�就是finditer�q�回了一个可调用的对象，使用for i in finditer()的�Ş式，可以一个一个的得到匚w��q�回的Match对象。这在对每次�q�回的对象进行比较复杂的操作

时比较有用�?br />

2.4字符串的替换和修�?br />
re模块�q�提供了对字�W�串的替换和修改函数�Q�他们比字符串对象提供的函数功能要强大一些。这几个函数�?br />
sub ( rule , replace , target [,count] )

subn(rule , replace , target [,count] )

在目标字�W�串中规��D��则查扑֌�配的字符�Ԍ��再把它们替换成指定的字符丌Ӏ�你可以指定一个最多替换次敎ͼ�否则��替换所有的匚w��到的字符丌Ӏ?br />
�W�一个参数是正则规则�Q�第二个参数是指定的用来替换的字�W�串�Q�第三个参数是目标字�W�串�Q�第四个参数是最多替换次数�?br />
�q�两个函数的唯一区别是返回倹{�?br />
sub�q�回一个被替换的字�W�串

sub�q�回一个元�l�，�W�一个元素是被替换的字符�Ԍ��W�二个元素是一个数字，表明产生了多��次替换�?br />
例，��下面字�W�串中的’dog’全部替换�?#8217;cat’

>>> s=’ I have a dog , you have a dog , he have a dog ‘

>>> re.sub( r’dog’ , ‘cat’ , s )

' I have a cat , you have a cat , he have a cat '

如果我们只想替换前面两个�Q�则

>>> re.sub( r’dog’ , ‘cat’ , s , 2 )

' I have a cat , you have a cat , he have a dog '

或者我们想知道发生了多��次替换�Q�则可以使用subn

>>> re.subn( r’dog’ , ‘cat’ , s )

(' I have a cat , you have a cat , he have a cat ', 3)

split( rule , target [,maxsplit] )

切片函数。��用指定的正则规则在目标字�W�串中查扑֌�配的字符�Ԍ��用它们作为分界，把字�W�串切片�?br />
�W�一个参数是正则规则�Q�第二个参数是目标字�W�串�Q�第三个参数是最多切片次�?br />
�q�回一个被切完的子字符串的列表

�q�个函数和str对象提供的split函数很相伹{��D个例子，我们��x��上例中的字符串被’,’分割开�Q�同时要��L��逗号前后的空�?br />
>>> s=’ I have a dog   ,   you have a dog , he have a dog ‘

>>> re.split( ‘/s*,/s*’ , s )

[' I have a dog', 'you have a dog', 'he have a dog ']

�l�果很好。如果��用str对象的split函数�Q�则�׃��我们不知�?#8217;,’两边会有多少个空��|��而不得不对结果再�q�行一�ơ处理�?br />

escape( string )

�q�是个功能比较古怪的函数�Q�它的作用是��字�W�串中的non-alphanumerics字符�Q�我已不知道该怎么��译比较好了�Q�用反义字符的�Ş式显�C�出来。有时候你可能希望在正则式中匹

配一个字�W�串�Q�不�q�里面含有很多re使用的符��P��你要一个一个的修改写法实在有点�ȝ��Q�你可以使用�q�个函数,

例在目标字符串s中匹�?#8217;(*+?)’�q�个子字�W�串

>>> s= ‘111 222 (*+?) 333’

>>> rule= re.escape( r’(*+?)’ )

>>> print rule

/(/*/+/?/)

>>> re.findall( rule , s )

['(*+?)']

3     更深入的了解re的组与对�?br />
前面对Python正则式的�l�进行了一些简单的介绍�Q�由于还没有介绍到match对象�Q�而组又是和match对象密切相关的，所以必��d��它们�l�合��h��介绍才能充分地说明它们的用途�?br />
不过再详�l�介�l�它们之前，我觉得有必要先介�l�一下将规则�~�译后的生成的patter对象

3.1�~�译后的Pattern对象

��一个正则式�Q��用compile函数�~�译�Q�不仅是��Z��提高匚w��的速度�Q�同时还能��用一些附加的功能。编译后的结果生成一个Pattern对象�Q�这个对象里面有很多函数�Q�他们看��h��

和re模块的函数非常象�Q�它同样有findall , match , search ,finditer , sub , subn , split�q�些函数�Q�只不过它们的参数有些小��的不同。一般说来，re模块函数的第一�?br />
参数�Q�即正则规则不再需要了�Q�应��则就包含在Pattern对象中了�Q�编译选项也不再需要了�Q�因为已�l�被�~�译�q�了。因此re模块中函数的�q�两个参数的位置�Q�就被后面的参数�?br />
代了�?br />
findall , match , search和finditer�q�几个函数的参数是一��L��Q�除了少了规则和选项两个参数外，它们又加入了另外两个参数�Q�它们是�Q�查扑ּ�始位�|�和查找�l�束位置�Q�也��?br />
是说�Q�现在你可以指定查找的区��_��除去你不感兴��的区间。它们现在的参数形式是：

findall ( targetString [, startPos [,endPos] ] )

finditer ( targetString [, startPos [,endPos] ] )

match ( targetString [, startPos [,endPos] ] )

search ( targetString [, startPos [,endPos] ] )

�q�些函数的��用和re模块的同名函��C��用完全一栗��所以就不多介绍了�?br />

除了和re模块的函数同��L��函数外，Pattern对象�q�多了些东西�Q�它们是�Q?br />
flags       查询�~�译时的选项

pattern查询�~�译时的规则

groupindex规则里的�l?br />
�q�几个不是函敎ͼ�而是一个倹{��它们提供你一些规则的信息。比如下面这个例�?br />
>>> p=re.compile( r'(?P/b[a-z]+/b)|(?P/b/d+/b)|(?P/b[a-z_]+/w*/b)' , re.I )

>>> p.flags

2

>>> p.pattern

'(?P//b[a-z]+//b)|(?P//b//d+//b)|(?P//b[a-z_]+//w*//b)'

>>> p.groupindex

{'num': 2, 'word': 1, 'id': 3}

我们来分析一下这个例子：�q�个正则式是匚w��单词、或数字、或一个由字母�?#8217;_’开��_��后面接字母或数字的一个ID。我们给�q�三�U�情�늚�规则都包入了一个命名组�Q�分别命�?br />
�?#8217;word’ , ‘num’�?#8216;id’。我们规定大��写不敏感，所以��用了�~�译选项‘I’�?br />
�~�译以后�q�回的对象�ؓp�Q�通过p.flag我们可以查看�~�译时的选项�Q�不�q�它昄��的不�?#8217;I’�Q�而是一个数�?。其实re.I是一个整敎ͼ�2��是它的倹{��我们可以查看一下：

>>> re.I

2

>>> re.L

4

>>> re.M

8

…

每个选项都是一个数倹{�?br />
通过p.pattern可以查看被编译的规则是什么。��用print的话会更好看一�?br />
>>> print p.pattern

(?P/b[a-z]+/b)|(?P/b/d+/b)|(?P/b[a-z_]+/w*/b)

看，和我们输入的一栗��?br />
接下来的p.groupindex则是一个字典，它包含了规则中的所有命名组。字典的key是名字，values是组的序受��由于字典是以名字作为key�Q�所以一个无命名的组不会出现在这里�?br />

3.2�l�与Match对象

�l�与Match对象是Python正则式的重点。只有掌握了�l�和Match对象的��用，才算是真正学会了Python正则式�?br />
3.2.1 �l�的名字与序�?br />
正则式中的每个组都有一个序��P��它是按定义时从左到右的顺序从1开始编��L��。其实，re的正则式�q�有一�?��L��Q�它��是整个正则式本�w��?br />
我们来看个例�?br />
>>> p=re.compile( r’(?P[a-z]+)/s+(?P/d+)/s+(?P/d+).*’ , re.I )

>>> p.groupindex

{'age': 2, 'tel': 3, 'name': 1}

>>> s=’Tom 24 88888888 <=’

>>> m=p.search(s)

>>> m.groups()                           #看看匚w��的各�l�的情况

('Tom', '24', '8888888')

>>> m.group(‘name’)                   #使用�l�名获取匚w��的字�W�串

‘Tom’

>>> m.group( 1 )                         #使用�l�序可��取匹配的字符�Ԍ��同��用组名的效果一�?br />
>>> m.group(0)                           # 0�l�里面是什么呢�Q?br />
'Tom 24 88888888 <='

原来0�l�就是整个正则式,包括没有被包围到�l�里面的内容。当获取0�l�的时候，你可以不写这个参数。m.group(0)和m.group()的效果是一��L��Q?br />
>>> m.group()

'Tom 24 88888888 <='

接下来看看更多的Match对象的方法，看看我们能做些什么�?br />
3.2.2 Match对象的方�?br />
group([index|id]) 获取匚w��的组�Q�缺省返回组0,也就是全部�?br />
groups()               �q�回全部的组

groupdict()           �q�回以组名�ؓkey�Q�匹配的内容为values的字�?br />
接上例：

>>> m.groupindex()

{'age': '24', 'tel': '88888888', 'name': 'Tom'}

start( [group] )     获取匚w��的组的开始位�|?br />
end( [group] )              获取匚w��的组的结束位�|?br />
span( [group] )     获取匚w��的组的（开始，�l�束�Q�位�|?br />

expand( template )�Ҏ��一个模版用扑ֈ�的内�Ҏ��换模版里的相应位�|?br />
�q�个功能比较有趣�Q�它�Ҏ��一个模版来用匹配到的内�Ҏ��换模版中的相应位�|�，�l�成一个新的字�W�串�q�回。它使用/g�?index来指�C�Z��个组�?br />
接上�?br />
>>> m.expand(r'name is /g<1> , age is /g , tel is /3')

'name is Tom , age is 24 , tel is 88888888'

除了以上�q�些函数外，Match对象�q�有些属�?br />
pos         搜烦开始的位置参数

endpos 搜烦�l�束的位�|�参�?br />
�q�两个是使用findall或match�{�函数时�Q�传入的参数。在上面�q�个例子里，我们没有指定开始和�l�束位置�Q�那么缺省的开始位�|�就�?,�l�束位置��是最后�?br />
>>> m.pos

0

>>> m.endpos

19

lastindex 最后匹配的�l�的序号

>>> m.lastindex

3

lastgroup       最后匹配的�l�名

>>> m.lastgroup

'tel'

re    产生�q�个匚w��的Pattern对象�Q�可以认为是个逆引�?br />
>>> m.re.pattern

'(?P[a-z]+)//s+(?P//d+)//s+(?P//d+).*'

得到了��生这个匹配的规则

string 匚w��的目标字�W�串

>>> m.string

'Tom 24 88888888 <='

转自:http://hi.baidu.com/yangdaming1983/item/e6a8146255a5442169105b91

Seraphi 2013-02-11 16:28 发表评论

Seraphi — Mon, 11 Feb 2013 08:26:00 GMT
     摘要: 1        概述1.1     什么是捕获�l�捕��L��是把正则表辑ּ�中子表达式匹配的内容�Q�保存到内存中以数字�~�号或显式命名的�l�里�Q�方便后面引用。当�Ӟ��q�种引用既可以是在正则表辑ּ�内部�Q�也可以是在正则表达式外部。捕��L��有两�U��Ş式，一�U�是普通捕��L��Q�另一�U�是命名捕获�l�，...  阅读全文

Seraphi 2013-02-11 16:26 发表评论

Seraphi — Sun, 10 Feb 2013 15:31:00 GMT

Python��d��文�g
Python��d��文�g
1.open
使用open打开文�g后一定要记得调用文�g对象的close()�Ҏ��。比如可以用try/finally语句来确保最后能关闭文�g�?/p>
file_object = open('thefile.txt')
try:
     all_the_text = file_object.read( )
finally:
     file_object.close( )
注：不能把open语句攑֜�try块里�Q�因为当打开文�g出现异常�Ӟ��文�g对象file_object无法执行close()�Ҏ��?/p>
2.��L��?br style="margin: 0px; padding: 0px;" />��L��本文�?br style="margin: 0px; padding: 0px;" />input = open('data', 'r')
#�W�二个参数默认�ؓr
input = open('data')

��M��q�制文�g
input = open('data', 'rb')

��d��所有内�?br style="margin: 0px; padding: 0px;" />file_object = open('thefile.txt')
try:
     all_the_text = file_object.read( )
finally:
     file_object.close( )

��d��定字�?br style="margin: 0px; padding: 0px;" />file_object = open('abinfile', 'rb')
try:
    while True:
         chunk = file_object.read(100)
        if not chunk:
            break
         do_something_with(chunk)
finally:
     file_object.close( )

��L��?br style="margin: 0px; padding: 0px;" />list_of_all_the_lines = file_object.readlines( )
如果文�g是文本文�Ӟ��q�可以直接遍历文件对象获取每行：
for line in file_object:
     process line

3.写文�?br style="margin: 0px; padding: 0px;" />写文本文�?br style="margin: 0px; padding: 0px;" />output = open('data', 'w')

写二�q�制文�g
output = open('data', 'wb')

�q�加写文�?br style="margin: 0px; padding: 0px;" />output = open('data', 'w+')

写数�?br style="margin: 0px; padding: 0px;" />file_object = open('thefile.txt', 'w')
file_object.write(all_the_text)
file_object.close( )

写入多行
file_object.writelines(list_of_text_strings)
注意�Q�调用writelines写入多行在性能上会比��用write一�ơ性写入要高�?/p>
在处理日志文件的时候，常常会遇到这��L��情况�Q�日志文件巨大，不可能一�ơ性把整个文�g��d��到内存中�q�行处理�Q�例如需要在一台物理内存�ؓ 2GB 的机器上处理一�?2GB 的日志文�Ӟ��我们可能希望每次只处理其�?200MB 的内宏V�?br style="margin: 0px; padding: 0px;" />�?Python 中，内置�?File 对象直接提供了一�?readlines(sizehint) 函数来完成这��L��事情。以下面的代码�ؓ例：
file = open('test.log', 'r')sizehint = 209715200   # 200Mposition = 0lines = file.readlines(sizehint)while not file.tell() - position < 0:       position = file.tell()       lines = file.readlines(sizehint)
每次调用 readlines(sizehint) 函数�Q�会�q�回大约 200MB 的数据，而且所�q�回的必焉��是完整的行数据，大多数情况下�Q�返回的数据的字节数会稍微比 sizehint 指定的值大一点（除最后一�ơ调�?readlines(sizehint) 函数的时候）。通常情况下，Python 会自动将用户指定�?sizehint 的��D��整成内部�~�存大小的整数倍�?/p>
file在python是一个特�D�的�c�d��Q�它用于在python�E�序中对外部的文件进行操作。在python中一切都是对象，file也不例外�Q�file有file的方法和属性。下面先来看如何创徏一个file对象�Q?/p>

file(name[, mode[, buffering]])
file()函数用于创徏一个file对象�Q�它有一个别名叫open()�Q�可能更形象一些，它们是内�|�函数。来看看它的参数。它参数都是以字�W�串的�Ş式传递的。name是文件的名字�?br style="margin: 0px; padding: 0px;" />mode是打开的模式，可选的��gؓr w a U�Q�分别代表读�Q�默认） �?��d��支持各种换行�W�的模式。用w或a模式打开文�g的话�Q�如果文件不存在�Q�那么就自动创徏。此外，用w模式打开一个已�l�存在的文�g�Ӟ��原有文�g的内容会被清�I�，因�ؓ一开始文件的操作的标记是在文件的开头的�Q�这时候进行写操作�Q�无疑会把原有的内容�l�抹掉。由于历史的原因�Q�换行符在不同的�pȝ��中有不同模式�Q�比如在 unix中是一个\n�Q�而在windows中是‘\r\n’�Q�用U模式打开文�g�Q�就是支持所有的换行模式�Q�也��p��‘\r’ '\n' '\r\n'都可表示换行�Q�会有一个tuple用来存贮�q�个文�g中用到过的换行符。不�q�，虽说换行有多�U�模式，��d��python中统一用\n代替。在模式字符的后面，�q�可以加�? b t�q�两�U�标识，分别表示可以�Ҏ��件同时进行读写操作和用二�q�制模式、文本模式（默认�Q�打开文�g�?br style="margin: 0px; padding: 0px;" />buffering如果�?表示不进行缓�?如果�?表示�q�行“行缓�?#8220;;如果是一个大�?的数表示�~�冲区的大小�Q�应该是以字节�ؓ单位的�?/p>
file对象有自��q��属性和�Ҏ��。先来看看file的属性�?/p>

closed #标记文�g是否已经关闭�Q�由close()改写
encoding #文�g�~�码
mode #打开模式
name #文�g�?nbsp;
newlines #文�g中用到的换行模式�Q�是一个tuple
softspace #boolean型，一般�ؓ0�Q�据说用于print
file的读写方法：

F.read([size]) #size��取的长度�Q�以byte为单�?nbsp;
F.readline([size])
#��M��行，如果定义了size�Q�有可能�q�回的只是一行的一部分
F.readlines([size])
#把文件每一行作��Z��个list的一个成员，�q�返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数�Q�size是表�C��取内容的总长�Q�也��是说可能只��d��文�g的一部分�?nbsp;
F.write(str)
#把str写到文�g中，write()�q�不会在str后加上一个换行符
F.writelines(seq)
#把seq的内容全部写到文件中。这个函��C��只是忠实地写入，不会在每行后面加上�Q何东�ѝ�?nbsp;
file的其他方法：

F.close()
#关闭文�g。python会在一个文件不用后自动关闭文�g�Q�不�q�这一功能没有保证�Q�最好还是养成自己关闭的习惯。如果一个文件在关闭后还对其�q�行操作会��生ValueError
F.flush()
#把缓冲区的内容写入硬�?nbsp;
F.fileno()
#�q�回一个长整型�?#8221;文�g标签“
F.isatty()
#文�g是否是一个终端设备文�Ӟ��unix�pȝ��中的�Q?nbsp;
F.tell()
#�q�回文�g操作标记的当前位�|�，以文件的开头�ؓ原点
F.next()
#�q�回下一行，�q�将文�g操作标记位移��C��一行。把一个file用于for ... in file�q�样的语句时�Q�就是调用next()函数来实现遍历的�?nbsp;
F.seek(offset[,whence])
#��文件打操作标记�U�d��offset的位�|�。这个offset一般是相对于文件的开头来计算的，一般�ؓ正数。但如果提供了whence参数��׃��一定了�Q�whence可以�?表示从头开始计��，1表示以当前位�|��ؓ原点计算�?表示以文件末��ؓ原点�q�行计算。需要注意，如果文�g以a或a+的模式打开�Q�每�ơ进行写操作�Ӟ��文�g操作标记会自动返回到文�g末尾�?nbsp;
F.truncate([size])
#把文件裁成规定的大小�Q�默认的是裁到当前文件操作标记的位置。如果size比文件的大小�q�要大，依据�pȝ��的不同可能是不改变文�Ӟ��也可能是�?把文件补到相应的大小�Q�也可能是以一些随机的内容加上厅R�?br />

本文来自CSDN博客�Q��{载请标明出处�Q?a style="margin: 0px; padding: 0px; color: #075db3;">http://blog.csdn.net/adupt/archive/2009/08/11/4435615.aspx

Seraphi 2013-02-10 23:31 发表评论

python脚本图解�Q�非帔R��合刚入门学python的�h

Seraphi — Sat, 02 Feb 2013 08:01:00 GMT

Seraphi 2013-02-02 16:01 发表评论

亚洲人成电影网站,亚洲欧美自偷自拍另类视,久久亚洲色一区二区三区

MacTex的pkuthss配置

pulp配置步骤�Q�安装GLPK

转：WINDOWS搭徏Discuz

Windows7&IIS7.5部��vDiscuz全攻�?/a>

准备工作

安装PHP

配置IIS

安装MySQL

安装Discuz

转：latex安装

�?python正则表达式基���

Python正则

Python��d��文�g

python脚本图解�Q�非帔R��合刚入门学python的�h

�?python正则表达式基��