C#中正则表达式的应用简析

by shinichi_wtn 2010-08-23 17:11
正则表达式简介 在许多应用场景中,我们需要在字符串中查找特定的信息,或者编辑其中的部分信息。比如网页信息采集程序需要对HTML文本进行筛选和处理,获得锚点(<a>),列表(<li>)等等,如果没有正则表达式,我们需要编写繁琐的字符串处理程序来挖掘所需的文本;同样,要在一段程序代码中对关键词进行着色(代码着色问题),我们首先在字符串中找到关键词,然后把关键词替换为相应的HTML代码(如将class替换为<span style=”color:blue”>class</span>),如果没有正则表达式,这项工作将变得十分繁琐。... [More]

【模糊查询】之用VS的正则表达式替换工具标准化词典

by shinichi_wtn 2008-12-19 10:51
汉语是我们的母语,每天我们都不断地与它打交道。现代汉语大词典算是中国最权威的汉语词库了,为了进行实验,下载一个汉语词典的文本文件(txt)是有必要的,而网络上这类词典非常丰富,所以该资源很容易得到。而TXT文件中的内容并不是完全符合标准,不能直接导入ACCESS数据库,首先得对TXT中的文字进行字符串替换和标准化处理,运用正则表达式来处理非常方便和快捷。下面将介绍如何处理该文件 比如我下到的词典的最开头的样子如下图 它有几个很明显的规律:首先,单字两侧没有“【”和“】”而每个单字前面却是“*”,即现有的单字格式为&... [More]

About

shinichi_wtnI'm Shinichi_wtn

Software Engineering Manager at Microsoft

[More...]


Month List