浏览模式: 标准 | 列表 2012年08月的文章

利用Notepad++快速将字符替换为回车

有一行数据,类似如下:

A|B|C|D|E|F|G

需要修改的便是去掉|,将每个字母一行排列。原本需要手动进行排列,通过利用notepad++++软件的替换功能,即可快速将字符替换为回车

在替换的时候[使用转义字符],然后[替换为]里面输入\r\n,然后即可替换完成。

Tags: notepad++, 替换, 回车

excel不四舍全进的函数

比如1.1与2.8,按照四舍五入的作法就是1与3,现在我的需求是对数据不四舍全进的作法,便是2与3。

excel中可以做到不四舍全进的函数有如下:

 

数据在A1,B1中输入=ROUNDUP(A1,)

ROUNDUP函数是向上进到指定位数,省略不写默认即为0位进到整数。

另外一种方法便是输入=CEILING(A1,1)

CEILING函数向上进到指定数字的倍数,这里是1的倍数。

Tags: excel, 不四舍全进, 四舍五入

火车头采集器邮箱(Email)地址的正则表达式

火车头采集器的正则匹配语法是:

前字符串(?<content>[\s\S]*?)后字符串 【注:[\s\S]* 可匹配任意字符,也可替换成您需要的正则】

而对于火车头采集器一般邮箱(Email)地址的正则表达式如下:

(?<content>\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*?)

简单解释一下就是\w+([-+.]\w+)*匹配由数字、字母、连接符和点组成的字符串

测试过程中发现如果邮箱地址后面带中文则中文也会被采集,故修改后的正则表达式如下(不会再采集中文):

(?<content>\w+([-+.]\w+)*@\w+([-.]\w+)*\.[a-z]{2,3}([\.][a-z]{2})?)

修改的思路来自以下一段PHP采集页面邮箱地址的小程序中的正则匹配规则:

  • <?php
  • $url='http://blog.is36.com';
  • $content=file_get_contents($url);
  • function getEmail($str) {
  •     $pattern = "/([a-z0-9\-_\.]+@[a-z0-9]+\.[a-z0-9\-_\.]+)/";
  •     preg_match_all($pattern,$str,$emailArr);
  •     return $emailArr[0];
  • }
  • print_r( getEmail($content));
  • ?>

Tags: 火车头采集器, 邮箱, 正则表达式

解决dwz.cn中“您输入的网址可能有安全隐患,请重新输入!”的问题

dwz.cn是百度推出的短网址服务,个人比较喜欢的是可以自定义名字,这样就方便记忆。

而在使用百度短网址dwz.cn生成时显示“您输入的网址可能有安全隐患,请重新输入!”的问题,解决这个问题比较简单,找一个中转短网址即可。

我选择的中转短网址是CNZZ家的微缩网址www.rdcnzz.com,把rdcnzz生成的微缩网址扔到dwz.cn中去,顺利生成。

linux下分割大文件与合并小文件

linux下,如果遇到大文件需要将其分割成若干小文件,而遇到若干小文件需要将其合并成大文件,则需要用到以下命令:

假设需要分割的文件名为file,需要分割为10M一个大小,则命令如下,分割为xaa、xab、xac依次命名的文件。

#split -b 10m file

假设需要合并的小文件名都是xa打头,则命令如下(需要注意的是,合并文件的顺序以dir命令排序出来的顺序合并进去,并且注意待合并的文件时紧跟前一个文件的末尾的……)

#cat xa* >file

Tags: linux, split, cat