有一行数据,类似如下:
A|B|C|D|E|F|G
需要修改的便是去掉|,将每个字母一行排列。原本需要手动进行排列,通过利用notepad++++软件的替换功能,即可快速将字符替换为回车。
在替换的时候[使用转义字符],然后[替换为]里面输入\r\n,然后即可替换完成。
记录一个IT技术员的生活与技术
Written by 正冰 on 2012, August 14, 2:27 PM
有一行数据,类似如下:
A|B|C|D|E|F|G
需要修改的便是去掉|,将每个字母一行排列。原本需要手动进行排列,通过利用notepad++++软件的替换功能,即可快速将字符替换为回车。
在替换的时候[使用转义字符],然后[替换为]里面输入\r\n,然后即可替换完成。
Written by 正冰 on 2012, August 13, 1:48 PM
比如1.1与2.8,按照四舍五入的作法就是1与3,现在我的需求是对数据不四舍全进的作法,便是2与3。
在excel中可以做到不四舍全进的函数有如下:
数据在A1,B1中输入=ROUNDUP(A1,)
ROUNDUP函数是向上进到指定位数,省略不写默认即为0位进到整数。
另外一种方法便是输入=CEILING(A1,1)
CEILING函数向上进到指定数字的倍数,这里是1的倍数。
Written by 正冰 on 2012, August 13, 1:17 PM
火车头采集器的正则匹配语法是:
前字符串(?<content>[\s\S]*?)后字符串 【注:[\s\S]* 可匹配任意字符,也可替换成您需要的正则】
而对于火车头采集器一般邮箱(Email)地址的正则表达式如下:
(?<content>\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*?)
简单解释一下就是\w+([-+.]\w+)*匹配由数字、字母、连接符和点组成的字符串
测试过程中发现如果邮箱地址后面带中文则中文也会被采集,故修改后的正则表达式如下(不会再采集中文):
(?<content>\w+([-+.]\w+)*@\w+([-.]\w+)*\.[a-z]{2,3}([\.][a-z]{2})?)
修改的思路来自以下一段PHP采集页面邮箱地址的小程序中的正则匹配规则:
Written by 正冰 on 2012, August 7, 10:51 PM
dwz.cn是百度推出的短网址服务,个人比较喜欢的是可以自定义名字,这样就方便记忆。
而在使用百度短网址dwz.cn生成时显示“您输入的网址可能有安全隐患,请重新输入!”的问题,解决这个问题比较简单,找一个中转短网址即可。
我选择的中转短网址是CNZZ家的微缩网址www.rdcnzz.com,把rdcnzz生成的微缩网址扔到dwz.cn中去,顺利生成。
Written by 正冰 on 2012, August 3, 6:27 PM
在linux下,如果遇到大文件需要将其分割成若干小文件,而遇到若干小文件需要将其合并成大文件,则需要用到以下命令:
假设需要分割的文件名为file,需要分割为10M一个大小,则命令如下,分割为xaa、xab、xac依次命名的文件。
#split -b 10m file
假设需要合并的小文件名都是xa打头,则命令如下(需要注意的是,合并文件的顺序以dir命令排序出来的顺序合并进去,并且注意待合并的文件时紧跟前一个文件的末尾的……)
#cat xa* >file