利用Notepad++快速将字符替换为回车

excel不四舍全进的函数

火车头采集器邮箱(Email)地址的正则表达式

解决dwz.cn中“您输入的网址可能有安全隐患，请重新输入！”的问题

linux下分割大文件与合并小文件

利用Notepad++快速将字符替换为回车

excel不四舍全进的函数

火车头采集器邮箱(Email)地址的正则表达式

解决dwz.cn中“您输入的网址可能有安全隐患，请重新输入！”的问题

linux下分割大文件与合并小文件

Tags: notepad++, 替换, 回车

Tags: excel, 不四舍全进, 四舍五入

Tags: 火车头采集器, 邮箱, 正则表达式

Tags: linux, split, cat

Tags: notepad++, 替换, 回车

Tags: excel, 不四舍全进, 四舍五入

Tags: 火车头采集器, 邮箱, 正则表达式

Tags: linux, split, cat

正冰

Categories

FanFou

Music

Archives

Hot Tags

Recent Comments

Statistics

Blogroll

Meta

浏览模式: 标准 | 列表 2012年08月的文章

Written by 正冰 on 2012, August 14, 2:27 PM

有一行数据，类似如下：

A|B|C|D|E|F|G

需要修改的便是去掉|，将每个字母一行排列。原本需要手动进行排列，通过利用notepad++++软件的替换功能，即可快速将字符替换为回车。

在替换的时候[使用转义字符]，然后[替换为]里面输入\r\n，然后即可替换完成。

Filed under: 技术归总 0 Comments 31362 Views

Written by 正冰 on 2012, August 13, 1:48 PM

比如1.1与2.8，按照四舍五入的作法就是1与3，现在我的需求是对数据不四舍全进的作法，便是2与3。

在excel中可以做到不四舍全进的函数有如下：

数据在A1，B1中输入=ROUNDUP(A1,)

ROUNDUP函数是向上进到指定位数，省略不写默认即为0位进到整数。

另外一种方法便是输入=CEILING(A1,1)

CEILING函数向上进到指定数字的倍数，这里是1的倍数。

Filed under: 技术归总 0 Comments 6729 Views

Written by 正冰 on 2012, August 13, 1:17 PM

火车头采集器的正则匹配语法是：

前字符串(?<content>[\s\S]*?)后字符串【注：[\s\S]* 可匹配任意字符，也可替换成您需要的正则】

而对于火车头采集器一般邮箱(Email)地址的正则表达式如下：

(?<content>\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*?)

简单解释一下就是\w+([-+.]\w+)*匹配由数字、字母、连接符和点组成的字符串

测试过程中发现如果邮箱地址后面带中文则中文也会被采集，故修改后的正则表达式如下（不会再采集中文）：

(?<content>\w+([-+.]\w+)*@\w+([-.]\w+)*\.[a-z]{2,3}([\.][a-z]{2})?)

修改的思路来自以下一段PHP采集页面邮箱地址的小程序中的正则匹配规则：

<?php
$url='http://blog.is36.com';
$content=file_get_contents($url);
function getEmail($str) {
$pattern = "/([a-z0-9\-_\.]+@[a-z0-9]+\.[a-z0-9\-_\.]+)/";
preg_match_all($pattern,$str,$emailArr);
return $emailArr[0];
}
print_r( getEmail($content));
?>

Filed under: 技术归总 0 Comments 22275 Views

Written by 正冰 on 2012, August 7, 10:51 PM

dwz.cn是百度推出的短网址服务，个人比较喜欢的是可以自定义名字，这样就方便记忆。

而在使用百度短网址dwz.cn生成时显示“您输入的网址可能有安全隐患，请重新输入！”的问题，解决这个问题比较简单，找一个中转短网址即可。

我选择的中转短网址是CNZZ家的微缩网址www.rdcnzz.com，把rdcnzz生成的微缩网址扔到dwz.cn中去，顺利生成。

Filed under: 技术归总 0 Comments 30404 Views

Written by 正冰 on 2012, August 3, 6:27 PM

在linux下，如果遇到大文件需要将其分割成若干小文件，而遇到若干小文件需要将其合并成大文件，则需要用到以下命令：

假设需要分割的文件名为file，需要分割为10M一个大小，则命令如下，分割为xaa、xab、xac依次命名的文件。

#split -b 10m file

假设需要合并的小文件名都是xa打头，则命令如下（需要注意的是，合并文件的顺序以dir命令排序出来的顺序合并进去，并且注意待合并的文件时紧跟前一个文件的末尾的……）

#cat xa* >file

Filed under: 技术归总 0 Comments 19108 Views

« 2012年08月 »