2007-5-17 1:33:12
本着为浏览者服务的态度,网站移除了采集来的内容,去掉了数据仓库页,虽然剩下的文章已仅了400多页,但柳永法相信,一定会把本站做好,传说中我进入了搜索引擎的沙盒效应阶段,不知道这次大的改动会不会伤了元气,不管会不会伤,都无所畏了,认真做自己的站吧,为浏览者服务 |
2007-5-16 16:29:23
Emeditor与dos(cmd)经典使用技巧之批量生成网页 首先我们把要生成的网页弄成这种格式: 然后把它放到Emeditor里,利用正则表达式替换:Ctrl+H调出替换-->查找里找输入([\s\S]+)@([\s\S]+),替换里输入echo \2 >\1\ntype index.htm >>\1,选中使用正则表达式,点替换全部得到:
然后复制这些,win+R,调出“运行”输入cmd回车,然后右击里边粘贴,然后你会看到目录下有很多个你想要的网页,打开看看里面的内容,基本上是你要的东西了。
以上只是提供方法,具体实用性因人而异。
|
2007-5-15 21:05:06
东西不少,不过都是英文的。 搜索引擎研究 非中文主流搜索引擎 主流搜索引擎-中文 社会化搜索引擎 元搜索搜索引擎 软件/FTP/BT/新闻/计算机相关搜索引擎 博客(分类)/RSS搜索引擎搜索引擎研究 非中文主流搜索引擎 主流搜索引擎-中文 社会化搜索引擎 元搜索搜索引擎 软件/FTP/BT/新闻/计算机相关搜索引擎 博客(分类)/RSS搜索引擎 音乐/视频/电影搜索引擎 图片搜索引擎 人物/电子邮件/电话号码搜索引擎 商机/企业/产品/购物/商品搜索引擎 学术/文化/知识/大学搜索/图书引擎 医学搜索引擎 职位/工作搜索引擎 地图/旅行/交通(工具)搜索引擎 房产搜索引擎 主流分类目录/标签/网址导航 非流分类目录/标签/网址导航 非主流分类目录/标签/网址导航 特色搜索引擎 |
2007-5-15 20:55:13
搜索引擎爬行抓取蜘蛛(机器人)程序HTTP头用户代理名称列表大全 Search engine spider(bot) id list 先说下国人常见的: 百度www.baidu.com:Baiduspider 谷哥www.Google.com:Googlebot 雅虎www.yahoo.com.cn:Yahoo Slurp 搜狗www.sogou.com:Sogou Push Spider 有道www.yodao.com:YodaoBot MSN www.msn.com:msnbot sina爱问 iask.com:iaskspider
您可以使用Emeditor打开日志文件,然后按ctrl+F,查找里输BaiduspiderGooglebotyahoosogouYodaoBotmsnbotiaskspider,选项选中"使用正则表达式",然后搜索,这些蜘蛛网便会高亮展现在你面前
以上由柳永法(yongfa365)'Blog提供 |
2007-5-15 16:50:47
我在遥望,月薪之上,有多少的工资可以自由的上涨,昨天已忘,风干了钱囊,和重逢在发薪的路上,已被牵引,工资涨落,有钱的日子像在天堂,呕也,呕也,呕也 谁在呼唤,工资快涨,涨钱的渴望象白云在飘荡,东边借钱,西边还贷,一捆捆的钞票,就送到了银行,致富的路在何方跟谁商量,让工资涨涨 呕也 呕也 呕也 |
2007-5-14 15:07:44
推荐几个不错的SEO入门书籍给大家: 1.《搜索引擎优化(SEO)知识完全手册》 2.《SEO培训教程》 3.《王通SEO教程2007版》 4.《五天提高搜索引擎排名》 5.《SEO实操手册》 6.《五天提高搜索引擎排名》 |
2007-5-14 14:23:35
2007-5-14 10:11:16
网站加上了一些书签收藏按钮,忘记从哪弄的了,回家再看看,主要是加入百度收藏 | Google书签 | Yahoo书签 | 新浪书签 | 美味书签 | 365Key |
2007-5-14 8:34:02
奇怪了,Alexa排名上升了5百万名,sogoupank从2长到43,而baidu收录却从135降到了2,真不知道是怎么回事了,找各位大虾们研究一下,这可不行呀,google收录很多但从他上面来的却不多,baidu收录虽然很少,但有很多都是从他上面来的,突然想起来,前些天刚在我网站上加上了说明,model by hibaidu,不会是让baidu看到了吧,这也算是页面侵权了,不过baidu这么大的公司,不应该跟咱这小菜鸟计较这个吧,如果真是这样,可真是倒大霉了 |
2007-5-13 23:57:41
搜索引擎就是搜索引擎就是比一般采集者有风度,今天看了下日志,真是一塌糊涂,一堆搜索引擎的踪迹,看了googlebot的建议,可以提高对我网站的抓取速度为“快”了。和以前不同的是,多了一些不知道的采集者larbin_2.6.3+larbin2.6.3@unspecified.mail,还有两个ip不同的死亡式采集者,一下就想把我的网站不停息的采集完,跟我以前做的采集程序那么像,说实话:真的很疯狂。不过提醒这位老大,还是加工一下自己的程序吧 |
2007-5-12 19:18:54
win 2003 文件夹 文件 拒绝访问 无法访问 终极解决方法 您无权查看或编辑目前 200705 的权限设置;但是,您可以取得所有权或更改审核设置 |
2007-5-12 17:11:15
blog基本功能基本上完成了,rss,还有文章存档,终于完成了, |
2007-5-12 0:00:33
第一是“贫穷”。第二是“梦想”。第三是“家人”。人的上半生要不犹豫;人的下半生要不后悔。活在当下,把握每次机会,因为机会稍纵即逝,为自己的生命找到出路! |
2007-5-11 0:02:08
做blog时时里面要实现一个文章存档功能,调试了一会终于出来了,思路是:
1.第一层先找出都有哪些年,倒序排列
2.第二层统计第一层的年里的月分有多少个,从而得出:YY年MM月(N篇文章)
3.留言感谢柳永法同志给大家共享代码 select year(addtime) as y from BlogArticle group by year(addtime) order by year(addtime) desc |
2007-5-10 8:26:43
我的网站都这么长时间了才被收录了135个,已经两星期没变了,我大概的看了下,这些基本上都是我原创的。是比较喜欢收集原创的东西。 |
|
|
| |
文章分类 |
|
|
|