Tag: Discuz

  • discuz您开启了 运行 SQL 语句 功能.建议您只有在十分必要的时候才开启它.请修改

    Discuz后台提醒:你开启了运行SQL语句功能,建议你只有在十分必要的时候才开启此它,请修改 config/config_global.php 介绍一下修改的方法: 1、打开这个文件:config/config_global.php 2、查找到 $_config[‘admincp’][‘runquery’] = 0; 3、将=1改为=0即可。1 是开启,0是关闭

  • Discuz3.4邮件发送方式设置20190928

    Discuz3.4邮件发送方式设置20190928

    最近Discuz又重新招兵买马开始发力了,为什么呢?请看我之前的一篇文章: 站长们泪奔!腾讯云奶罩再造Discuz!招兵买马,重建生态 搭建论坛后,最常用的功能就是邮件发送,随着技术的发展,为了防止垃圾邮件,常用邮箱平台都加强了安全策略,例如第三方客户端如果想发送邮件,就不能用密码,而是授权码了。 下面是用qq邮箱作为smtp服务器,在Discuz3.4中的配置过程: 在Discuz后台用admin登陆,在站长–邮件设置中进行设置,如图所示: 如果是阿里云的邮箱,要注意用户名的地方格式是xxx@域名,所以说每家都不一样,需要看文档。 上图中需要注意的就是在smtp服务器要填ssl://smtp.qq.com,端口465,这些信息都在qq邮箱官方帮助文件中有提到: https://service.mail.qq.com/cgi-bin/help?subtype=1&&no=167&&id=28 需要注意的是最后的密码,如果填你qq密码就不对了,应该填授权码,这个授权码的说明地址: https://service.mail.qq.com/cgi-bin/help?subtype=1&&no=1001256&&id=28 其实在qq邮箱设置里有说明了: 第一步开启smtp服务,第二步点击生成授权码,照要求做就行了,一般要求用手机发送一条短信来获取授权码。 在Discuz后台填完后测试,以下就是成功界面:

  • discus上传文件出现413错误码 解决方案

    discus上传文件出现413错误码 解决方案

    在nginx.conf http段配置文件中配置允许客户端请求文件大小为100M client_max_body_size 100m; #允许客户端请求的最大单文件字节数 client_body_buffer_size 128k; #缓冲区代理缓冲用户端请求的最大字节数 systemctl restart nginx

  • discuz修改备案链接

    discuz修改备案链接

    工信部的备案地址换了,按照国务院办公厅要求,“工业和信息化部ICP/IP地址/域名信息备案管理系统” 域名调整为“beian.miit.gov.cn”,原域名“miitbeian.gov.cn”、“miibeian.gov.cn”自2019年4月25日起停止使用。 那么discuz下面的备案地址怎么改呢? 找到template/default/common/footer.htm 更改为: <!–{if $_G[‘setting’][‘icp’]}–>( <a href=”http://beian.miit.gov.cn/” target=”_blan k”>$_G[‘setting’][‘icp’]</a> )<!–{/if}–>

  • 去除“还有一些帖子被系统自动隐藏,点此展开”

    去除“还有一些帖子被系统自动隐藏,点此展开”

    这不是捣乱么,自动判断是水贴,没那么准。 后台--》站点功能--》贴子阅读 启用隐藏水帖: 选否。搞定。

  • discuz 修改文本

    discuz 修改文本

    目录:source/language/forum/lang_template.php

  • common_visit' is marked as crashed and should be repaired 解决办法

    common_visit’ is marked as crashed and should be repaired 解决办法

    错误产生原因,有网友说是频繁查询和更新dede_archives表造成的索引错误,因为我的页面没有静态生成,而是动态页面,因此比较同意这种说法。 还有说法为是MYSQL数据库因为某种原因而受到了损坏,如:数据库服务器突发性的断电、在提在数据库表提供服务时对表的原文件进行某种操作都有可能导致 MYSQL数据库表被损坏而无法读取数据。总之就是因为某些不可测的问题造成表的损坏。

  • discuz x3.4邮件发送返回错误信息解决办法

    discuz x3.4邮件发送返回错误信息解决办法

    1.后台设置问题-站长-邮箱设置 这个简单,smtp前面加ssl://,然后端口改成465,其他跟以前一样, 还有一点是密码那里有的邮箱要填密码,例如gmail,有的邮箱要填授权码之类的,例如163 2.配置问题 win系统+IIS环境下,开启(开启方法是php.ini文件找到如下,把前面分号去掉就可以) allow_url_fopen = On extension=php_openssl.dll

  • 如何更改discuz默认显示图片大小

    如何更改discuz默认显示图片大小

    第一个地方,界面设置,帖子内容页 第二个地方:风格管理,编辑模版 修改阅读区域宽度 第3个地方,自行修改的脚本里,比如: ./template/default/forum/viewthread_node_body.htm

  • discuz 更改积分规则

    discuz 更改积分规则

    grep “updatecreditbyaction(‘daylogin'” -air -C 5 /var/www/html/source/ 改1: source/class/discuz/discuz_application.php 为:     650 if ($this->var[‘member’][‘credits’] > -1) {     651                         updatecreditbyaction(‘daylogin’, $this->var[‘uid’]);     652 } 改2: source/function/function_member.php 为:      94 # add for jifen      95    if ($_G[‘member’][‘credits’] > -1)…

  • discuz"没有找到帖子"故障解决方法

    discuz”没有找到帖子”故障解决方法

    如图,discuz在未登录状态下,莫名其妙的某些板块出现“没有找到帖子”的故障,如果登录的话一切正常。说明应该不是数据丢失的问题。 冷静思考一下,在后台和状态正常的板块对比一下不难发现还是有不一样的地方: 看到没有,这个页面缓存系数就是罪魁祸首,把它置为0,返回去看一切恢复正常。 是不是很奇怪?大多数的朋友并没有设置这个参数,应该是系统的bug,自己给变了。 也许是想帮你的忙也说不好。

  • 性价比神器!99元一年的阿里云256MB高性能Redis性能测试及discuz应用介绍

    性价比神器!99元一年的阿里云256MB高性能Redis性能测试及discuz应用介绍

    Redis是一个开源的key-value类型的数据库缓存和存储系统,同时Redis提供了丰富的数据结构用来支持多样的业务chan场景,比如hashes,lists,sets还有ordered sets及其他类型。云数据库Redis提供了兼容Redis协议的数据库服务,提供单机和集群两种模式,提供了全套的容灾切换、故障迁移、在线扩容、性能优化的数据库解决方案。 本文我们将介绍如何使用阿里云Redis服务作为PHP服务的session存储。PHP的session存储作为php会话信息的存储单元,默认的PHP使用文件来存储session会话信息。同时PHP支持使用扩展的存储单元来作为会话信息的存储,通过扩展的session能够满足多台PHP服务器共享会话信息。 Redis云服务主从版本默认双机热备 Redis云服务主从版本兼容性高,支持lua、事物,并且兼容Redis3.0的地理位置GEO计算 Redis云服务性能优越,最大性能可以达到10WQPS Redis云服务主从版本数据持久化,每秒AOF Fsync,并且支持备份恢复 Redis云服务主从版本256MB内存小性能高,性价比非常适合小内存的业务场景 Redis云服务主从版本支持动态扩容,用户在业务增长之后可以动态升级 测试redis是否可用: [root@ECS~]# telnet HOST 6379 Trying IP… Connected to HOST. Escape character is ‘^]’. auth PASSWORD #回车 +OK #回复 ping #回车 +PONG #回复 quit #回车 +OK #回复 Connection closed by foreign host. 性能测试工具: 测试工具:https://github.com/RedisLabs/memtier_benchmark ./memtier_benchmark –server HOST -p 6379 -P redis –threads=16 –clients=4 -a PASSWORD…

  • 微信登录 wechat-login.html 403 Forbidden

    微信登录 wechat-login.html 403 Forbidden

    discuz设置微信登陆,遇到403问题。 一般情况下,全局-seo设置里要先确定现有的seo策略生效,点击 你的域名/admin.php?action=checktools&operation=rewrite&frame=no 会有相应的rewrite规则,将其和你自己的配置进行比对,将插件的rewrite规则靠前即可。

  • 请先升级 UCenter 到 1.6.0 以上版本。 如果使用为Discuz! X自带UCenter,请先下载 UCenter 1.6.0, 在 utilities 目录下找到对应的升级程序,复制或上​

    请先升级 UCenter 到 1.6.0 以上版本。 如果使用为Discuz! X自带UCenter,请先下载 UCenter 1.6.0, 在 utilities 目录下找到对应的升级程序,复制或上​

    错误提示”请先升级 UCenter 到 1.6.0 以上版本。 如果使用为Discuz! X自带UCenter,请先下载 UCenter 1.6.0, 在 utilities 目录下找到对应的升级程序,复制或上。。。。。“   解决办法: 先确认uc版本是否1.6,如果是还出现请先升级 UCenter 到 1.6.0 以上版本,按如下方法解决: 方法有两种: 第一、http://你的域名/install/update.php?step=prepare 直接输入 第二、在updata.php文件中 查找代码 if(version_compare($version, ’1.5.2′) <= 0) {  将代码修改为:if(version_compare($version, ’1.5.2′) >= 0) { 就可以跳过检查了!! 接下来哗哗哗一顿表升级乱闪,大概260个表后,显示如下: 数据库升级工具 升级开始 数据库结构添加与更新 数据更新 数据库结构删除 升级完成 恭喜,数据库结构升级完成! 升级完成。

  • Sphinx全文检索引擎使用指南:安装支持的操作系统:在绝大多数现代的Unix类操作系统上,只需要一个C++编译器就可以编译并运行Sphinx,而不需要对源码进行任何改动。

    Sphinx全文检索引擎使用指南:安装支持的操作系统:在绝大多数现代的Unix类操作系统上,只需要一个C++编译器就可以编译并运行Sphinx,而不需要对源码进行任何改动。

    Sphinx可以在以下系统上运行: Linux 2.4.x, 2.6.x (包括各种发行版) ? Windows 2000, XP ? FreeBSD 4.x, 5.x, 6.x ? NetBSD 1.6, 3.0 ? Solaris 9, 11 ? Mac OS X 支持的CPU种类包括 X86, X86-64, SPARC64。 依赖的工具:在UNIX平台上,你需要以下的工具用来编译和安装Sphinx: C++编译器。GNU gcc就能够干这个活。 make程序。GNU make就能够干这个活。 安装Sphinx: tar包解压,并进入sphinx子目录:  $ tar xzvf sphinx-0.9.7.tar.gz  $ cd sphinx  configuration程序: $ ./configure configure程序有很多运行选项。完整的列表可以通过使用 –help开关得到。最重要的如下:  –prefix, 定义将 Sphinx安装到何处;  –with-mysql, 当自动检测失败时,指出在那里能找到MySQL头文件和库文件; 制作二进制程序: …

  • discuz 静态化rewrite规则大全 apache windows iis nginx zeus

    discuz 静态化rewrite规则大全 apache windows iis nginx zeus

    Apache Web Server(独立主机用户) <IfModule mod_rewrite.c> RewriteEngine On RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^(.*)/topic-(.+)\.html$ $1/portal.php?mod=topic&topic=$2&%1 RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^(.*)/article-([0-9]+)-([0-9]+)\.html$ $1/portal.php?mod=view&aid=$2&page=$3&%1 RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^(.*)/forum-(\w+)-([0-9]+)\.html$ $1/forum.php?mod=forumdisplay&fid=$2&page=$3&%1 RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^(.*)/thread-([0-9]+)-([0-9]+)-([0-9]+)\.html$ $1/forum.php?mod=viewthread&tid=$2&extra=page\%3D$4&page=$3&%1 RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^(.*)/group-([0-9]+)-([0-9]+)\.html$ $1/forum.php?mod=group&fid=$2&page=$3&%1 RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^(.*)/space-(username|uid)-(.+)\.html$ $1/home.php?mod=space&$2=$3&%1 RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^(.*)/blog-([0-9]+)-([0-9]+)\.html$ $1/home.php?mod=space&uid=$2&do=blog&id=$3&%1 RewriteCond %{QUERY_STRING} ^(.*)$ RewriteRule ^(.*)/(fid|tid)-([0-9]+)\.html$ $1/archiver/index.php?action=$2&value=$3&%1…

  • discuz 2018年元旦有大动作

    discuz 2018年元旦有大动作

    偶然在后台点应用,进入discuz的应用中心官网,发现有个20180101升级的提示,然而点进去并没有,是准备要升级么?拭目以待。

  • discuz nginx 的静态化配置

    discuz nginx 的静态化配置

    rewrite ^([^\.]*)/topic-(.+)\.html$ $1/portal.php?mod=topic&topic=$2 last; rewrite ^([^\.]*)/article-([0-9]+)-([0-9]+)\.html$ $1/portal.php?mod=view&aid=$2&page=$3 last; rewrite ^([^\.]*)/forum-(\w+)-([0-9]+)\.html$ $1/forum.php?mod=forumdisplay&fid=$2&page=$3 last; rewrite ^([^\.]*)/thread-([0-9]+)-([0-9]+)-([0-9]+)\.html$ $1/forum.php?mod=viewthread&tid=$2&extra=page%3D$4&page=$3 last; rewrite ^([^\.]*)/group-([0-9]+)-([0-9]+)\.html$ $1/forum.php?mod=group&fid=$2&page=$3 last; rewrite ^([^\.]*)/space-(username|uid)-(.+)\.html$ $1/home.php?mod=space&$2=$3 last; rewrite ^([^\.]*)/blog-([0-9]+)-([0-9]+)\.html$ $1/home.php?mod=space&uid=$2&do=blog&id=$3 last; rewrite ^([^\.]*)/(fid|tid)-([0-9]+)\.html$ $1/index.php?action=$2&value=$3 last; rewrite ^([^\.]*)/([a-z]+[a-z0-9_]*)-([a-z0-9_\-]+)\.html$ $1/plugin.php?id=$2:$3 last; if (!-e $request_filename) { return 404; }

  • discuz 分组取第一个aid,并将宽度加1

    选取第一个aid select a.aid from pre_forum_attachment_9 a where width<>801 and aid=(select min(aid) from pre_forum_attachment_9 where tid=a.tid) order by a.tid; 批量将第一张图宽度加1 update pre_forum_attachment_9 set width=width+1 where aid in (234,23423,23423423,234234); 新贴将第一张图宽度加1 update pre_forum_attachment_0 set width=width+1 where filename=’1.jpg’ and tid > 466456; update pre_forum_attachment_1 set width=width+1 where filename=’1.jpg’ and tid > 466456; update pre_forum_attachment_2 set width=width+1 where filename=’1.jpg’ and…

  • discuz标签页默认100的限制如何修改?

    discuz标签页默认100的限制如何修改?

    source/module/misc/misc_tag.php 如下图,改100即可:

  • Discuz X3.3 漏洞修补

    Discuz X3.3 漏洞修补

    1、vi config/config_global.php,修改 $_config[‘cookie’][‘cookiepre’] 的值为任意。 2、vi source/admincp/admincp_setting.php ,将 define(‘UC_DBPW’, ‘”.$ucdbpassnew.”‘)” 修改为 define(‘UC_DBPW’, ‘”.addslashes($ucdbpassnew).”‘)” https://mp.weixin.qq.com/s/eqUYmWJD3OTo_pXOkQdmvQ

  • discuz 编辑图片和附件不能显示问题解决办法

    discuz 编辑图片和附件不能显示问题解决办法

    source/module/forum/forum_image.php $nocache = !empty($_GET[‘nocache’]) ? 1 : 0; 直接改成 $nocache = 0; 直接调用缩略图

  • Discuz的积分计算公式

    总积分是衡量用户级别的唯一标准,您可以在此设定用户的总积分计算公式,其中 posts 代表发帖数 (主题 + 回复数);threads 代表用户发表的主题数;digestposts 代表精华帖数;oltime 代表用户总在线时间(小时);friends 代表好友数;doings 代表发表的记录数;blogs 代表发表的日志数;albums 代表上传的相册数;sharings 代表发表的分享数;extcredits1~extcredits8 分别代表上述 8 个自定义积分。公式中可使用包括 + – * / () 在内的运算符号 默认: 发帖数+精华帖数*5+威望*2+金钱+贡献 表达式: posts+digestposts*5+extcredits1*2+extcredits2+extcredits3 设置: 全局–积分设置–查看积分规则

  • discuz 修改discuz.gtimg.cn http 为 https

    http://discuz.gtimg.cn/cloud/scripts/discuz_tips.js?v=1 修改: source/plugin/manyou/Service/DiscuzTips.php source/plugin/manyou/Service/Doctor.php

  • Discuz 如何删除|替换Powered by Discuz!

    Discuz 如何删除|替换Powered by Discuz!

    找这个文件\template\default\common\header_common.htm (linux下是 template/default/common) 找到这串代码: $navtitle – $_G[‘setting’][‘bbname’] – Powered by Discuz!

  • 巧设Discuz!阅读区域宽度及帖内图片最大宽度

    Discuz!是康盛创想(Comsenz)公司发布的一款论坛BBS建站产品。目前最新版本是Discuz! 7.2。本期教程笔者为大家讲解Discuz!论坛”阅读区域宽度”及”帖内图片最大宽度”的功能设置。 “阅读区域宽度”指的是帖子内容中的文字内容的宽度,如Fig.1中所示”C. 阅读区域宽度”。 注意: 1. 该设置是在”系统设置→界面→风格管理→(当前使用的风格)→编辑→切换到高级模式→阅读区域宽度 {CONTENTWIDTH}。 2. (1) 如果填入一个确切的数值,例如填入:700px,那么帖内文字内容的宽度不会超过700px; (2) 如果填入一个百分比数值,例如填入:90%,那么帖内文字内容的宽度是该宽度占”B. 主体表格宽度(A)-用户信息宽度”的90%。 “帖内图片最大宽度”指的是帖子内容中插入的图片(组图除外)的最大宽度,超过此宽度的图片将会自动缩放,如Fig.1中所示”D. 帖内图片最大宽度”。 注意: 1. 该设置在”系统设置→界面→界面管理→帖子内容页→帖内图片最大宽度。 2. 此项设置如果要设置成功,前提必须”C. 阅读区域宽度”要有设置,否则不管输入多少,系统最初默认就是600px。 3. (1) 如果填入一个确切的数值,例如填入:650px,那么帖内插入的图片宽度最大不会超过650px; (2) 如果填入一个百分比数值,例如填入:90%,那么帖内插入的图片宽度最大是该宽度占”B. 主体表格宽度-用户信息宽度”的90%。 4. 不管3.中你怎么设置,你必须先完成2.中的设置。 PS:对于帖子右侧有广告的话,B的公式是:主体表格宽度(A)-用户信息宽度。 注:部分领主调整阅读区域宽度时输入错误百分比,导致贴内发帖时间无法显示,请将你设置的百分比更换为具体数值。

  • discuz如何设置帖内阅读区域宽度和图片的大小

    一、设置帖内阅读区域宽度 Discuz! 7.1 默认的帖内文字阅读区域是 600px ,当用户发表一篇字数比较多的文章时,为了避免文章行数较长,占用的页幅较大,管理员可以调整帖内文字的阅读区域,使每行显示的字数变多,这样可以使文章的页幅缩短,在视觉上更容易阅读。 另外,现在有很多人使用宽屏显示器,有些站长在建站时,会适当地把论坛的主表格放宽,在主表格的宽度增加后,如果不增加阅读区域宽度会看上去不协调。 下面是调整阅读区域的方法: 进入系统设置 => 界面 => 风格管理 选中正在使用的风格,点”编辑” 在风格编辑中选择”切换到高级模式”,找到阅读区域宽度的设置项,填写想要调整的宽度,可以是整数,也可以是百分比。需要注意的是,这里填写数字时后面一定要写好单位 px ,否则此宽度的设置只对图片有效,对文字无效;百分比指的是阅读区域宽度和主表格宽度的百分比。 更改后,请更新缓存,这样设置才能生效 二、设置帖内图片大小 Discuz! 7.1 中默认帖内图片最大宽度是 600 ,当用户需要在发表的帖子内发表宽度大于 600 的图片时,可以把图片显示宽度放大,防止图片被压缩导致失真。 帖内图片显示大小受”帖内图片最大宽度”和”阅读区域宽度”的双重约束,所以在设置时必须同时设置这两项,并注意阅读区域宽度要大于等于帖内图片最大宽度,否则会以阅读区域的宽度为标准显示图片。 阅读区域宽度的设置已经在上面介绍过了,下面是设置帖内图片最大宽度的方法: 进入系统设置 => 界面 => 界面设置 => 帖子内容页 => 帖内图片最大宽度

  • 一篇2006年的HYIP站点统计,没准哪天就没了

    Invest-Tracing.com Money Maker Forum Our Community Info Center => International Forums => China => Topic started by: admin on October 07, 2006, 12:52:06 PM Title: HYIP信息站点 Post by: admin on October 07, 2006, 12:52:06 PM 一.国外的一些HYIP信息资源站 : 1.主要的投资列表(Listing)站: gold-hosting:很有名的站点,也可以说相当权威,但是更新速度不快,靠Listing费维持,广告众多 地址:http://www.gold-hosting.com hyipmonitor:界面与众不同,比较清爽,但站点数目不多 地址:http://www.hyipmonitor.com hyipmax:站长给每个HYIP站点都作了论坛,但是好像没什么人去,也是靠Listing费维持的 地址:http://www.hyipmax.com myhyip:新手去的最多的list,广告价格也因此相当高,新站点很多,但是很多都是那种稍纵即逝的小骗子,可能只是想骗骗新手吧,但其中也有很多好站点,总之特点是信息量大。大浪淘沙! 地址:http://www.myhyip.com hyipinvestment:也是一个适合新手的地方,里面对于HYIP的介绍很有意思,值得一看!站点数目也很多! 地址:http://www.hyipinvestment.com chinagreat:黄金俱乐部站长Salty的网站,主要是基于他自己的搜索与研究。个人以为,Salty为人不错,投资风格属于稳健型,喜欢稳定的朋友可以参考,会有收获! 地址:http://www.chinagreat.cn realrating:站点不多,且基本上都是其他站点的热门站,时间不多的话就可以不去了 地址:http://www.realrating.com/index.php worldhyip:论坛由中文区,但人气不行,有自己的邮件列表服务,每周会有新的站点通讯,还挺不错! 地址:http://www.worldhyip.com ratehyip:说实话,他的论坛比他的站点火爆,也只是个一般的站点…

  • PHP必配参数

    现在很多网站都在使用着CMS,而目前大部分CMS都是PHP语言编写的。awspack也是用CMS WordPress搭建的,众所周知WordPress也是PHP语言编写的。 在这里简单介绍一下,安装PHP以后必须配置的几个参数。 date.timezone 安装PHP以后可以什么都不配,但是data.timezone这个参数是必须配的。 不然有可能报以下错误。 PHP Warning: phpinfo: It is not safe to rely on the system’s timezone settings. You are *required* to use the date.timezone setting or the date_default_timezone_set function. In case you used any of those methods and you are still getting this warning, you most likely misspelled the timezone identifier. 可以配Asia/Chongqing…

  • 10大网络爬虫工具

    爬虫,即网络爬虫,是一种自动获取网页内容的程序。是搜索引擎的重要组成部分,因此搜索引擎优化很大程度上就是针对爬虫而做出的优化。 网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。聚焦爬虫的工作流程较为复杂,需要根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。然后,它将根据一定的搜索策略从队列中选择下一步要抓取的网页URL,并重复上述过程,直到达到系统的某一条件时停止。另外,所有被爬虫抓取的网页将会被系统存贮,进行一定的分析、过滤,并建立索引,以便之后的查询和检索;对于聚焦爬虫来说,这一过程所得到的分析结果还可能对以后的抓取过程给出反馈和指导。 世界上已经成型的爬虫软件多达上百种,本文对较为知名及常见的开源爬虫软件进行梳理,按开发语言进行汇总。虽然搜索引擎也有爬虫,但本次我汇总的只是爬虫软件,而非大型、复杂的搜索引擎,因为很多兄弟只是想爬取数据,而非运营一个搜索引擎。 Java爬虫 1、Arachnid Arachnid是一个基于Java的web spider框架.它包含一个简单的HTML剖析器能够分析包含HTML内容的输入流.通过实现Arachnid的子类就能够开发一个简单的Web spiders并能够在Web站上的每个页面被解析之后增加几行代码调用。 Arachnid的下载包中包含两个spider应用程序例子用于演示如何使用该框架。 特点:微型爬虫框架,含有一个小型HTML解析器 许可证:GPL 2、crawlzilla crawlzilla 是一个帮你轻松建立搜索引擎的自由软件,有了它,你就不用依靠商业公司的搜索引擎,也不用再烦恼公司內部网站资料索引的问题。 由 nutch 专案为核心,并整合更多相关套件,并卡发设计安装与管理UI,让使用者更方便上手。 crawlzilla 除了爬取基本的 html 外,还能分析网页上的文件,如( doc、pdf、ppt、ooo、rss )等多种文件格式,让你的搜索引擎不只是网页搜索引擎,而是网站的完整资料索引库。 拥有中文分词能力,让你的搜索更精准。 crawlzilla的特色与目标,最主要就是提供使用者一个方便好用易安裝的搜索平台。 授权协议: Apache License 2 开发语言: Java JavaScript SHELL 操作系统: Linux 项目主页: https://github.com/shunfa/crawlzilla 下载地址: http://sourceforge.net/projects/crawlzilla/ 特点:安装简易,拥有中文分词功能 3、Ex-Crawler Ex-Crawler 是一个网页爬虫,采用 Java 开发,该项目分成两部分,一个是守护进程,另外一个是灵活可配置的 Web 爬虫。使用数据库存储网页信息。 授权协议: GPLv3 开发语言: Java 操作系统: 跨平台 特点:由守护进程执行,使用数据库存储网页信息 4、Heritrix…

  • 搭建另类论坛网站的cms选型

    搭建另类论坛网站的cms选型

    不用看了,都倒闭了