资源搜
资源搜
👀 联系夏柔
🔥 投稿源码
资源搜

资源搜

  • 全部
  • 123盘
  • 阿里盘
  • 百度云
  • 迅雷
  • 夸克
  • 115
  • 蓝奏云
  • 其他
已收录34128条资源,仅供学习交流,请在24h内删除资源!

WordPress自动采集发布插件:Crawling1.0【附带教程】

一、写在前面   首先声明一下,我其实并不是搞PHP的,写代码一般都是用的C++和Python。对于PHP,只是很多年前自己做博客写了几天。最近换工作等着离职,没事做,所以写个插件玩玩。如果觉得不好用的地方,请给我些建议。好的建议我会采纳,争取把这个插件做得更好。   在开发这个插件的时候,已经考虑到了尽量让配置更简单易懂。但是为了使插件更灵活,所以还是需要了解一下正则和xpath规则。如果你懂,我相信这个教程一你看就会明白了,完全没有什么难度。如果你之前没有接触过正则和xpath也没关系,因为其实真的不需要懂,只要看例子copy就行了。因为是第一个版本,所以可能有些地方写的不太详细,欢迎大家指出来。   二、下载和安装   首先,打开http://crawling.cn下载最新版,得到crawling_v*.tar.gz。   然后,解压压缩包,上传到wordpress插件目录。激活插件。   三、任务管理   一个任务可以理解为一个爬虫,在这里你可以配置多个任务,每个任务可以单独设置参数。   比如,这里我设置了三个任务,如图:   第一个任务是爬取“且听风吟”(这是我比较喜欢的一个电影网站)的全部内容,抓取间隔设置为-1表示只采集一次,不会重复执行。   第二个任务是爬取“且听风吟”的前三页,如果采集过的不会重复采集,只会抓取前三页的更新的内容。每隔24小时采集一次。   第三个任务是爬取“阳光电影网”(这是电影天堂的新网站)的首页的全部更新的电影,因为阳光电影所有的更新都在首页。每隔24小时采集一次。   每个任务单独设置的参数,如图:   下面是每个任务的设置: 1 任务名称:   每隔任务的别名,方便好记而已,没有其他作用。 2 入口网址:   每个任务爬虫开始的地址。这个网址一般是首页或者列表页。然后爬虫会从这个页面开始采集。 3 爬取间隔时间:   每隔任务(爬虫)运行的间隔时间。 4 列表页面url正则/内容页面url正则:   爬虫进入第一个网址(入口网址)后需要区分哪些是需要采集的内容页面。所以需要设置匹配的内容页面url正则表达式。   爬取还需要知道如何进行翻页,寻找更多的内容页面,所以需要设置列表页面url的正则表达式。   例如:抓取“且听风吟”整站的内容   打开网站首页www.qtfy.cc。发现所有的列表页面网址都为http://www.qtfy.cc/page/数字,而内容页面网址都为http://www.qtfy.cc/ysyl/数字.html   列表页面   内容页面   所以正则表达式如下:   列表页面url正则:/page/[1-9]d*$ 内容页面url正则:/[1-9]d*.html$   如果只需要采集前三页更新的内容,只需要把列表页面的正则表达式改为/page/[1-3]$。   配置这两个参数时可以打开《正则表达式在线测试》页面测试。 5 文章标题(xpath)/文章内容(xpath):   进入内容页面后,爬虫要选择抓取的内容,比如文章的标题和文章的正文。所以需要设置xpath来告诉爬虫。   例如:   打开且听风吟的一个页面,如:http://www.qtfy.cc/ysyl/14352.html。通过浏览器查看页面源代码,如图:   可以看到,文章的标题是包含在   这个元素中的元素中的。所以标题的xpath规则为://h1[@class=”mscctitle”]/a 同样,通过上图可以看见:内容是包含在   中的,所以内容的xpath规则为://div[@class=”content-text”]   配置完成可以打开《XPath在线测试》页面测试。   6 内容起始字符串/内容结束字符串:   一般的网站都会有广告,或者一些其他的东西混在内容里面,所以我们需要过滤掉这些内容,只保存我们需要的部分。而这部分无用的东西(广告、分享按钮、标签等)大部分都是在文章的开头或者结束部分,并且内容是固定的。所以我们可以通过简单的字符串过滤掉。   例如《且听风吟》的每篇文章的内容部分开头就有一段广告,如上图。   通过《XPath在线测试》页面测试我们上一步配置的内容xpath规则,可以得到文章内容,如下图:   可以看到,真正的内容是从   之后开始的。   所以内容起始字符串设置为:   因为文章内容后面并没有多余的部分,所以后面不用过虑,内容结束字符串设置为空就可以了。 7 文章图片:   采集插件可以自动将文章内出现的图片保存到本地,默认按年月分文件夹保存,并会将图片的标签设置为文章的标题。如果不需要保存到本地可以选择“不做处理”。 8 文章分类:   选择要保存到的分类,和wordpress一样,可以选择多个分类。 9 文章标签:   每个任务可以单独设置标签,多个标签用|分隔。 10 发布方式:   可以选择“立即发布”或者“放入草稿箱”。   四、高级选项 爬取线程数:   这个选项根据自己的主机配置来设置。如果是在独立主机上,可以设置成多线程采集,比如同时开10个线程。如果是在虚拟主机上,不要设的太大,不然CPU占用太高被封站。 抓取延时:   每个页面采集过后的延时,防止采集过快。这个参数也是为了防止网站虚拟主机和被采集网站因为采集太快而禁止访问。   五、最后   配置完之后,剩下的就是等待插件执行了,如果执行到一半想要终止程序,可以切换插件运行状态,在“任务管理”页面的顶部。
源码当先
百度云
百度云

wordpress插件:Foxpay9.4免授权版+前端用户中心源码+支付宝免签约即时到帐辅助

最新Foxpay 9.4收费下载资源Wordpress插件+前端用户中心源码,可以给你的用户分享一些收费资源,wordpress插件(Foxpay),经过完美测试运行于wordpress 3.0.1-4.3版本。 本插件特点:高级VIP会员系统,银联/支付宝担保/贝宝paypal支付系统,前端注册和个人资料管理、查看订单信息等,推广提成系统,收费下载系统,下载加密。 基本功能: 已经在程序中集成支付宝(担保交易/双功能接口/即时到帐)、银联、paypal、财付通、微信支付 集成mycred积分插件(另付费功能) 充值卡充值(管理员后台生成充值卡卡号卡密,可以放在第三方自动发卡平台出售,然后购买用用卡密来进行网站充值)(另付费功能) 支付宝转账付款(适合没有支付宝接口用户) 设置会员提现手续费比率 设置安全模式(使支付宝担保交易无法充值成功,即时到帐可充值成功) 设置支付宝异步处理订单 设置用户推广提成比率 设置货币昵称(例如:模板币) 设置充值比例(例如:1元=10模板币) 查询消费记录 查询充值记录 查看与处理取现申请列表 查看全部收益与推广 推广用户消费获得提成(这对管理员没必要) 站内转账 商品列表,ajax修改价格 用户充值与扣费 查询用户余额、充值记录、消费记录 发布收费下载资源(支持外链,可设置解压密码,通过email发送给购买用户) 发布收费查看内容 在消费清单中下载资源 管理与、投稿者、订阅者权限分配(以上某些功能是管理员专有权限) 前端短代码调用 其他功能: 下载路径加密(内链) 申请提现 VIP会员(包月、包季、包年、永久)特权(VIP专享、VIP半价、VIP八折、VIP免费) 一次购买,永久下载 colorbox灯箱弹窗特效 前端个人中心(可直接充值、查看消费等)
源码当先
百度云
百度云

Wordpress采集插件:wp-autopost-pro文章采集插件破解版——无域名功能限制+自动采集发布+支持WP4.9【附使用教程】

文章采集插件专业版——一款超好用的wordpress文章自动采集发布插件,无任何域名、功能限制,完美运行于最新的 WordPress 4.5 - 4.9之间的版本,请放心使用。 使用说明 1. 【注意】采集的时候请开启采集任务基本设置里的【自动摘要】,否则容易造成采集失败。 2. 建议不要一次性采集过多任务,可能造成服务器卡顿。 3. 建议不采集的任务先暂时关闭,等要采集时再开启,不然对服务器的压力大。 【友情提示】如果出现采集错误请点下采集插件里的选项按钮再点下重置按钮即可!
源码当先
百度云
百度云

Wordpress站点地图生成插件 mk-sitemap v1.0.1

本插件无需任何设置,直接在 WordPress 后台上传并启用即可。每次发表、修改、或删除文章时,会自动触发更新站点地图的操作,在站根目录生成 sitemap.html 和 sitemap.xml 两个文件。 常见问题 无法生成站点地图 请给予站点根目录写权限(sitemap.html、sitemap.xml)。 没有自动更新站点地图 因为生成的站点地图是静态文件,可能是网站的 CDN 还没刷新引起的。请刷新 CDN 或通过 FTP 检查根目录的站点地图是否已更新。
源码当先
百度云
百度云

最新大富SSC二次美化版源码 WAP手机端自适应 完整运营对接采集

开奖出现无限窗口解决方法,删除kj下的Runtime文件夹 开奖配置地址kjappCommonLibapiurls.php 如果使用宝塔搭建,请一定要到伪静态规则里把index.php修改为start.php后保存 后台账号密码:admin/123456 安全码:1234 测试环境:WIN+宝塔+APACHE+PHP5.6+MYSQL5.6+伪静态(必须)
源码当先
百度云
百度云

新PU京整站YLC系统完整数据版源码+WAP端 视讯+电子+CP 内置十多条接口

新-葡京整站YLC系统源码,据说是某包网出品的,不太清楚自行下载看看吧,看着是蛮不错的,内置十多条接口,不过不知道是接的哪家的接口,视讯,电子,CP都是有的,带有WAP手机端,带有后台,数据完整,java语言开发!没有任何教程!
源码当先
百度云
百度云

胜利娱乐源码完整程序服务器直接打包+带聊天室功能+wap源码正常

服务器直接打包出来的,不用怀疑我们的东西少不少,出现问题首先考虑自己是不是哪里错了,而不是想少了东西,我既然没当宝 发出来就不会去删减。解压后3G左右,日志啥的我就都不清除了 这款是一个朋友分享的,花大几千块钱买来的,带有聊天室的完整程序
源码当先
百度云
百度云

最新真人-视讯龙虎赢多多H5源码+完整数据+代理推广+分佣正常

比以往发布的龙虎更牛逼啊,带真人-视讯,H5版本,程序完整,好像是直接打包下来的,带有代理推广等功能,但搭建有一定难度,没有教程,需要自行研究,也别问我怎么搭建,因为我也不会。有能力的自己拿去试试吧!市场价值很高!
源码当先
百度云
百度云

2019最新款彩38完整源码修复20分钟一期 手机版+开奖器+视频搭建教程

20分钟一期 手机版+开奖器+视频搭建教程 不过多介绍了,里面有详细的搭建教程,自己下载观看学习。 后台账号:admin 后台密码:123456 安全码:123
源码当先
百度云
百度云

WordPress图片主题 国人原创轻拟物风格niRvana主题破解版1.5.5

源码描述: 主题特色:HTML5、CSS3 使用标准语言编写,支持IE10以上浏览器响应式 在桌面、平板、手机端均以最佳状态显示回复下载 可强制要求用户评论文章后才提供下载地址内容回复可见 指定某些内容需要读者评论后才可查看,让读者与你互动侧边栏小工具 边栏数量可自定义、完全使用WP官方的小工具模型,开发了更多适合本主题的小工具语音朗读 使用百度语音合成技术来为您阅读文章评论表情 本主题自带评论表情功能,无需插件在后台即可设置瀑布流 文章列表可选择卡片或列表排序,其中卡片又可设置为普通或瀑布流形式不刷新加载 全局提供ajax加载文章打赏 允许通过多种途径打赏,如:支付宝二维码、微信二维码、Paypal链接点赞 每篇文章均提供点赞功能,可展示访客最喜欢的文章列表(后台可以修改点赞数据) 内容来自菜鸟源码 生成封面二维码 每篇文章均可生成二维码用于分享到微信等社交平台 解压密码:cnmmm.com_a9sf98s78f7u394utu349t34
源码当先
百度云
百度云
⬅️ 1...27202721272227232724...2921

添加微信,反馈问题

微信及时反馈问题,方便沟通,请备注 ❤️

搜索榜单

1

骚老板资源网整站源码 打包数据高达2GB

683

2

(自适应手机版)响应式餐饮美食企业网站源码 餐饮品牌连锁机构织梦模板

578

3

绿色风格网络公司源码 php网络建站公司源码

558

4

Zblog仿918回忆模特写真网带整站数据图库系统源码

451

5

一款笑话类网站源码 简约清爽的织梦笑话网站模板

394

6

【梦幻XY单机服务端】梦幻古龙一键安装游戏客户端附安装搭建教程工具

352

最新资源

1

网狐系列529娱乐U3D电玩游戏组件

2

牛王大联盟无授权组件+机器人+UI解密可二开 附视频教程

3

集结号海螺捕鱼游戏源码+搭建工具文档

4

网狐荣耀/kk娱乐完整组件

5

网狐创胜系列/通用过授权文件+使用教程

6

网狐电玩系列/乐游电玩城/免微信免短信登陆

友情链接:
免费APISSL在线检测在线pingAPI版本项目 查看更多
网站地图 法律声明
本站所存储的源码数据均为转载,不提供在线播放和下载服务。本站为非盈利性,不收取费用,所有内容不用于商业行为,仅供学习交流使用。如有侵权,请联系15001904@qq.com
  • 联系微信,反馈问题

  • 点此立刻反馈