分享两个pixiv爬虫项目

  • 2020 年 09 月 11 日
  • 683次
  • 497 字
  • 9 条评论

第一个:前往查看

这是一个基于python写的脚本,适用于linux,当然windows也可以用,不过爬取速度较linux来说要慢,所以建议linux用户使用此方法,windows用户跳到第二个项目,好开始,要先安装python3,如果你已经安装可直接跳到下面看使用说明。

安装python

Ps:Debian 910Ubuntu系统自带Python 3,无需安装,可直接跳到下一步。

#CenOS 6系统
rpm -Uvh https://dl.fedoraproject.org/pub/epel/epel-release-latest-6.noarch.rpm
yum install python34 -y


#CenOS 7系统
rpm -Uvh https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm
yum install python36 -y


#Debian 7、8系统
apt update
apt install python3 -y

安装好python后把脚本下载下来

wget https://raw.githubusercontent.com/MoeClub/Pixiv/master/pixiv.py

宝塔用户可直接用远程下载

使用脚本

SSH进入脚本目录后,按照下面的格式输入,可下载画师作品,排行榜,以及历史排行榜的作品。

#下载画师原图,使用画师UID即可
python3 pixiv.py "673179" 
#下载排行榜原图,使用排行榜地址即可    
python3 pixiv.py "https://www.pixiv.net/ranking.php?mode=male" 

第二个:前往查看

这个项目是使用油猴插件实现,可以说对windows用户很友好了,开源页面也说了,易于使用,非开发者也可简单安装使用。

安装油猴插件

进入greasyfork.org下载对应浏览器的插件


油猴插件下载
请输入图片描述

安装脚本

前往 脚本安装地址,点击安装,然后重新访问改页面可以看到安装变成了重新安装就说明成功安装了脚本,如果当你点击安装后跳出来是让你下载,那就是说明你第一步油猴插件没安装好。


安装脚本
安装脚本

使用

前两步弄好后,你可以去试试,进入页面后可以看到页面最上方会出现会出现一个 载入 ,点击后可直接抓取当前页面的作品,也可以设置过滤,目前确定可以抓取日榜和历史榜单的内容,还有tgas页面的内容,其他的没试,你们可以去试试,当页面上方出现载入选项的时候,就说明脚本可在当前页面执行

pixiv


版权属于:Cat

本文链接:https://www.catct.cn/archives/649.html



—— 收到 9 条评论 ——

    人不可貌相海水不可斗量的意思
    2020 年 11 月 21 日 10:18

    666

    mama官网
    2020 年 11 月 20 日 17:29

    厉害!厉害!厉害!

    2020 年 10 月 13 日 20:00

    博主,如果想要在p站单独保存图,pc端怎么保存原图啊?还是说p站画师上传的图不是原图?在不同地方下载的同一个图片,结果大小不一样

      2020 年 10 月 13 日 20:06

      p站登录下载的才是原图

        2020 年 10 月 13 日 20:14

        登录了的。感觉可能画师上传到p站的就不是原图

          2020 年 10 月 13 日 20:57

          那就不知道了,可能是吧

    2020 年 09 月 14 日 17:40

    我弄好了不显示载入

      2020 年 09 月 15 日 15:31

      或者你可以看下作者提供的教程:http://pxer.pea3nut.org/install

      2020 年 09 月 15 日 15:29

      去油猴管理面板看下脚本是否启用,是否安装了脚本,我这边我测试了下是没有问题的,chrome和火狐都能用

OωO