爱站网关键字挖掘爬虫开发教程-采集关键词、长尾词数量、收录数和优

本文主要介绍在神箭手上开发“爱站网关键字挖掘采集爬虫”的过程，爬虫主要实现批量输入关键字并爬取数据的功能，选择性登录功能（登录后爬取的数据更多），爬取字段包括长尾词数量、收录数和优化难度等字段。

爱站网是一个站长们经常使用的工具，是因为其具有长尾关键词挖掘的功能，做SEO的童鞋们都知道它的价值，而且对网站内容生产方向、结构规划，TDK编写都十分有帮助。

使用功能点：

下面，给你详细说明“爱站网关键字挖掘采集爬虫”在神箭手上的开发过程：

步骤1 创建爬虫

点击“新建应用”，选择“爬虫”，点击“下一步”。

输入爬虫名称“爱站网关键字挖掘采集爬虫”，选择“编辑模式”，点击“创建”，神箭手爬虫创建成功。

步骤2 分析网页&开发爬虫

1.“不登录”情况分析

是不是很纳闷，怎么关键字变成一堆数字了？

其实，这是爱站网给你下的绊子，给关键字做了一次处理，不过这点困难阻挡不了我们前进的脚步。右击鼠标，查看“网页源码”，找到encode_unicode_param函数，关键字就是通过此函数进行处理的。

但函数源码并不在此，需要回到查询后的网页，按“F5”刷新网页，在浏览器“开发者工具”中选择“Sources”，找到“script.js?v=0108”文件，就能找到encode_unicode_param函数源码了，这样一来就可以顺利拼出关键词查询链接了，然后你就可以在神箭手爬虫编辑页开发非登录爬虫了。

2.“登录”情况分析

注意：文章结尾有爱站网登录的代码片段。

步骤3 测试并运行爬虫

爬虫开发完成后，点击“测试”按钮，检查爬虫的爬取结果是否正确。

返回爬虫总览页，点击“启动爬虫”，稍等片刻，爬虫就会爬到数据了。如果嫌弃爬虫的爬取速度，要么增加节点，要么优化爬虫代码。

步骤4 数据发布与导出

神箭手上开发的“爱站网关键字挖掘采集爬虫”导出数据示例，如下图所示：

爱站网登录代码片段：

//登录链接

//登录时发送的POST请求参数

var options = {

method: "POST",

data: {

username: username,//用户名

password: password,//密码

code: code//验证码

}

};

//发送登录请求

site.requestUrl(loginUrl, options);

//判断是否登录成功

if (site.getCookie("userSecure")) {

console.log("登录成功！");

return true;

}