我们很高兴宣布 尖叫 青蛙 SEO Spider 22.0版,内部为“膝盖深”。
该版本包括基于用户反馈的更新,以及基于我们 先前版本 中介绍的基础建立的令人兴奋的新功能。
因此,让我们看一下新功能。
1)语义相似性分析
现在,您可以在爬网中分析页面的语义相似性,以帮助检测站点上的重复,相似且潜在的偏离,较少相关的内容。

中找到的页面上的匹配文本 这超出了在我们重复的内容检测 ,该页面是利用LLM嵌入,即捕获单词的语义含义和关系。
这使得可以用不同的短语但重叠的主题识别类似的页面,从而多次涵盖相同的主题,这可能会导致爬行和索引中的同类或效率低下。
查看Mike King在矢量嵌入的文章 如果您不熟悉嵌入,那么您只需要 。许多SEO受到了激励,以实验和构建各种工具。
使用我们现有的AI提供商集成通过“ config> api access> ai”(包括 OpenAI , Gemini & Ollama ),您可以捕获页面的矢量嵌入。
现在,您可以通过“ config> content>“嵌入”进行语义内容分析,语义搜索和可视化启用其在SEO蜘蛛中的使用。
当爬网完成并 爬网分析后,将在“内容”选项卡中填充“语义相似”和“低相关内容”过滤器。 进行
请参阅有关配置嵌入的用户 指南 。
语义上相似的页面
内容选项卡和“ 语义上相似 ”过滤器将显示每个URL的最接近语义相似地址,以及语义上相似的语义相似性评分和数量。
较低的“重复细节”选项卡和“语义相似性”过滤器将显示所有语义上相似的URL以及所分析的内容。
语义相似性得分范围为0 - 1。分数越高,与最接近语义相似地址的相似性越高。
默认情况下,评分高于0.95的页面在语义上被认为是相似的。语义相似性阈值可以通过“ config> content>“嵌入”至低至0.5调整。
低相关内容
与整体内容主题相比,通过平均所有爬行页面的嵌入以识别“质心”,矢量嵌入也可用于检测与总体内容主题相比潜在偏离主题的页面。
在Google泄漏中暗示了嵌入页面嵌入与网站嵌入的偏差,SEO一直在使用此概念来查找离群值。
离群值距平均水平最远,并且可能表明相关性低,比该网站上其他地方发布的内容“更多”。
”过滤器下可以看到阈值以下的页面 在“内容”选项卡和“低相关内容 。
在我们的网站上,这建议了围绕奥运会的博客内容来到亨利(Henley),这是一篇有关孕产妇之后重返工作岗位的文章和我们的登录页面作为离群值,与该网站上更具技术性SEO的其余内容相比。
虽然我们不会删除这些页面,但公平建议这些页面的内容偏离了网站的通常重点。
完整教程 阅读我们有关如何识别语义上相似的页面和离群值的 。
语义相似性分析不仅可以用于检测复制物和低相关内容,例如:
改进内部链接 - 较低的“重复细节”选项卡和“语义相似性”过滤器可用于改善语义相似内容之间的内部链接。重定向的URL映射 - 抓取旧网站和新网站,并根据重定向的页面文本获取最接近语义相似的URL列表。任何元素的语义相似性分析 - 选择“页面标题”而不是嵌入的“页面文本”,并运行语义上相似的分析以查找附近的重复标题。我们很高兴看到使用这种新功能的不同用例和方式,这将激发工具内的演变。
2)语义内容集群可视化
内容群集图可通过“可视化>内容群集图”获得。这是从爬网中对URL的二维可视化,并从嵌入式数据中绘制和聚集。
它可用于识别网站内容中的模式和关系,其中语义上相似的内容聚集在一起。
上面的示例图突出了动物网站的语义关系。令人着迷的是,语义如何模仿动物分类学 -
老虎种群紧密地分组在一起,最近的邻居与 老虎和狮子之间的利格 混合体,然后是其他大猫,例如豹子,美洲虎,猎豹作为下一个邻居等。
这些图对于可视化站点上内容簇的规模可能很有用,或者识别具有语义相关但可能遥远地集成的用户的潜在局部簇。
在上面的图中,您可以轻松地看到不同部分的规模,例如BBC上的食谱。
您还可以发现与图表边缘其他节点隔离的离群值,例如我们网站之前提到的。
COG允许您调整采样,尺寸缩小,聚类和使用的配色方案。内容群集图还可以与细分段一起使用,因此您可以在一个特定区域或站点的一个部分中可视化内容。
我们计划将这些图表用爬网数据称赞,以获取更多见解。
3)语义搜索
有一个新的右手“ 语义搜索 ”选项卡,它使您可以输入搜索查询,并在爬网中查看最相关的页面。
此功能向量搜索查询,并使用矢量嵌入而不是关键字计算爬网中查询和页面之间的余弦相似性。
它可以帮助量化内容与爬网中所有页面的查询的相关性,并且更类似于现代搜索引擎和LLMS今天返回内容的方式,而不是更简单的关键字存在和匹配文本中的内容。
该功能可用于查找关键字映射的相关页面,内部链接的相关页面或针对关键字作为示例的竞争对手分析。
可以将“嵌入式显示”过滤器调整为“ Centroid”,以查看有关网站上发现的异常值的更多详细信息以及最接近整个网站的平均嵌入方式的“最具代表性页面”。
如果您从各种LLMS中拔出嵌入式,则可以调整顶部的过滤器以查看不同的结果。
与启动的其他功能类似,很明显,如何在将来的更新中扩展该功能。
4)AI集成改进
我们为我们的AI集成引入了各种改进,以使其更加先进,灵活,并有助于减少浪费信用和查询。这包括:
多个提示目标
现在,您可以根据提示单击COG并编写更高级的提示,包括多个提示目标元素。
运行特定细分和问题的提示
您可以选择针对符合特定段的URL运行AI提示。这意味着您可以为希望AI提示而不是浪费信用的不同方案设置细分市场。
在高级提示中,您可以选择“匹配段”。
除此之外,您现在可以根据“问题”进行细分。
例如,这意味着您只能为段中的图像URL创建图像alt文本,而不是每个图像,而不是每个图像。
参考网址详细信息
URL详细信息数据现在可以选择在AI提示中使用,以进一步灵活。
自定义端点
现在,您可以自定义OpenAI端点,该端点允许用户启用使用相同结构的私有LLM API和其他AI提供商。
例如,您可以通过自定义端点和使用相关的API密钥来使用DeepSeek,Microsoft Copilot或Grok。
您还可以自定义模型参数,标题和限制页面内容长度,以减少令牌超过长内容页面上的错误。
人类的整合
与OpenAI,Gemini和Ollama的集成类似,您现在可以通过“ config> api访问”与 拟人化 (又称claude)集成,以在爬行时运行AI提示。
生成图像和文字语音
我们为Openai和Gemini提供了一些有趣而综合的图像和文本演讲。例如,这可以用于爬网博客文章,并为每个文章创建一个英雄图像。
SEO蜘蛛将在UI中显示图像或声音预览,您可以扩展或收听。
完整教程 阅读我们有关如何使用AI提示爬网的 。
5)高级列配置器
现在,您可以自定义选项卡,现在您可以使用高级配置器配置列,该列可以允许它们以批量的顺序为单位进行选择,隐藏和调整。
这应该使自定义列减少痛苦。
6)自定义多种远程
“批量导出”菜单下有一个新的“多导出”选项。这使您可以选择任何选项卡,批量导出或报告单击以导出。
如果您使用一套通用报告,或者用于某些网站的特定导出,则可以将其保存为预设,并在UI中手动或调度和CLI时使用它们时使用它们。
这种新功能还使您可以通过手动爬网来运行 Looker Studio的导出 ,而不仅仅是从计划中运行。
7)导出单表/工作簿中的多个选项卡
当您手动或从计划内部进行多个导出多个导出时,您现在可以选择“合并电子表格”。
与其导出每个选项卡,不如将大量导出或报告为单独的文件,而是将所有内容导出到同一单个Google Sheet或Workbook中的多个单独的选项卡。
这均适用于Google Sheets和Excel。
8)下载多个XML站点地图
在 列表模式 下,您可以上传多个XML站点地图,而不是依靠站点索引文件。
9)从Google表下载
在列表模式下,您可以选择源作为Google Sheet地址。 Google表中的所有URL将上传和爬行。
您可以输入Google驱动器详细信息,以便SEO Spider可以访问私人Google表格。
此功能具有令人兴奋的自动化潜力,因为您可以使用Google表(以及相关的附加组件和应用程序脚本)爬行的URL。
这也可以在调度和CLI中使用。
10)获取API数据而无需爬行或重新爬行
有一种新的“ API”模式(“模式> API”),它使您可以上传URL并从任何API中摘取数据 - 而无需涉及任何速度。
此外,还有更多的API改进:
现在,每当您使用连接的API暂停爬网时,右手API选项卡中的“请求API数据”按钮现在将启用,而不仅仅是在完成的爬网末端。按下它将恢复API请求(而不是爬网),从而使您能够同步到目前为止爬网的URL的所有API数据。如果修改GA4/GSC配置,将在配置窗口关闭之前出现一个对话框,询问是否要删除所有现有数据并请求并应用新数据。以前,如果您连接到GA4/GSC,则无法删除数据或重新获取数据。现在可以。现在,您可以右键单击任何URL,并请求任何连接的API(除了GA4/GSC)的数据。如果爬网已经具有现有数据,则将由新请求代替此数据。这些请求将优先于队列中的任何其他请求,这意味着它们应立即在表中显示供用户查看。这适用于您暂停或爬行时。其他更新
版本22.0还包括许多较小的更新和错误修复。
AI提示和自定义JavaScript片段旁边有一个新的“保存”图标,可让您快速将它们保存到库中。现在,所有可视化都可以选择在外部浏览器中打开,这可以提高大规模的性能。现在,将“控制 + shift + c”放在一起,现在将带一个配置差异窗口,以快速发现当前配置和默认值之间的任何差异。现在 MOZ API 已更新为v.3。现在可以与DA,PA和Link Numbers一起使用,例如链接倾向,垃圾邮件分数和品牌权威等指标。现在,您可以选择通过 雄伟的API集成 来吸引信任流程主题。