在 Google 中搜索可见内容

TG Data Set: A collection for training AI models.
Post Reply
rakibhasan
Posts: 203
Joined: Tue Dec 24, 2024 4:57 am

在 Google 中搜索可见内容

Post by rakibhasan »

进行感知检查总是好的。另一种检查 GoogleBot 是否已将您网页上的内容编入索引的快速方法是,只需选择网页上的可见文本,然后在 Google 中执行 site:search 并在上述文本周围加上引号。

在我们的示例中,页面上可见的文本如下……

“无论您从事营销、业务开发还是 IT 工作,您都会感到一种紧迫感。或者可能是机会?”

当我们针对这个确切的短语、针对这个确切的页面执行 site:search 时,我们什么也没有得到。这意味着 Google 尚未索引该内容。


使用工具爬行
现在大多数爬虫工具都 99 英亩数据库 具备爬取 JavaScript 的功能。例如,在Screaming Frog中,您可以前往配置 > 蜘蛛 > 渲染 > 然后从下拉菜单中选择“JavaScript”并点击保存。DeepCrawl和 SiteBulb也都具备此功能。

从这里,您可以输入您的域名/URL,并在您选择的工具完成抓取后查看呈现的页面/代码。

例子:
在尝试回答这个问题时,我倾向于先将域名输入 Google 的移动友好性工具,复制源代码,然后搜索重要的页面元素(例如标题标签、<h1>、正文等)。使用diff checker之类的工具将呈现的 HTML 与原始 HTML 进行比较也很有帮助(Screaming Frog 也有一个可以并排执行此操作的功能)。

对于我们的例子,这是移动友好性工具向我们显示的输出。


经过几次搜索后,很明显这里缺少重要的页面元素。

我们还进行了第二次测试,并确认 Google 尚未对该页面的正文内容进行索引。

此时的含义是 Googlebot 没有按照我们希望的方式看到我们的内容,这是一个问题。

让我们继续看看我们可以向客户推荐什么。
Post Reply