Google Search Central
前言:
google的搜索方式:
Google 是一款全自动搜索引擎,会使用名为“网页抓取工具”的软件定期探索网络,以找出可添加到 Google 索引中的网站。实际上,Google 搜索结果中收录的大多数网站都不是手动提交的,而是我们的网页抓取工具在探索网络时找到并自动添加的。
Google 搜索的工作流程主要分为三个阶段:
- 抓取:Google 会使用名为“抓取工具”的自动程序来搜索网络,以查找新网页或更新后的网页。Google 会将这些网页的地址(即网址)存储在一个大型列表中,以便日后查看。我们会通过许多不同的方法来查找网页,但主要方法是跟踪我们已知的网页中的链接。
- 编入索引:Google 会访问通过抓取得知的网页,并会尝试分析每个网页的主题。Google 会分析网页中的内容、图片和视频文件,尝试了解网页的主题。这些信息存储在 Google 索引中,而 Google 索引是一个存储在海量计算机中的巨大数据库。
- 呈现搜索结果:当用户执行 Google 搜索时,Google 会尝试确定最优质的搜索结果。“最佳”结果取决于许多因素,包括用户的位置、语言、设备(桌面设备或手机)以及先前用过的查询。例如,在用户搜索“自行车维修店”后,Google 向巴黎用户显示的答案与向香港用户显示的答案有所不同。Google 不会通过收取费用来提高网页排名,网页排名是完全依靠算法完成的。
Google 搜索运作方式的深度指南
在深入了解 Google 搜索的运作方式之前,请务必注意,Google 不会通过收取费用来提高网站抓取频率或网站排名。任何与此不符的消息均是子虚乌有。
Google 不保证一定会抓取您的网页、将其编入索引或在搜索结果中显示您的网页,即使您的网页遵循 Google 搜索要素也是如此。
Google 搜索的 3 个阶段简介
Google 搜索的工作流程分为 3 个阶段,并非每个网页都会经历这 3 个阶段:
- 抓取:Google 会使用名为“抓取工具”的自动程序从互联网上发现各类网页,并下载其中的文本、图片和视频。
- 索引编制:Google 会分析网页上的文本、图片和视频文件,并将信息存储在大型数据库 Google 索引中。
- 呈现搜索结果:当用户在 Google 中搜索时,Google 会返回与用户查询相关的信息。
抓取
第一阶段是找出网络上存在哪些网页。不存在包含所有网页的中央注册表,因此 Google 必须不断搜索新网页和更新过的网页,并将其添加到已知网页列表中。此过程称为“网址发现”。由于 Google 之前已经访问过某些网页,因此这些网页是 Google 已知的网页。当跟踪已知网页上指向新网页的链接时,Google 会发现其他网页,例如类别网页等中心页会链接到新的博文。当您以列表形式(站点地图)提交一系列网页供 Google 抓取时,Google 也会发现其他网页。
Google 发现网页的网址后,可能会访问(或“抓取”)该网页以了解其中的内容。我们使用大量计算机抓取网络上的数十亿个网页。执行抓取任务的程序叫做 Googlebot(也称为抓取工具、漫游器或“蜘蛛”程序)。Googlebot 使用算法流程确定要抓取的网站、抓取频率以及要从每个网站抓取的网页数量。Google 的抓取工具也经过编程,确保不会过快地抓取网站,避免网站收到过多请求。此机制基于网站的响应(例如,HTTP 500 错误意味着“降低抓取速度”)和 Search Console 中的设置。
但是,Googlebot 不会抓取它发现的所有网页。某些网页可能被网站所有者设置为禁止抓取,而其他网页可能必须登录网站才能访问。
在抓取过程中,Google 会使用最新版 Chrome 呈现网页并运行它找到的所有 JavaScript,此过程与浏览器呈现您访问的网页的方式类似。呈现很重要,因为网站经常依靠 JavaScript 将内容引入网页,缺少了呈现过程,Google 可能就看不到相应内容。
能否抓取取决于 Google 的抓取工具能否访问网站。Googlebot 访问网站时的一些常见问题包括:
- 服务器在处理网站时出现问题
- 网络问题
- robots.txt 规则阻止 Googlebot 访问网页
索引编制
抓取网页后,Google 会尝试了解该网页的内容。这一阶段称为“索引编制”,包括处理和分析文字内容以及关键内容标记和属性,例如
在索引编制过程中,Google 会确定网页是否与互联网上的其他网页重复或是否为规范网页。 规范网页是可能会显示在搜索结果中的网页。为了选择规范网页,我们首先会将在互联网上找到的内容类似的网页归为一组(也称为聚类),然后从中选择最具代表性的网页。该组网页中的其他网页可作为备用版本在不同情况下提供,例如用户在移动设备上进行搜索时,或他们正在查找该组网页中的某个具体网页时。
Google 还会收集关于规范网页及其内容的信号,这些信号可能会在下一阶段(即在搜索结果中呈现网页)时用到。一些信号包括网页语言、内容所针对的国家/地区、网页易用性等。
所收集的关于规范网页及其网页群组的相关信息可能会存储在 Google 索引(托管在数千台计算机上的大型数据库)中。我们无法保证网页一定会编入索引;并非 Google 处理的每个网页都会编入索引。
是否会编入索引还取决于网页内容及其元数据。一些常见的索引编制问题可能包括:
- 网页内容质量低
- Robotsmeta规则禁止编入索引
- 网站的设计可能使索引编制难以进行
呈现搜索结果
Google 不会通过收取费用来提高网页排名,网页排名是程序化地完成的。 详细了解 Google 搜索结果中的广告。
用户输入查询时,我们的机器会在索引中搜索匹配的网页,并返回我们认为与用户的搜索内容最相关的优质结果。相关性是由数百个因素决定的,其中可能包括用户的位置、语言和设备(桌面设备或手机)等信息。例如,在用户搜索“自行车维修店”后,Google 向巴黎用户显示的结果与向香港用户显示的结果有所不同。
根据用户的查询,搜索结果页上显示的搜索功能也会发生变化。例如,如果您搜索“自行车维修店”,系统可能会显示本地搜索结果,而不会显示图片搜索结果;不过,搜索“现代自行车”更有可能显示图片搜索结果,但不会显示本地搜索结果。您可以在我们的视觉元素库中探索 Google 网页搜索中最常见的界面元素。
Search Console 可能提示您某个网页已编入索引,但您在搜索结果中看不到该网页。这可能是因为:
- 网页内容与用户查询无关
- 内容质量低
- Robotsmeta规则阻止提供内容
虽然本指南介绍了 Google 搜索的运作方式,但我们一直在努力改进算法。 您可以关注 Google 搜索中心博客,及时了解这些更改。
google搜索要素
Google 搜索要素指南涵盖了让您的网络内容(网页、图片、视频或者 Google 在网络上发现的其他公开内容)可以显示在 Google 搜索结果中并获得良好排名须满足的几大核心要求:
- 技术要求:网页要显示在 Google 搜索结果中须满足的 Google 最低要求。
- 网络垃圾政策:可能导致网站排名较低或完全无法显示在 Google 搜索结果中的行为和策略。
- 关键最佳实践:有助于改善您的网站在 Google 搜索结果中呈现效果的主要措施。
不管他人怎么说,将您的网页显示在 Google 搜索结果中无需花费任何费用。需要注意的是,网页满足所有这些要求并遵循这些最佳实践,并不表示 Google 一定会抓取其内容、将其编入索引或呈现给用户。详细了解 Google 搜索的运作方式。
技术要求
技术要求涵盖了 Google 搜索规定的、网页要显示在搜索结果中须满足的最低要求。实际上,您几乎不用对网页执行任何技术性修改;大多数网站甚至没有留意过技术性指南,就已满足技术要求。
网络垃圾政策
网络垃圾政策详细介绍了可能导致网页或整个网站排名较低或完全无法显示在 Google 搜索结果中的行为和策略。专注于为用户提供优质内容和良好体验并遵循我们原则的网站在 Google 搜索结果中更有可能有良好表现。
关键最佳实践
虽然您可以通过多项措施来改善网站的搜索引擎优化 (SEO) 效果,但以下几种核心做法可能会对您的 Web 内容在 Google 搜索结果中的排名和呈现效果产生最大的影响:
- 创建实用、可靠、以用户为中心的内容。
- 了解用户查找您的内容时所用的字词,并将这些字词放置在网页中的显眼位置,例如网页的标题和主要标题以及其他说明性内容(如替代文本和链接文本)。
- 确保链接可供抓取,以便 Google 可以通过网页上的链接发现您网站上的其他网页。
- 向他人推广您的网站。积极参与社区活动,向那些志趣相投的人介绍您网站上提及的服务和产品。
- 如果您有其他内容,如图片、视频、结构化数据 和 JavaScript,请确保您遵循了针对这些内容的特定最佳实践,以便我们也能了解网页的这些部分。
- 启用适合您网站的各项功能,增强网站在 Google 搜索结果中的呈现效果。
- 如果您不希望某些内容显示在搜索结果中,或者想完全阻止 Google 抓取网页,请通过相应方法控制您的内容在 Google 搜索结果中的呈现效果。
精确搜索
简单有效的方法就是在关键词上加上_双引号_, 这样搜索引擎只会返回和关键词完全吻合的搜索结果.
在不加双引号的情况下,有的时候, 两个词中间加一个空格, 它会分别搜索两个词, 可能返回的结果不是我们想要的结果.
排除关键词
如果想要的不是自己想要的结果, 可以使用 - 这个减号即可对指定内容进行排除.
用 OR (或)逻辑进行搜索
在默认搜索下, 搜索引擎会反馈所有和查询词汇相关的结果, 如果通过_OR_ 搜索, 可以得到和两个关键词分别相关的结果, 而不仅仅是和两个关键词都同时相关的结果.
同义词搜索 ~
在未能准确判断关键词的情况下,你可以通过 ~ 进行同义词搜索。
**站内搜索 **
在输入框输入 site: 网址 关键字 就会在输入的网址内进行站内关键字搜索
善用 * 星号
搜索是可以使用 * 星号填补缺失的部分.
在两个数值之间进行搜索
在两个数值之间进行搜索 ,数值之间的符号是两个英文句号加一个空格.
在网页标题, 链接和主体中搜索关键词
标题是输入完 intitle 就有的备选选项, 索性就用这个了, 如果是想匹配标题关键字是 intitle: ,如果想匹配网址链接 inurl: , 如果是主体的话是 intext: . 比如你可以试试 intitle: 评测 .
搜索相关网站
Search images of a particular size with imagesize:
Search for a particular filetype with filetype:
Filter out searches with AFTER:, BEFORE: or … between two numbers
Check out related websites using related:
查看相关网站
Use cache: to see Google’s cached version of a website
查看网站缓存版本