Google大法好

news2024/11/15 13:47:41

Google Search Central

前言:

google的搜索方式:

Google 是一款全自动搜索引擎,会使用名为“网页抓取工具”的软件定期探索网络,以找出可添加到 Google 索引中的网站。实际上,Google 搜索结果中收录的大多数网站都不是手动提交的,而是我们的网页抓取工具在探索网络时找到并自动添加的。
Google 搜索的工作流程主要分为三个阶段:

  • 抓取:Google 会使用名为“抓取工具”的自动程序来搜索网络,以查找新网页或更新后的网页。Google 会将这些网页的地址(即网址)存储在一个大型列表中,以便日后查看。我们会通过许多不同的方法来查找网页,但主要方法是跟踪我们已知的网页中的链接。
  • 编入索引:Google 会访问通过抓取得知的网页,并会尝试分析每个网页的主题。Google 会分析网页中的内容、图片和视频文件,尝试了解网页的主题。这些信息存储在 Google 索引中,而 Google 索引是一个存储在海量计算机中的巨大数据库。
  • 呈现搜索结果:当用户执行 Google 搜索时,Google 会尝试确定最优质的搜索结果。“最佳”结果取决于许多因素,包括用户的位置、语言、设备(桌面设备或手机)以及先前用过的查询。例如,在用户搜索“自行车维修店”后,Google 向巴黎用户显示的答案与向香港用户显示的答案有所不同。Google 不会通过收取费用来提高网页排名,网页排名是完全依靠算法完成的。

Google 搜索运作方式的深度指南

在深入了解 Google 搜索的运作方式之前,请务必注意,Google 不会通过收取费用来提高网站抓取频率或网站排名。任何与此不符的消息均是子虚乌有。
Google 不保证一定会抓取您的网页、将其编入索引或在搜索结果中显示您的网页,即使您的网页遵循 Google 搜索要素也是如此。

Google 搜索的 3 个阶段简介

Google 搜索的工作流程分为 3 个阶段,并非每个网页都会经历这 3 个阶段:

  1. 抓取:Google 会使用名为“抓取工具”的自动程序从互联网上发现各类网页,并下载其中的文本、图片和视频。
  2. 索引编制:Google 会分析网页上的文本、图片和视频文件,并将信息存储在大型数据库 Google 索引中。
  3. 呈现搜索结果:当用户在 Google 中搜索时,Google 会返回与用户查询相关的信息。
抓取

第一阶段是找出网络上存在哪些网页。不存在包含所有网页的中央注册表,因此 Google 必须不断搜索新网页和更新过的网页,并将其添加到已知网页列表中。此过程称为“网址发现”。由于 Google 之前已经访问过某些网页,因此这些网页是 Google 已知的网页。当跟踪已知网页上指向新网页的链接时,Google 会发现其他网页,例如类别网页等中心页会链接到新的博文。当您以列表形式(站点地图)提交一系列网页供 Google 抓取时,Google 也会发现其他网页。
Google 发现网页的网址后,可能会访问(或“抓取”)该网页以了解其中的内容。我们使用大量计算机抓取网络上的数十亿个网页。执行抓取任务的程序叫做 Googlebot(也称为抓取工具、漫游器或“蜘蛛”程序)。Googlebot 使用算法流程确定要抓取的网站、抓取频率以及要从每个网站抓取的网页数量。Google 的抓取工具也经过编程,确保不会过快地抓取网站,避免网站收到过多请求。此机制基于网站的响应(例如,HTTP 500 错误意味着“降低抓取速度”)和 Search Console 中的设置。
但是,Googlebot 不会抓取它发现的所有网页。某些网页可能被网站所有者设置为禁止抓取,而其他网页可能必须登录网站才能访问。
在抓取过程中,Google 会使用最新版 Chrome 呈现网页并运行它找到的所有 JavaScript,此过程与浏览器呈现您访问的网页的方式类似。呈现很重要,因为网站经常依靠 JavaScript 将内容引入网页,缺少了呈现过程,Google 可能就看不到相应内容。
能否抓取取决于 Google 的抓取工具能否访问网站。Googlebot 访问网站时的一些常见问题包括:

  • 服务器在处理网站时出现问题
  • 网络问题
  • robots.txt 规则阻止 Googlebot 访问网页
索引编制

抓取网页后,Google 会尝试了解该网页的内容。这一阶段称为“索引编制”,包括处理和分析文字内容以及关键内容标记和属性,例如 元素和 Alt 属性、图片、视频等。
在索引编制过程中,Google 会确定网页是否与互联网上的其他网页重复或是否为规范网页。 规范网页是可能会显示在搜索结果中的网页。为了选择规范网页,我们首先会将在互联网上找到的内容类似的网页归为一组(也称为聚类),然后从中选择最具代表性的网页。该组网页中的其他网页可作为备用版本在不同情况下提供,例如用户在移动设备上进行搜索时,或他们正在查找该组网页中的某个具体网页时。
Google 还会收集关于规范网页及其内容的信号,这些信号可能会在下一阶段(即在搜索结果中呈现网页)时用到。一些信号包括网页语言、内容所针对的国家/地区、网页易用性等。
所收集的关于规范网页及其网页群组的相关信息可能会存储在 Google 索引(托管在数千台计算机上的大型数据库)中。我们无法保证网页一定会编入索引;并非 Google 处理的每个网页都会编入索引。
是否会编入索引还取决于网页内容及其元数据。一些常见的索引编制问题可能包括:

  • 网页内容质量低
  • Robotsmeta规则禁止编入索引
  • 网站的设计可能使索引编制难以进行
呈现搜索结果

Google 不会通过收取费用来提高网页排名,网页排名是程序化地完成的。 详细了解 Google 搜索结果中的广告。
用户输入查询时,我们的机器会在索引中搜索匹配的网页,并返回我们认为与用户的搜索内容最相关的优质结果。相关性是由数百个因素决定的,其中可能包括用户的位置、语言和设备(桌面设备或手机)等信息。例如,在用户搜索“自行车维修店”后,Google 向巴黎用户显示的结果与向香港用户显示的结果有所不同。
根据用户的查询,搜索结果页上显示的搜索功能也会发生变化。例如,如果您搜索“自行车维修店”,系统可能会显示本地搜索结果,而不会显示图片搜索结果;不过,搜索“现代自行车”更有可能显示图片搜索结果,但不会显示本地搜索结果。您可以在我们的视觉元素库中探索 Google 网页搜索中最常见的界面元素。
Search Console 可能提示您某个网页已编入索引,但您在搜索结果中看不到该网页。这可能是因为:

  • 网页内容与用户查询无关
  • 内容质量低
  • Robotsmeta规则阻止提供内容

虽然本指南介绍了 Google 搜索的运作方式,但我们一直在努力改进算法。 您可以关注 Google 搜索中心博客,及时了解这些更改。

google搜索要素

Google 搜索要素指南涵盖了让您的网络内容(网页、图片、视频或者 Google 在网络上发现的其他公开内容)可以显示在 Google 搜索结果中并获得良好排名须满足的几大核心要求:

  • 技术要求:网页要显示在 Google 搜索结果中须满足的 Google 最低要求。
  • 网络垃圾政策:可能导致网站排名较低或完全无法显示在 Google 搜索结果中的行为和策略。
  • 关键最佳实践:有助于改善您的网站在 Google 搜索结果中呈现效果的主要措施。

不管他人怎么说,将您的网页显示在 Google 搜索结果中无需花费任何费用。需要注意的是,网页满足所有这些要求并遵循这些最佳实践,并不表示 Google 一定会抓取其内容、将其编入索引或呈现给用户。详细了解 Google 搜索的运作方式。

技术要求

技术要求涵盖了 Google 搜索规定的、网页要显示在搜索结果中须满足的最低要求。实际上,您几乎不用对网页执行任何技术性修改;大多数网站甚至没有留意过技术性指南,就已满足技术要求。

网络垃圾政策

网络垃圾政策详细介绍了可能导致网页或整个网站排名较低或完全无法显示在 Google 搜索结果中的行为和策略。专注于为用户提供优质内容和良好体验并遵循我们原则的网站在 Google 搜索结果中更有可能有良好表现。

关键最佳实践

虽然您可以通过多项措施来改善网站的搜索引擎优化 (SEO) 效果,但以下几种核心做法可能会对您的 Web 内容在 Google 搜索结果中的排名和呈现效果产生最大的影响:

  • 创建实用、可靠、以用户为中心的内容。
  • 了解用户查找您的内容时所用的字词,并将这些字词放置在网页中的显眼位置,例如网页的标题和主要标题以及其他说明性内容(如替代文本和链接文本)。
  • 确保链接可供抓取,以便 Google 可以通过网页上的链接发现您网站上的其他网页。
  • 向他人推广您的网站。积极参与社区活动,向那些志趣相投的人介绍您网站上提及的服务和产品。
  • 如果您有其他内容,如图片、视频、结构化数据 和 JavaScript,请确保您遵循了针对这些内容的特定最佳实践,以便我们也能了解网页的这些部分。
  • 启用适合您网站的各项功能,增强网站在 Google 搜索结果中的呈现效果。
  • 如果您不希望某些内容显示在搜索结果中,或者想完全阻止 Google 抓取网页,请通过相应方法控制您的内容在 Google 搜索结果中的呈现效果。

精确搜索

简单有效的方法就是在关键词上加上_双引号_, 这样搜索引擎只会返回和关键词完全吻合的搜索结果.
在不加双引号的情况下,有的时候, 两个词中间加一个空格, 它会分别搜索两个词, 可能返回的结果不是我们想要的结果.
image.png

排除关键词

如果想要的不是自己想要的结果, 可以使用 - 这个减号即可对指定内容进行排除.
image.png

用 OR (或)逻辑进行搜索

在默认搜索下, 搜索引擎会反馈所有和查询词汇相关的结果, 如果通过_OR_ 搜索, 可以得到和两个关键词分别相关的结果, 而不仅仅是和两个关键词都同时相关的结果.
image.png

同义词搜索 ~

在未能准确判断关键词的情况下,你可以通过 ~ 进行同义词搜索。
image.png

**站内搜索 **

在输入框输入 site: 网址 关键字 就会在输入的网址内进行站内关键字搜索
image.png

善用 * 星号

搜索是可以使用 * 星号填补缺失的部分.
image.png

在两个数值之间进行搜索

在两个数值之间进行搜索 ,数值之间的符号是两个英文句号加一个空格.
image.png

在网页标题, 链接和主体中搜索关键词

标题是输入完 intitle 就有的备选选项, 索性就用这个了, 如果是想匹配标题关键字是 intitle: ,如果想匹配网址链接 inurl: , 如果是主体的话是 intext: . 比如你可以试试 intitle: 评测 .
image.png

搜索相关网站

image.png

Search images of a particular size with imagesize:

image.png

Search for a particular filetype with filetype:

image.png

Filter out searches with AFTER:, BEFORE: or … between two numbers

image.png

Check out related websites using related:

查看相关网站
image.png

Use cache: to see Google’s cached version of a website

查看网站缓存版本
image.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1223277.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

BGP的基础知识

BGP——边界网关协议 IGP——内部网关协议——OSPF、RIP、ISIS EGP——外部网关协议——EGP、BGP 边界网关协议BGP是一种实现自治系统AS之间的路由可达,并选择最佳路由的路径矢量路由协议。目前在IPV4环境下主要使用BGPV4,目前市场上也存在BGPV4&…

uniapp优化h5项目-摇树优化,gzip压缩和删除console.log

1.摇树优化 勾选摇树优化,打包删除死代码 2.gzip压缩和删除console.log 安装插件webpack和compression-webpack-plugin webpack插件 npm install webpack4.46.0 --save-devcompression-webpack-plugin插件 npm install compression-webpack-plugin6.1.1 --save-devconst Com…

java+ 如何动态配置业务规则组

思路 1. 实现在页面上的动态配置规则组(2张数据表枚举类serviceimplaction) 2. 从数据库中表staffmoverules(规则明细表)或者staffmovetyperule(规则组表) ,根据传入类型,取出规则编…

[C/C++]数据结构 栈和队列()

一:栈 1.1 栈的概念及结构 栈是一种特殊的线性表,其只允许在固定的一端进行插入和删除元素操作,进行数据插入和删除操作的一端称为栈顶,另一端称为栈底,栈中的数据元素遵守先进后出的原则. 压栈:栈的插入操作叫做进栈/压栈/入栈,将数据插入栈顶 出栈:栈的删除操作也叫出…

自学嵌入式,已经会用stm32做各种小东西了

自学嵌入式,已经会用stm32做各种小东西了 1、stm32 工程中,定义一个变量,记录复位次数,即复位一次变量加一。要求不许用备份寄存器和 flash 保存信息。本题只讨论不断电热启动情况,至于冷启动,不在此讨论。…

整理MLAI学习路径图

干货分享: 下面给出一个笔者自己整理的GitHub仓库:https://github.com/isLinXu/awesome-road-map,里面包含了一些可供参考的学习路径和思维导图,并整理微软、meta、谷歌、Kaggle以及华为、百度、阿里、腾讯、讯飞等相关的学习资源…

stm32入门建议跳过固件库去学习hal库吗?

stm32入门建议跳过固件库去学习hal库吗? 如果要以单片机作为以后的工作方向,建议还是深入了解一下单片机的原理与机制,比如串口收发的时候,内部的寄存器是怎么工作的,中断又是怎么工作的,然后我们又是怎么进行中断处…

【广州华锐互动】自然灾害科普3D体验展厅:培养安全意识,共创美好未来

在人类历史的进程中,灾难始终是我们不可避免的挑战。地震、洪水、火灾等自然灾害无情地摧毁我们的家园,带走我们的亲人。然而,随着科技的进步,我们已经有了更多的手段来预防和应对这些灾难。在这个背景下,自然灾害科普…

嵌入式系统中相关的高质量开源项目

关于GitHub,可能很多人误以为这是互联网人的专属,其实并不是,那上面嵌入式相关的开源项目是有很多的。现分享一些高星开源项目(像RT-Thread、AWTK等大家都熟知的就不介绍了):Avem 项目链接: ht…

实力进阶,教你使用thinkphp6开发一款商城系统

0.开篇 你好!很高兴你能点开这个教程,相信你对这个教程有了那么一点点兴趣,接下来占用你一点点时间,邀你浏览一下本章内容,希望能够让你更加有兴趣去学完这个教程。 作者我是一名九零后程序员,搬砖了好几…

山西电力市场日前价格预测【2023-11-19】

1.日前价格预测 预测说明: 如上图所示,预测明日(2023-11-19)山西电力市场全天平均日前电价为591.63元/MWh。其中,最高日前电价为1500.00元/MWh,预计出现在16:45~20:45。最低日前电价为268.57元/MWh&#x…

简朴博客系统测试报告

文章目录 一. 项目简介二. 测试概要三. 测试环境四. 测试执行概况及功能测试1. 手工测试1.1 手动测试用例编写1.2 执行的部分测试用例 2. 自动化测试Selenium2.1 编写测试用例2.2 自动化测试代码 3. 测试结果 五. 发现的问题 一. 项目简介 简朴博客系统是采用前后端分离的方式…

美国经典人工智能教材第3版出版!

美国经典人工智能教材,人工智能的百科全书《人工智能》(第3版)出版!新增深度学习及人工智能编程等内容,理论阐释结合动手实践。 人工智能 第3版 关于作者 史蒂芬.卢奇(Stephen Lucci)拥有纽约…

FreeRtos 任务切换深入分析

一、背景知识: 1、任务切换包含三个基本流程:保护现场、更新TCB、恢复现场并跳转 2、freertos的任务切换是在xPortPendSVHandler 中断函数中完成的 3、中断函数在调用之前,硬件已经保存了r0,r1,r2,r3,r12,r14(LR),r15(pc),恢复…

深入理解Linux网络笔记(七):异常TCP连接建立情况、如何查看是否有连接队列溢出发生

本文为《深入理解Linux网络》学习笔记,使用的Linux源码版本是3.10,网卡驱动默认采用的都是Intel的igb网卡驱动 Linux源码在线阅读:https://elixir.bootlin.com/linux/v3.10/source 5、深度理解TCP连接建立过程(二) 4&…

顺序表(数据结构与算法)

✅✅✅✅✅✅✅✅✅✅✅✅✅✅✅✅ ✨✨✨✨✨✨✨✨✨✨✨✨✨✨✨✨ 🌿🌿🌿🌿🌿🌿🌿🌿🌿🌿🌿🌿🌿🌿&#x1…

【Spring】AOP进阶-JoinPoint和ProceedingJoinPoint详解

文章目录 1. 前言2. JoinPoint简介3. 获取被增强方法的相关信息4. ProceedingJoinPoint简介5. 获取环绕通知方法的相关信息6. 总结 1. 前言 在Spring AOP中,JoinPoint和ProceedingJoinPoint都是关键的接口,用于在切面中获取方法的相关信息以及控制方法的…

国科大数据挖掘期末复习——聚类分析

聚类分析 将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程被称为聚类。由聚类所生 成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。 聚类属于无监督学习(unsupervised learning&…

整形数据和浮点型数据在内存中的存储差别

愿所有美好如期而遇 我们先来看代码,猜猜结果是什么呢? int main() {//以整型数据的方式存储int n 10;float* m (float*)&n;//以整型数据的方式读取printf("%d\n", n);//以浮点型数据的方式2读取printf("%f\n", *m);printf(&…

揭秘“ChatGPT之父”突遭罢免内幕:从开发者大会起,几件事已有征兆

腾讯新闻《潜望》 纪振宇 发自硅谷 美国时间11月17日午间,OpenAI首席执行官,被称为“ChatGPT之父”的山姆奥特曼突遭董事会罢免。 OpenAI在当天发布的官方声明称,董事会启动了一项特别的调查,结论是奥特曼在与董事会沟通过程中没…