月下影成双

Like the meeting of the seagulls and the waves we meet and come near. The seagulls fly off and the waves roll away we depart.

一篇文章讲透SEO - Chapter 1

2023-07-30 需要 10 分钟阅读 SEO tutorial 一全老师

一篇文章能把谷歌SEO全部讲清楚吗? 我的目标是把自己11年的SEO优化经验梳理一遍, 用最易懂(尽可能)的话, 把容易讲出来的所有知识总结出来, 并力求前因后果明明白白.

本系列的其他教程在最底部, 可以点击底部的链接进行跳转.


本文大纲 - 点击跳转


1. 谷歌SEO优化概念

什么是谷歌SEO?

  • SEO 全称 Search Engine Optimization, 中文是搜索引擎优化, 搜索引擎就是谷歌百度这种搜索网站.

  • 搜索引擎优化. . . 其实加上几个字就容易理解了, 如搜索引擎排名优化、搜索引擎流量优化.

所以SEO并不是优化搜索引擎, 而是优化网站在谷歌、百度这类搜索引擎网站中的排名, 以此获取更多流量.

至于如何优化, 当然是按照搜索引擎给网站排名的规则和算法, 这些规则有些是搜索引擎公司明白无误的公布出来的, 还有一些是无数SEOer通过推测、实践摸索出来的.

本文将要讲述的就是这些对排名提升有用的规则.


2. 搜索引擎极简原理

想要了解搜索引擎优化, 了解搜索引擎原理是必须的, 这好比我们期望在某家公司晋升到CEO, 我们必然要了解公司基本的组织和业务结构.

在这里, 我们简单讲一下搜索引擎Google最基本的工作原理.


2.1 工作原理

首先谷歌也是一个网站, 只是这个网站很特殊, 它努力翻阅世界上绝大部分网站和网页的信息, 并把这些信息核心部分记录下来, 然后为这些信息编写目录和词条(不懂没关系, 下面会举例). 并且, 这个网站对你来说只有一个功能, 那就是搜索.

我们可以把网站想象成一本书, 把整个互联网世界想象成一个图书馆, 把谷歌想象成一个图书馆管理员, 这个管理员每天的工作就是查看图书馆中每一本书的每一页内容, 然后把每一页内容做一个简要的总结并生成一个便签(便签上记录了这一页内容的页码、内容概要、写作日期、作者等等), 然后他会把便签归类, 当然, 我们有理由相信谷歌会为海量的便签编制目录, 然后把这些便签放到对应目录之下.

  • 便签的归类可以这样理解: 如果某一便签上记录了某页内容是关于互联网、网站、搜索引擎的, 那这张便签会被同时归类到互联网类、网站类、搜索引擎类.

作为用户, 当我们去图书馆时, 只需要告诉管理员谷歌我们想要查询的具体知识, 它就会迅速把相关的便签按相关性排好序呈现给我们, 而我们只需要扫一眼便签的内容, 选择最喜欢的, 然后按照上面记录的页码找到对应的书籍和页面就可以了.

这其实就是谷歌的工作原理.


2.2 抓取和索引

  • 谷歌努力翻阅互联网上所有网站的每一个页面, 并记录相应信息的过程叫做抓取(crawl)

这个过程谷歌通过爬虫程序实现, 它派出爬虫, 沿着互联网上的每一条链接, 一个页面一个页面的延伸, 每经过一个页面则记录相应信息.

  • 谷歌抓取页面之后, 根据记录的页面信息对页面进行归类和存档, 这个过程叫做索引(index).

我们在谷歌进行搜索, 谷歌从索引库中提取结果, 并且按照排名规则对结果进行排序, 最终把所有结果按照排名呈现到我们面前, 到此完成一个完整的搜索过程.


2.3 收录查询

看到这里, 大家或许明白, 想要在谷歌获得排名, 还要满足一个更基本的条件: 网页被谷歌编入索引. 编入索引也被称为收录. 我们可以通过 site:域名(不带http或https) 查询某个网站有多少页面被谷歌收录. 如下:

  • site:gitaeron.github.io

也可以直接在谷歌输入页面的URL点击搜索, 检查页面是否被收录, 如果能搜到, 肯定是被收录的, 反之没有.

当然, 关于网站收录多少个页面或具体页面是否被收录, 都可以在google search console中查到, 具体方式看google search console教程.


2.4 Sitemap

既然收录这么重要, 如何才能快速的让谷歌将我们所有重要页面全部收录呢?

很简单, 保证网站结构浅显有条理(后面讲), 制作sitemap(网站地图), 并且把sitemap提交到google search console. (sitemap不是什么难题, 不同程序的网站不一样, 都有对应教程, 也没法统一讲)


2.5 收录促进

当然, 也有很多专业的促进收录的工具可以使用, 比如付费工具instant link indexer, onehourindexing等, 免费的ping工具等, 普通网站基本不用考虑这些工具, 一般抓取生成的网站会需要, 所以这里不展开.

当然, 大型网站, 比如页面10W+的网站, 谷歌抓取额度有限, 可能需要特殊策略, 保证重点页面被抓取和收录, 这里也不在讨论范围之内.


2.6 拒绝抓取与索引: Robots.txt/noindex

除了促进抓取和收录之外, 还有很多网站不希望搜索引擎抓取收录, 一些网站的私密页面或者特殊页面也不希望谷歌抓取或索引, 这种时候就需要通过 robots.txt文件 或 noindex 来对谷歌爬虫的爬取路径做一下限制.

关于 robots.txt 写作规则, 可以查看这里

Noindex 查看这里


https://ask.imiker.com/question/685394

原文由链接中的作者所著。 但原文内容实际上由 一全老师 的一些文章内容 + 原文链接作者的自身经验 糅合而成的文章.

一全老师 的文章由 CC-BY-NC-SA(3.0) 授权;

链接文章-作者: 跨境李绍峰 本文发布在某网络知识平台, 不清楚具体版权协议, 也没有看到作者公开的邮箱联系;

 因为没有看过 “一全老师” 的大部分文章, 也不清楚链接文章的原创内容有多少 (其中大多数都是糅合 “一全老师” 的内容, 也有一些内容是基于自身经验, 文章中的举例可以看出应该是链接作者 “跨境李绍峰” 所写);

 并且链接中的文章并没有转载一全老师文章的标注, 以及基于 CC-BY-NC-SA(3.0) 中 ShareAlike 的声明采取同样的版权协议发布方式;

(本人觉得至少应该将引用的内容标注, 并注明出处. 但这毕竟不是强制性的, 全凭个人的主观意识, 难以对此言喻)

故决定以 CC-BY-NC-SA(4.0) 协议转载发布本文, 并在文章末尾注明这两个链接及作者.


之所以坚持转载

是因为出于对各大知识平台的不信任导致的, 它包含了很多因素, 最主要的还是两点:

  • 我们都看到了 CSDN 的变化 (以前还是很好的, 可惜…)
  • 我们都见过 网站的更迭导致内容消失

不确定以后还能不能再见到这篇文章.

出于本内容的认可, 不希望它就此消失于互联网中, 故本人坚持转载.

若是侵权, 或作者本人有意删除, 还请联系我 Aeron.Atlantis@gmail.com


一篇文章讲透SEO系列

全文的逻辑大纲

  1. 谷歌SEO概念(易懂版)
  2. 搜索引擎极简原理
  1. 关键词部分(查找与扩充、筛选与归类)
  1. 内容部分(页面SEO、Tech SEO等、内容价值、内容营销)
  1. 外链部分(注意点、类型、各类操作方式等)
  1. Rankbrain(概念、应对操作)
  2. 品牌因素(概念、应对操作)
  3. 其他(惩罚因素、本地排名、语音排名、EAT、新鲜度)
  4. 工具(官方工具、关键词工具、站内SEO检测工具、外链工具、综合类工具)