HomeGithub

Web 如何工作

网络并不存在,当人们以某种方式联系起来就形成了网络

C/S 架构

为了向人们展示信息(商品列表,博客,视频等)至少要经过以下几步

  1. 将信息存储在计算机上
  2. 把这台计算机暴露在公共空间
  3. 当有人想要获取这些信息时,他也必须把自己暴露在公共空间,并指定资源在哪里
  4. 信息开始传输

第一步中的计算机被称为服务器(Server), 第三步中的计算机被称为客户(Client); 他们所处的环境(公共空间)被称为网络,要传输的信息被认为是资源;就这样我们建立起了信息传输的基本架构: C/S 架构。

有些人可能会提到 B/S 架构,也即 Browser/Server 架构。但其实浏览器(Browser)只是 Client 的一种, 人们不单单可以使用浏览器来获取服务器上的信息。事实上,黑客电影中的天才们大多使用只能展示纯文本的终端获取信息,这个终端其实也是 Client。

IP 地址

发信和送信双方进行信息传递的公共空间被称为网络,网络提供了发送和获取资源的一切中间条件。

和现实中的快递一样,一个强制的条件就是收发件双方都必须填好自己的地址。而且这个地址必须是唯一的且精确的,如果你在收件人一栏写上北京市显然就不合适。

在 Web 中每台计算机都被赋予一个独一无二的地址,这个地址被称为 IP 地址。目前广泛使用的版本是 IP V4,它规定每个 IP 地址由 32 位二进制数值组成,每 8 位为一组分为 4 组,以英文句号隔开。比如:159.247.203.8 就是一个 IP 地址的十进制表示。

DNS

IP 地址并不容易人们记忆,人们发明了域名来代替 IP 地址。当人们需要使用谷歌搜索时,只需要记住谷歌的域名是 google.com 就够了。计算机使用 IP 地址,而人类想要使用域名,如果能轻松的把域名转为 IP 地址就可以了。这部分工作叫 DNS (Domain Name Service), Web 上有无数计算机在执行着这简单确极为重要的工作,这些计算机被称为 DNS Server。

HTTP 协议

有了 IP 地址和 DNS 我们能够定位到通信双方,现在可以开始交换信息。但发送和接收的信息如何解释和处理并没有解决。比如一段普通中文文本,发信方使用 UTF-8 进行编码为二进制字符串,收信方如何知道这串字符的编码方式是 UTF-8 呢?在不知道这些信息的情况下,收信方很可能使用 ASCII 码进行解码,这就会造成乱码的现象发生。

很显然,收发信双方需要某种约定,发信方在发信时应该说明该资源的类型。这种约定被称为协议,在 Web 中,最常用的是 HTTP 协议, 它确定了发送和接收信息的规范。信息的类型只是规范的一小部分,只要参与通信的双方都遵守协议,那么信息就很容易被接收方理解。

HTML - 结构化标签语言

试想一篇博客,里面可能有各种格式化的信息:文章标题,章节标题,段落;大体的结构可能是:

标题

  1. 观点 1
    1. 段落 1
    2. 段落 2
  2. 观点 2
    1. 段落 3
    2. 段落 4

如果需要把这些信息展示给读者,最重要的工作是把结构清晰地展现出来;现在的通用标准是使用 HTML。

HTML(HyperText Markup Language) 是一种结构化的显示语言,主要有以下 3 种机制:

  1. 在一个页面可以通过链接跳转到另一个页面,这种链接被称为超文本(HyperText)
  2. 通过标签(Tag)对不同类型的信息进行标记(Markup),这种标签也被称为页面元素
  3. 标签之间通过嵌套表示层级关系,从而表示页面的结构化信息

以上文章用 HTML 可以表示为:

<div>
    <h1>标题</h1>
    <section>
        <h3>观点1</h1>
        <div>
            <p>段落1</p>
            <p>段落2</p>
        </div>
    </section>
    <section>
        <h3>观点2</h1>
        <div>
            <p>段落3</p>
            <p>段落4</p>
        </div>
    </section>
</div>

如果 Client 知道 HTML 的语法,那么 Client 就知道这片文章的结构,剩下的工作就是将这种结构信息用样式渲染出来。

JavaScript - 为 Web 带来动态

HTML 只是一种显示语言,这决定了 HTML 是静态的。的确,HTML 里面的表单元素比如 <input> <select> <button> 提供了一些交互,用户可以进行输入选择点击等操作。但 HTML 最初是没有这些标签的,当时的设想很简单:用一种结构化的方式显示信息并通过链接将 Web 上的文档联系起来。第一版 HTML 甚至没有提供按钮,更别提输入框和下拉列表了。事实上,只有在 JavaScript 被发明才推出了这些交互性标签,因为交互的基础是 JavaScript 的存在。

所有的主流浏览器都有理解和执行 JavaScript 的能力,打开浏览器的控制台立即就可以编写并执行 JavaScript 代码,没有其他语言的环境设置要比这还要简单了。

懒人的第一行代码:console.log("hello world")

DOM - 为 HTML 建模

HTML 简单直观,但却没有提供一种可编程的方式来控制它。要实现动态,必须将 HTML 抽象为某种可以直接被 JavaScript 利用的模型。

计算机科学早已经为我们提供了层级关系对应的数据结构 - 树。每个标签对应树中的一个节点,每个节点都是一个 JavaScript 对象。当然整颗树本身也是个 JavaScript 对象,这个对象被称为 DOM (Document Object Model)

HTML 被建模为 JavaScript 对象,我们就可以直接对其进行 CRUD 操作了。之后浏览器会响应 DOM 的改变,进而更新 HTML 并渲染出新的页面出来。

Web API - 通用 JavaScript 接口

其实 DOM 就是 Web API 的一部分,但 Web API 还包含其他内容,以下是一些例子:

  1. fetch:提供网络请求能力
  2. html drag & drop: 拖拽页面元素
  3. history: 控制浏览器的会话历史
  4. WebRTC: 提供点对点通信能力,通常用于实时视频或者音频通话
  5. WebSocket: 实现浏览器和服务器之间的双向通信
  6. Web GL: 3D 图形渲染
  7. Canvas: 2D 图形渲染

以上是 Web 能正常工作所必须的基础设施。当然还有其他方面没有谈到,比如 CSS |浏览器的渲染过程| HTTPS |前端框架等。以后我会写博客专门介绍这些内容。