为什么访问同一个网址却返回不同的内容

当前位置:

哈喽大家好，我是咸鱼。今天给大家分享一个关于 HTTP 有趣的现象

链接：https://csvbase.com/meripaterson/stock-exchanges

我们用浏览器访问这个链接，可以看到下面的网页

但如果我们使用 curl 命令去访问这个链接呢？

可以看到返回的是一个 csv 文件

我们用 wget 命令下载下来看看

可以看到 text/csv 字段，表示下载了一个 csv 格式的文件

奇怪，同样的 url ，为什么浏览器返回的内容跟 curl、wget 命令返回的内容却不一样

内容协商

当 HTTP 客户端去发送响应给 HTTP 服务端的时候，响应里面会包含响应头（headers）

我们来看下 Google浏览器发送的响应头

我们着重注意一下响应头里的 accept 字段

这个 accept 报头是一个无序列表，它告诉了 HTTP 服务端应该返回什么媒体类型（又称内容类型或文件格式）的内容给我

以上面 Google 浏览器的 accept 报头为例：这段 accept 报头表示该请求中浏览器可接受的媒体类型（或文件格式）的偏好。从左到右，各类型的优先级逐渐降低

text/html: 浏览器首选的媒体类型，即 HTML 文本。
application/xhtml+xml: 次选的媒体类型，即 XHTML 文本。
application/xml;q=0.9: 服务器可以发送的 XML 类型的文本，但是客户端更愿意接收前面的两种媒体类型，所以权重为 0.9。
image/avif,image/webp,image/apng: 浏览器能够接受的图片类型，优先级逐渐降低。如果服务器返回多种可接受的图片类型，则浏览器将选择优先级最高的那个。
*/*;q=0.8: 如果服务器无法以以上任何一种类型响应，则浏览器愿意接受任何类型，但是这个类型的优先级最低，只有 0.8。
application/signed-exchange;v=b3;q=0.7: 该媒体类型是用于实现 Web 页面“前进”和“后退”功能的标准。客户端更愿意接受前面提到的其他媒体类型，所以该类型的权重为 0.7。