Firefox 开展新项目,将用网页快照代替消失的网页。网页截图
由于网络审查等多种原因,总有一些网页会在发布一段时间后离奇消失,内地网民将这种现象戏谑为“手慢无”。尽管各大搜索引擎都提供网页快照(Web Cache),以便用户查询失效网页内容,但这种方法并不直接,而且能否找到快照取决于搜索关键词的准确度。
为解决用户这一困扰,Mozilla 公司的开源网页浏览器 Firefox 近日在其测试平台 Test Pilot 上启动了名为“No More 404s”的新项目,计划推出一个浏览器扩展程序,让已无法访问网页的快照内容直接替代其失效链接,方便 Firefox 浏览器用户查看。
对上网时遇到死胡同感到厌烦?当某个网页消失时,我们会尝试给你一份快照。
Firefox 测试项目“No More 404s”导语
由 RFC 2616 规范定义用以表示网页伺服器 HTTP(超文本传输协议)响应状态的 HTTP 状态码由3位数字组成,最常见的包括“403 Forbidden”、“404 Not Found”等错误讯息。
其中,“404 Not Found”代表客户端在浏览网页时,伺服器无法正常提供讯息或无法回应且不知原因,404 错误讯息通常是在目标页面被更改或移除之后出现。
Firefox 正在测试的“No More 404s”扩展功能可以让其用户访问已经快照的内容,这些内容由非营利组织互联网档案馆(Internet Archive)的存有近5000亿网页的 Wayback Machine 提供。不过,该扩展程序不适用于在 Wayback Machine 上没有快照的页面,也不适用于自动跳转至其他页面的链接以及其他 HTTP 错误讯息代码。
3根据 Net Market Share 今年7月的统计数据,Firefox 在全球浏览器市场占有率排在第3位,仅次于 Chrome 和 IE。
互联网档案馆
互联网档案馆(Internet Archive)是一个非牟利性的数码图书馆。成立于1996年,由 Alexa 创始人布鲁斯特·卡利(Brewster Kahle)创办。提供数字数据如网站、音乐、动态图像、和数百万书籍的永久性免费储存及获取。迄至2012年10月,其资讯储量达到10PB。除此之外,该档案馆也是网络开放与自由化的倡议者之一。其数据是由自带的网络爬虫自动搜集的,其网站典藏档案馆网站时光机,抓取了超过1500亿的网页。其年度预算约100万美元,来源则是其网页爬虫服务、合作关系、赞助以及卡利-奥斯丁基金会(Kahle-Austin Foundation)。总部位于美国旧金山里奇蒙德区,此地雇员只有数十人,大部分雇员工作于书籍扫描中心,在雷德伍德城(Redwood City)也有数据中心。该数据库是国际互联网储存联盟成员,2007年被加利福尼亚州选为官方指定图书馆。(资料来自维基百科)
via 细节的力量 http://ift.tt/2bVqFcq
No comments:
Post a Comment