当前位置: 首页 > news >正文

Internet Archive:10PB的数据看起来像什么?

日期:2013-5-31  来源:GBin1.com

Internet Archive:10PB的数据看起来像什么?

Internet Archive(互联网档案),也称作“网站时光倒流机”Wayback Machine,定期收录并永久保存全球网站上可以抓取的信息。对网站不同时期的历史资料进行研究,是互联网档案最大的价值。

网站时光倒流机Wayback Machine看上去很简单 - 不过是一个安装在网站上的插件,并且随时间推移,你可以看到它的副本。

但 是你只是看到了它简单的表面,并没有看到它为了维护这些档案,保存副本所必须的超大数量数据以及存储。导演Jonathan Minard的纪录片Internet Archive记录了在幕后是它如何(以及为何)努力的维护着我们如今看到的Internet Archive。

纪录片采访了Internet Archive的奠基者Brewster Kahle,讲述了关于档案背后的主意,以及让我们看到了存储了10PB数据的服务器,这些数据包括当前Internet Archive上存储的网站,书籍,电影,音乐以及电视广播的存档。

想要了解更多Internet Archive,请登陆Vimeo,观看更多视频介绍。

via Nelly@极客社区

来源:Internet Archive:10PB的数据看起来像什么?

转载于:https://www.cnblogs.com/java20130725/archive/2013/05/31/3215534.html

相关文章:

  • oracle 中删除重复数据
  • [译]移动开发在2010年及以后的商用发展走势(七)
  • Windows下面对分区修改,导致grub所在分区由sda3变成了sda2
  • SQL SERVER 表分区造成插入慢?
  • linux TIME_WAIT过多问题的解决方法
  • WIPI为何
  • Pull解析器解析XML文件和生成XML文件
  • 系统运行中进行调试修改的重要性--一个小故事
  • 进入软考倒计时
  • Ember.js 示例
  • 《MEF程序设计指南》博文汇总
  • SQL INNER JOIN 关键字 用法
  • 几种经典算法回顾
  • SQL 读取不连续的数据,如读取第30到40之间数据
  • 工作中电子邮件的技巧
  • 《微软的软件测试之道》成书始末、出版宣告、补充致谢名单及相关信息
  • 「译」Node.js Streams 基础
  • 11111111
  • angular2 简述
  • Centos6.8 使用rpm安装mysql5.7
  • CSS 专业技巧
  • emacs初体验
  • iOS 系统授权开发
  • Js基础知识(四) - js运行原理与机制
  • Mysql5.6主从复制
  • node-sass 安装卡在 node scripts/install.js 解决办法
  • NSTimer学习笔记
  • PHP 小技巧
  • PHP的类修饰符与访问修饰符
  • Redis在Web项目中的应用与实践
  • Vue 2.3、2.4 知识点小结
  • Vultr 教程目录
  • 阿里云Kubernetes容器服务上体验Knative
  • 测试如何在敏捷团队中工作?
  • 产品三维模型在线预览
  • 成为一名优秀的Developer的书单
  • 配置 PM2 实现代码自动发布
  • 前端面试总结(at, md)
  • 容器化应用: 在阿里云搭建多节点 Openshift 集群
  • 深度解析利用ES6进行Promise封装总结
  • 为物联网而生:高性能时间序列数据库HiTSDB商业化首发!
  • 协程
  • 一起来学SpringBoot | 第三篇:SpringBoot日志配置
  • 在Mac OS X上安装 Ruby运行环境
  • 整理一些计算机基础知识!
  • ​flutter 代码混淆
  • ​如何在iOS手机上查看应用日志
  • #1015 : KMP算法
  • (BFS)hdoj2377-Bus Pass
  • (day 12)JavaScript学习笔记(数组3)
  • (Redis使用系列) Springboot 使用redis实现接口Api限流 十
  • (阿里云万网)-域名注册购买实名流程
  • (二)正点原子I.MX6ULL u-boot移植
  • (附源码)SSM环卫人员管理平台 计算机毕设36412
  • (四)【Jmeter】 JMeter的界面布局与组件概述