这家网站报道,这个专利的名字叫做“基于多索引的信息查询系统”,是由Google公司的员工阿纳·帕特森在去年一月份申请的,在今年五月份外界才获悉。这个专利显示,Goolge计划索引一千亿以上的网页。
根据这份专利称,传统所谓“搜索引擎”的信息检索系统只能够查询到互联网上很小一部分的网页和文档。据估计,目前整个互联网上的网页数量已经高达2000亿,而帕特森认为,最好的搜索引擎(即Google)也只能抓取不到十分之一。
据报道,Google这项新的检索技术具有两大特点,其中一个是可以索引千亿数量级的网页。另外一个特点是可以保存同一个网页的在不同时期的版本。从而向查询用户提供最佳版本的信息。
1996年,Google公司索引的网页数量为2400万。到2000年8月,Google将这个容量扩大了四倍,达到十亿个网页。2003年9月,Google公司在首页上宣布,已经索引了33亿个网页 然而据业内研究机构Microdoc称,Google当时的网页数量已经超过了50亿。这家机构在一份报告中指出,Google有意“瞒报”了其网页索引数据库的规模。