第7部分 (第1/4頁)
使勁兒提示您:看後求收藏(奇妙書庫www.qmshu.tw),接著再看更方便。
�5彼�淺閃⒘俗約旱墓�競螅�坪蹙拖戮魴牟輝偈蘢試炊倘敝�鎩�
谷歌應該是可以升級的,它的創立理念就是要使對網頁的搜尋速度與網頁上資訊量的增長速度保持同步,不斷擴大自己的能力。谷歌的創辦者堅定地認為,對搜尋範圍決不能畫地為牢。無論網頁會變得多大,也無論它將哪類資訊包括進來,谷歌都不僅要保持其搜尋的質量和速度,而且要將增加搜尋廣度作為提高質量的手段——輸入谷歌引擎的資訊越多,它的智慧就越高。
佩奇和布林憑直覺感到,公司一些未能盡如人意的原因就在於搜尋技術存在設計上的缺陷,不是遵循積極發展的思路,因而不能滿足組織起網路上的海量資訊的要求。當其他地方的搜尋引擎因為可獲得的資訊越來越多反而被海量資訊所淹沒,無法區別網頁中哪些是最有用的資訊時,谷歌的PageRank打一開始就被設計成能夠用一種別人從未達到過的複雜技術——從網上把有用的線索抽取出來。輸入搜尋引擎的關鍵詞越多,PageRank能夠抽取出來、進而用來根據關聯###對頁面進行分析的線索也越多。依此看來,谷歌的技術就有了它自己的獨到###。
當布林和佩奇打算將全世界的資訊都組織起來的時候,他們不僅為自己的公司,而且為廣闊的資訊世界——包括網路在內——做出了兩個將會帶出衍生結果的基礎###的決定。第一個決定是,讓谷歌的搜尋結果完全按照數學原則排列順序。一旦軟體的公式算出了搜尋結果,谷歌將禁止用任何人工編輯行為進行修改。他們相信,用軟體手段處理網頁搜尋問題所得出的結果優於用人工編輯得出的結果。而且這也是最適合於資料升級的方法。即使人工編輯能夠擺脫偏見,其速度也不夠快——而且也不夠廉價——無法趕上數以百萬計,甚至以10億計的新網頁的增長速度。。 最好的txt下載網
能力無限(2)
承諾用排除人工干涉的數學方法評價全世界的資訊,這就要求佩奇和布林做出第二項決定:谷歌的計算機###能的更新速度應該趕上網頁增長的速度。谷歌需要一個在能力和容量上能夠掌握令全世界所有資訊都參與運算和存貯的系統,它掌握的問題要比其他任何系統都更徹底、結果更好。速度是一個重要的參考量——使用者不會因搜尋結果未能即刻出現而耐心等待。快速的傳送需要快速的接入,這隻有投資建造大容量的機器才能實現。谷歌的創辦者決意不讓自己搜“盡”天下資訊的理想因現實的阻礙而有絲毫的讓步。這就需要組裝一套極有可能是天字第一號的計算機群。
谷歌本來也可以選擇依靠市場上可以買到的最複雜的硬體來實現它的計算能力,也可以按照滿足最苛刻製造要求和處理最大的網路流量的標準進行設計。它的競爭物件們關心的都是軟體方面的問題,而將硬體方面的問題交給了計算機硬體廠家。讓網站的執行能力與網頁的規模擴張保持同步的理念深深地蘊藏在谷歌的使命意識中,而快速同步又是谷歌區別於競爭對手們的關鍵所在,所以它決定要自己製造機器,這在軟體行業還是一條沒人走過的新路。谷歌採用與個人電腦的核心技術相同的標準部件,從第一步起就自行製造,所以在提高自己的技術能力時,便能夠做到低價、高效、無限。
用充足的硬體來裝備宏偉的規劃,是拉里·佩奇在斯坦福大學當研究生時著手搜尋引擎研究時想到的問題,當時定下的規劃是“穿越Web”。他將謝爾蓋·布林加為合作者。對二人而言,最有趣味的挑戰是將“全部”Web(而不是僅選擇其中一部分)加以索引。隨著谷歌的“爬行器”蒐集的Web網頁越來越多,佩奇和布林的研究卻因他們機器的存貯能力有限而受到了牽制。谷歌是在大學生宿舍裡的一堆品牌混雜的機器上開始執行的。到1998年初,它們已經蒐集了2600萬Web網頁,這是已經建成的搜尋引擎——如Alta Vista——在兩年之前就已經達到的數字的一半。兩名斯坦福學生亟需更多的硬體裝置。他們後來回憶說,在三年當中,他們站在斯坦福大學貨物交接處,“像餓狼撲食般尋來了一堆各種型別的機器”。當他們看見有人提取20臺機器時,他們便走近負責人,使了點花招讓他“勻”了一臺機器支援他們作研究。
為了提高他們的搜尋引擎能力,兩名學生花光了他們自己的15000美元積蓄,動用了3張信用卡,購買了能夠存在1012位元資料的硬體驅動盤。他們的意圖是提高他們的搜尋技術的能力,但在那個時候,他們還沒有產生開辦一家搜尋引擎公司的念頭。相反,他們想把