第11部分 (第1/4頁)
使勁兒提示您:看後求收藏(奇妙書庫www.qmshu.tw),接著再看更方便。
01(K)條款 的人身上呢?”嚴格說來,庫爾茨的批評在當時是放錯了地方——在網路威脅面前立刻感到飯碗不保的不是記者,而是編輯。但短短几年之後,連整個報紙行業也陷入了可怕的財政困境,“谷歌新聞”應對記者職業的消失負間接的責任。透過將使用者直接指向具體的線上新聞文章,“谷歌新聞”及其他同樣入侵新聞領域的網站扮演了將報紙訂戶誘拐到電腦螢幕上讀新聞的角色,而且讓讀者將時間主要花在瀏覽谷歌新聞網站而不是瀏覽報紙網路版主頁。隨著印刷版訂戶的消失,傳統上為新聞採訪提供資金的廣告商也就消失了。報紙網站上線上廣告的增加無法完全彌補其印刷版的虧空,報紙行業的臨時解僱現象越來越嚴重。
演算法的確需要微調。有一次,一個公司報紙的發行量不知何故登上了商業新聞網頁中新聞特寫的頂部。還有一次,谷歌冷酷無情的演算法在2003年2月1日犯了一個重大的錯誤,導致了嚴重的負面後果:那一天,太空梭哥倫比亞號在返回途中解體,導致全部7名宇航員死亡。由於沒有估準這個事件的重要###,演算法當天允許這條訊息從新聞網站的主頁上一度消失。
其他的反常現象也不時出現。2005年,谷歌對它的公式做了調整並申請將其加入到演算法專利中,演算法可以考慮更多的因素,如新聞機構編制的特寫的平均長度,新聞部門的人員數量,報紙自辦網站的訪問量,接入這個網站的國家的數量等。結果得到了改善,反常現象(幾乎)消失了。(新澤西州的一名15歲高中生在2006年寫了一則假新聞,稱他已經成為谷歌最年輕的僱員,“谷歌新聞”竟然不辨真偽,也收入了這則新聞。)
在組織新聞的競爭中,谷歌的演算法和雅虎的人工新聞編輯進行了對決,然而,谷歌並沒有取得勝利。它的演算法雖然有所改進,但並不意味著已經趕上了雅虎新聞網站的質量。說“谷歌新聞”是一個劣等網站,並不是因為它偶然有一天表現不佳,演算法被指犯下了人工編輯決不會犯的錯誤;“谷歌新聞”的低劣表現在即使是它最好的日子也從未有過“雅虎新聞”指導新聞選擇的精益求精的態度。訪客數量上的差異也反映出兩家的不同由來已久:在開辦4年後,“谷歌新聞”的訪問量只及雅虎新聞網站的30%,後者仍是Web中最有人緣的新聞網站。在這種情況下,當演算法遭遇人類時,人類獲勝。
新聞的###質決定了新聞並不能顯示出演算法隨著資料的增長而自動日益複雜化的真正威力。在網站中,維護人員賦予演算法的是一種額外的高明之處:一旦它們在自己的網頁中加入在其他網站上發現的新聞網頁的連結,就可以對Web網頁進行檢查。谷歌“蜘蛛”蒐集的頁面越多,演算法所集中的連結就越多,它賴以做出的判斷就越具權威###。但具體到新聞,由於演算法只能對新聞的組織進行判斷,卻不能將成千上萬的人閱讀新聞時所做的判斷蒐集起來,因而,演算法對新聞而言,其智慧就趕不上它在蒐集新聞報道時所達到的那種引人注目的高度。而新聞報道又有時效###,先出者不斷被後出者所替代,這就使得演算法缺乏考察使用者點選率的資料基礎,所以它就不能持續地保持敏銳的判斷力。
獨步天下的谷歌演算法(10)
“谷歌新聞”不能作為演算法的成果展示櫃,但這個專案的中等成績並沒有使谷歌對公司的創立使命產生懷疑。“演算法”在Web網頁搜尋方面是如此之強,即使它在執行其他任務時相對失敗,也都被谷歌之外的絕大多數觀察家們忽略了。谷歌就是這樣享受著各種實驗所帶來的樂趣,而當一些實驗結果不如人意時,也不必因擔心形象受損而煩惱。
在將“演算法”推向新領域的另一個專案中,結果比預想的要好,這就是計算機在歷史上所處理的最困難、最難協調的問題——語言翻譯。為了進入這個領域,谷歌在2003年初組建了一個課題小組,讓他們在所謂自動翻譯或機器翻譯的領域奮力開拓。他們的努力結出了豐碩的果實。他們開發的“演算法”能夠完成——至少有時能夠完成——符合語句習慣的流利的翻譯,這一點令人驚歎不已。同時,它還有效地利用了較為令人失望的谷歌新聞專案中所蒐集的新聞報道資料。
機器翻譯是計算機先驅們在20世紀中葉首先設想出來的計算機應用領域之一。1953年,哈佛大學計算機實驗室的霍華德·艾肯(Howard Aiken)用響亮的聲音宣佈,他希望不久就可以開始將俄語逐字地譯為英語。他以為,將意義從一種語言精確地轉為另一種語言會是很容易的,隨著計算機功能的增強,文字上的