互聯網檔案館使維基百科更加可靠
維基百科是互聯網上真理的仲裁者。這就是在酒吧解決爭執的原因。它為您在Google或Bing搜索結果中看到的信息片段提供答案。這是幾乎每個從事在線研究的人的第一站。
儘管維基百科不完善,但人們仍然依賴它的原因是,每個聲明都應該被引用。任何沒有可靠來源支持的句子都有可能被可怕的“需要引用”標籤打光。任何人都可以查看這些引文,以了解有關該主題的更多信息,或者驗證這些來源是否真正說明了某個特定Wikipedia條目所聲稱的內容-也就是說,如果您可以找到這些來源。
來源在線時,這很容易。但是許多Wikipedia文章都依賴老式的好書。例如,小馬丁·路德·金(Martin Luther King Jr.)上的條目引用了66本書。直到最近,如果您要驗證這些書是否說了文章說的話,或者如果您只是想閱讀引用的材料,則需要跟踪該書的副本。
現在,由於Internet檔案館的一項新舉措,您可以單擊書名,並在引用的書名指定頁碼的情況下,查看被引作品的兩頁預覽。您也可以藉閱該書的數字副本,只要沒有其他人將其借出,為期兩個星期,這與從當地圖書館借書的方式幾乎相同。(一些作家和出版者團體對檔案館允許用戶借閱未經授權的掃描書籍的做法提出了質疑。互聯網檔案館說,它試圖以“平衡和尊重的方式”擴大對書籍的訪問。)
到目前為止,Internet存檔已將Wikipedia條目中的130,000種各種語言的引用轉換為指向該組織已掃描並向公眾公開的50,000本書的直接鏈接。該組織最終希望允許用戶查看和借閱Wikipedia引用的每本書,最終目的是將有史以來出版的每本書數字化。
Internet檔案館Wayback Machine服務主管Mark Graham表示:“我們的目標是成為一個有用的圖書館,並使更多的人可以訪問。”
如果成功的話,互聯網檔案館的項目將對學生,新聞工作者或任何想要查看Wikipedia條目引用的人大有裨益。Google圖書還擁有大量的數字化印刷圖書,但它往往只顯示文本的小片段。
“我曾嘗試通過搜索Google圖書中的內容來驗證Wikipedia的頁面,但這是一個不可預測的鏈接,而且您通常沒有足夠的周圍環境來評估使用情況,”數字掃盲專家兼混合與融合總監Mike Caulfield說。溫哥華華盛頓州立大學的網絡學習。“閱讀報價中一兩個頁面的能力對於試圖保護文章完整性的編輯者以及需要進行下一步驗證的讀者來說都是至關重要的。”
當然,您可以通過跟踪書籍的物理副本來以傳統方式驗證信息。但是,在學期論文上熬夜的學生,或者緊迫的截止日期的記者,都可能沒有時間在亞馬遜上訂購一本書,或者沒有時間等待圖書館出版。在其他情況下,可能很難獲得書籍。互聯網檔案館合夥人溫迪·花村(Wendy Hanamura)說,例如,在第二次世界大戰期間關押日裔美國人的Wikipedia條目中,標題很難找到。但是,由於互聯網檔案館由西雅圖組織Densho創建的日裔美籍監禁數字圖書館,許多稀有書籍現在都可以在線獲得。
在2016年大選後,互聯網檔案館開始著手將數字書籍編入Wikipedia。Internet Archive創始人布魯斯特·卡勒(Brewster Kahle)上週在舊金山的一次演講中說:“無論您想當總統,我幾乎都說所有人都會同意整個過程都是一場火車事故。”。從外國發起的虛假新聞和不真實的社交媒體運動,到對投票系統本身被操縱的擔憂,技術和信息系統有很多方法使公眾不及格。因此Kahle召集了一群人來討論如何改善信息生態系統。出現的一個問題是維基百科引文的脆弱性。書籍和學術期刊為Wikipedia編輯提供了一些最好,最可靠的信息,但是這些資源經常在網上不可用或在付費專區後面。甚至免費提供的互聯網內容也經常消失。
Internet存檔處於幫助解決此問題的獨特位置。自2001年以來,該組織的Wayback Machine服務已存檔了3870億個網頁。它還一直在對物理書籍和其他模擬媒體進行數字化處理,現在已掃描了380萬本書籍。它存儲了數百萬本書籍。
Graham和他的公司創建了InternetArchiveBot,該工具可掃描Wikipedia斷開的鏈接,並自動將鏈接添加到Wayback Machine中存檔的版本。由於自動編輯工具需要特殊的權限才能使用,因此Graham必須與以各種語言管理百科全書版本的Wikipedia社區合作。他說:“總的來說,我們已經編輯了1400萬個鏈接;指向Internet存檔的鏈接超過1100萬個。”
向書籍添加鏈接是相似的,但更具挑戰性。格雷厄姆解釋說:“如果一本書有一個ISBN號,而一個條目具有傳統的引文格式,那就很容易了。” 但是,並非所有的書都有ISBN號,許多Wikipedia的引文格式都不正確。例如,有些僅引用書,而不引用特定的頁碼。一本書的不同版本之間也可能存在差異。
當然,互聯網檔案館還沒有掃描維基百科引用的所有書籍。人們正在努力數字化來自世界各地的圖書館的藏書,以及來自諸如Better World Books之類的公司的捐贈。格雷厄姆說,該組織每天掃描超過1000本書。但是它還有很多工作要做。
原文連結▼
https://www.wired.com/story/internet-archive-wikipedia-more-reliable/