科技英語翻譯實例:搜尋引擎 Search Engines

2020-12-14 新東方網

  搜尋引擎 Search Engines

  Internet search tools fall into two camps:search engines,such as HotBot and AltaVista,and online directories,such as Yahoo and Lycos.The difference between the two is related to how they compile their site listings.Of course,there are exceptions to every rule.Some search utilities,such as Ask Jeeves,combine the search engine and directory approaches into a single package,hoping to provide users with the best of both worlds.

  In directory-based search services,the Web site listings are compiled manually.For example,the everpopular Yahoo dedicates staff resources to accept site suggestions from users,review and categorize them,and add them to a specific directory on the Yahoo site.

  You can usually submit your Web site simply by filling out an online form.On Yahoo,for example,you』ll find submission information at www.yahoo.com/docs/info/include.html.Because human intervention is necessary to process,verify,and review submission requests,expect a delay before your site secures a spot in a directory-based search service.

  On the flip side,search engines completely automate the compilation process,removing the human component entirely.

  A software robot,called a spider or crawler,automatically fetches sites all over the Web,reading pages and following associated links.By design,a spider will return to a site periodically to check for new pages and changes to existing pages.

  Results from spidering are recorded in the search engine’s index or catalog.Given the wealth of information available on the Internet,it is not surprising that indexes grow to very large sizes.For example,the AltaVista index has recently been increased to top out at 350 million pages.This may seem like a mammoth number,but by all estimates it still represents less than 35 percent of all pages on the Web.

  Because of the depth and breadth of information being indexed,there is usually a delay,sometimes up to several weeks,between the time a site has been『spidered』and when it appears in a search index.Until this two-step process has been completed,a site remains unavailable to search queries.

  Finally,the heart of each search engine is an algorithm that matches keyword queries against the information in the index,ranking results in the order the algorithm deems most relevant.

  Because the spiders,resulting indexes,and search algorithms of each search engine differ,so do the search results and rankings across the various search engines.This explains why a top 10 site in HotBot may not appear near the top of Alta Vista when the same keyword search criterion is entered.

  In addition,many,but not all,search utilities also reference metatags—invisible HTML tags within documents that describe their content—as a way to control how content is indexed.As a result,proper use of metatags throughout a site can also boost search engine ranking.

  該篇科技英語-計算機英語的文章的對應譯文:

  網際網路搜索工具分為兩大陣營:搜尋引擎,如HotBot和AltaVista,以及在線目錄,如Yahoo和Lycos。兩者間的差別與它們如何編撰網站編目有關。當然,對任何規律都有例外。有些搜索實用程序,如Ask Jeeves,把搜尋引擎和目錄方法合併成單一的軟體包,希望把這兩個陣營中最好的東西提供給用戶。

  在基於目錄的搜索服務中,Web網站編目是手工編撰的。比如一直流行的Yahoo就指定專門的人力資源來接受用戶對網站的建議,並對建議進行評價和分類,再把它們加到Yahoo網站上特定目錄中。

  通常是通過簡單地填寫在線表格就能把你的網站信息提交給(搜尋引擎)。例如,在Yahoo網站上,你可以在 www.yahoo.com/docs/info/include.htm1上找到提交信息。由於人工幹預對處理、驗 證和評價提交請求是必要的,所以在網站在基於目錄的搜索服務中捕捉到一處之前,可 望有些延遲。

  另一方面,搜尋引擎完全實現了編撰過程的自動化,徹底消除了人工幹預。

  一個叫做蜘蛛或爬蟲的軟體機器人自動地在整個Web上取出站點,閱讀頁面和跟隨相關的連結。通過設計,蜘蛛可以周期性地返回到站點,檢查新的頁面和修改已有頁面。

  蜘蛛爬行得到的結果記錄在搜尋引擎的索引或目錄中。已知了網際網路上可資利用的信息的價值,對索引擴張到非常大的規模是不會感到驚訝的。 例如,AltaVista的索引最近已增至3.5億頁而名列前茅。這個數字看來好像非常大,但總體估計它僅代表了Web上不足35%的頁面。

  由於已編索引的信息的深度與廣度(非常大),所以通常在「蜘蛛爬行過」站點的時間與出現在搜索索引中的時間之間有一個延遲,有時多達幾周。只有這兩步的過程完成之後,站點才能供搜索查詢使用。

  最後,每個搜尋引擎的心臟是一種算法,它將關鍵字查詢與索引中的信息匹配起來,並按算法認為最有關聯的順序把結果列出。

  由於每種搜尋引擎的蜘蛛、產生的索引和搜索算法都是不一樣的,所以在不同搜尋引擎上的搜索結果和排列次序是不同的。這就解釋了為什麼當相同的關鍵字搜索準則輸入進去時,HotBot中排在最前面的10個站點不會出現在 AltaVista中最前面的站點中。

  此外,很多(但不是所有的)搜索實用程序也引用元標記(文檔中用來描述其內容的、看不見的HTML標記),作為控制內容如何編索引的方法。因此,在整個站點中正確使用元標記也能提高(此站點)在搜尋引擎中的排列名次。

 

相關焦點

  • ...usually just using the search engines to look up...
    新東方網>英語>英語學習>口語>每日一句英語>正文新東方英語每日一句:I'm usually just using the search engines to look up information.
  • 搜尋引擎優化的核心內容
    不要羅列重複的相連的關鍵字,這很容易看出你在spam,比如,如果你有3個關鍵字,不應該如此排列:search,search,search,engine, engine,engine,position,position,position而應如此排列:search,engine,position,search, engine,position,search
  • 不妨試試把搜尋引擎當詞典用!
    國內學者撰寫的科技論文,相比語法錯誤,更加普遍的是表達方式的中國化,用詞不準,搭配失當,所謂Chinglish是也。中國式用詞或搭配,可能讓「老外」同行一頭霧水、不知所云。譬如,「重複次數」,iteration time,還是number of iterations?「潛力」,是potential ability,還是potential?
  • SimilarSiteSearch:相似網站搜尋引擎
    SimilarSiteSearch:相似網站搜尋引擎 SimilarSiteSearch相似圖片、相似人臉搜索總能讓我們的網絡生活驚喜不斷。
  • 搜尋引擎 Elasticsearch 中文擴展分詞器使用,更快更準確!
    Elasticsearch是一個基於Lucene,Lucene是開源的Java索引檢索組件。它提供了一個分布式多用戶能力的全文搜尋引擎,基於RESTful web接口。Elasticsearch是用Java語言開發的,並作為Apache許可條款下的開放源碼發布,是一種流行的企業級搜尋引擎。
  • 2017年6月英語四級翻譯練習:百度
    新東方網>大學教育>四六級>複習輔導>四級>四級輔導>翻譯>正文2017年6月英語四級翻譯練習:百度 2017-01-22 11:02 來源:
  • 2018考研英語翻譯每日一句:百度
    考研英語翻譯部分在試題中分值佔10%,建議同學們還是要重視起來,為自己爭取更多的分數。新東方網考研頻道考研為大家搜集整理有關社會生活、科普知識、文化教育等方面的相關句子,以此拓展大家的視野。一起來學習吧!
  • seamSearch:一個簡單的nodejs版本開源全文搜尋引擎
    這幾年nodejs越來越火爆,js程式設計師們終於可以不局限於瀏覽器那一畝三分地了,很多以前由java,c等實現的東西紛紛有了nodejs版本,我也隨波逐流一把,寫了一個nodejs的搜尋引擎addon,現在已經放GitHub: https://github.com/luyongfugx/seamSearch這個開源addon其實是對我幾年前寫的c++ 版的
  • 使用Elasticsearch做一個好用的日語搜尋引擎及自動補全 - 計算機...
    最近基於 Elastic Stack 搭建了一個日語搜索服務,發現日文的搜索相比英語和中文,有不少特殊之處,因此記錄下用 Elasticsearch 搭建日語搜尋引擎的一些要點。本文所有的示例,適用於 Elastic 6.X 及 7.X 版本。
  • 談談科技文章的英語翻譯見解
    隨著全球化進程的進一步推進,各國之間的交流日益頻繁,這其中也表現在了科技、文化領域。在這種形勢下,科技英語文章成為了國際科技交流的工具之一。為了更好地傳播自然科學或社會科學的知識與技術,對科技文章英語翻譯水平的要求也日益提高。在此,賽恩斯編譯對科技文章的英語翻譯談談一些見解。
  • 2013年12月大學英語四級考試翻譯實例解析(十六)
    新東方網>大學教育>四六級>複習輔導>四級>四級輔導>翻譯>正文2013年12月大學英語四級考試翻譯實例解析(十六) 2013-07-31 11:26
  • 實例精解:科技類英語句子翻譯技巧
    涉及科技方面的英語該如何翻譯呢?首先我們要抓準的就是其中的邏輯關係,教育優選小編為您帶來實例精講,詳細內容如下,大家可以參考一下。  例如:  1.其次,我們還要正確理解remember as ……這個補語的含義並恰當選擇翻譯表達形式。在翻譯中常譯為「把……叫做……」(稱……為……)。此外,句中所說的the first machines, 通常是指electronic computers 而言。從技術邏輯上看,當今世界,如果沒有具有智能的計算機一類機器,火箭就不能上天,原子能生產就無法控制。
  • 2013年12月大學英語四級考試翻譯實例解析(二十五)
    新東方網>大學教育>四六級>複習輔導>四級>四級輔導>翻譯>正文2013年12月大學英語四級考試翻譯實例解析(二十五) 2013-07-31 13:53
  • 2013高三英語第一輪複習:search;search for; look for
    2013高三英語第一輪複習:search;search for; look for 2012-09-29 00:45 來源:新東方網整理 作者:
  • 最全的資料庫分類及實例介紹
    嚴格來說資料庫是資料庫管理系統的實例,一個資料庫管理系統可以有多個資料庫實例。資料庫種類很多,我們平時接觸最多的恐怕就是Oracle資料庫,或者MySQL數據。兩者是應用最廣泛的關係型數據。如圖1是2018年12月份使用情況排名,從排名也可以看出上述兩個資料庫分別排第一名和第二名。
  • 科技英語翻譯標準
    原文取自英語專業科技翻譯課堂資料,「第三章 科技英語翻譯標準」 課件,現整理下來供有需要的小夥伴學習使用。文章分為術語整理和筆記整理,內含科技翻譯方法和例句(出現兩種譯文對比時,譯文二為改正後的譯文),一起來學習吧!
  • Elasticsearch實現原理分析
    在翻譯的過程中,也需要查看對應部分的源碼,來加深對實現原理的理解。但這裡並沒有對源碼進行分析,源碼的分析放到後面的系列文章進行介紹。本文介紹了Elasticsearch的以下原理:是Master/Slave架構,還是Master-less架構?Elasticsearch介紹Elasticsearch的索引(index)是用於組織數據的邏輯命名空間(如資料庫)。
  • 常用的18個學術搜尋引擎
    略顯不足的是,它搜索出來的結果沒有按照權威度(譬如影響因子、引用次數)依次排列,在中國搜索出來的,前幾頁可能大部分為中文的一些期刊的文章。 2、http://www.scirus.com/Scirus是目前網際網路上最全面、綜合性最強的科技文獻搜尋引擎之一,由Elsevier科學出版社開發,用於搜索期刊和專利,效果很不錯!
  • 2013年12月大學英語四級考試翻譯實例解析(一)
    新東方網>大學教育>四六級>複習輔導>四級>四級輔導>翻譯>正文2013年12月大學英語四級考試翻譯實例解析(一) 2013-07-31 09:55
  • 研究生常用的十八大學術搜尋引擎
    3、http://www.scirus.comScirus是目前網際網路上最全面、綜合性最強的科技文獻搜尋引擎之一,由Elsevier科學出版社開發,用於搜索期刊和專利,效果很不錯!4、http://www.base-search.net/BASE是德國比勒費爾德(Bielefeld)大學圖書館開發的一個多學科的學術搜尋引擎,提供對全球異構學術資源的集成檢索服務。