大數據分析教程Solr【一】《Solr權威指南(上卷)》

2021-02-24 源碼DNA分享



關注公眾號回複數字01141407,獲取電子書下載地址:





Solr權威指南(上卷) 以圖文並茂的形式、通俗易懂的語言講解了Solr使用中的各個知識點,能夠幫助對Solr感興趣的讀者快速了解Solr。由於目前有關Solr相關技術的書籍全部都是英文版的,所以對於英文不太好而又極其需要快速學會使用Solr的讀者來說,這是一個福音。下卷:主要針對中高端讀者,重點介紹了關於Solr查詢、SolrJ、SolrCloud、Solr性能優化等的相關知識。對於Solr查詢,下卷主要針對的是高階知識部分,包括使用遊標實現高效的深度分頁查詢、實現對查詢返回的查詢結果集進行自定義排序、使用相關性權重來提高查詢返回結果集的相關性、FunctionQuery的使用方法、FunctionQuery的自定義方法等;對於SolrJ、SolrCloud的介紹,則均是從基礎概念開始,逐步深入到具體的使用和管理方法;對於Solr性能優化,則主要集中在注意事項、具體建議等實操部分的介紹。在全書後,還單獨利用一章對之前沒涉及的零散內容進行集中介紹,包括版本升級、自定義偽域、自定義Redis緩存、流式處理等內容。

目錄
序言
第1章 初識Solr 1
1.1 Solr是什麼 1
1.2 Solr的歷史 2
1.3 為什麼要選擇Solr 2
1.4 Solr功能預覽 3
1.5 Solr下載 3
1.6 Solr學習資源 5
1.7 Windows平臺下部署Solr 7
1.7.1 部署Solr至Jetty 7
1.7.2 部署Solr至Tomcat 13
1.8 Linux平臺下部署Solr 16
1.9 玩轉post.jar 20
1.10 在Eclipse中編譯Solr源碼 25
1.11 本章總結 27
第2章 Solr基礎 28
2.1 Solr Core 28
2.1.1 Solr Core簡介 28
2.1.2 Core的基本管理 30
2.1.3 Core Http接口 35
2.1.4 添加索引至Core 36
2.2 Solr DIH 38
2.2.1 索引文件夾下的文本文件 38
2.2.2 索引JSON/XML/CSV文件 42
2.2.3 使用Tika索引Word/Excel/PDF 45
2.2.4 索引網絡上的遠程文件 52
2.2.5 索引XML文件 55
2.2.6 從資料庫中導入數據至Solr 57
2.2.7 Solr DIH總結 62
2.3 Solr Full Import全量導入 78
2.4 Solr Delta-import增量導入 80
2.5 Solr索引 85
2.5.1 Lucene索引原理 85
2.5.2 Lucene中常見術語詳解 87
2.5.3 創建Solr索引 98
2.5.4 Solr Cell 99
2.5.5 Solr索引去重檢測 102
2.5.6 Solr更新請求處理鏈 104
2.5.7 Solr原子更新 105
2.5.8 使用Luke查看索引 107
2.6 本章總結 109
第3章 Solr配置 110
3.1 solr.xml配置詳解 110
3.2 solrconf?ig.xml配置詳解 112
3.3 schema.xml配置詳解 139
3.3.1 Solr Schema設計思想 139
3.3.2 Solr眼裡的世界 139
3.3.3 域分詞 140
3.3.4 Solr的schema文件 140
3.3.5 Solr的域類型 141
3.3.6 Solr的域 153
3.3.7 Schema API 157
3.3.8 Schemaless Mode 165
3.4 data-conf?ig.xml配置詳解 167
3.5 zoo.cfg配置詳解 169
3.6 本章總結 169
第4章 Solr分詞 170
4.1 分詞的基本概念 170
4.1.1 理解Analyzer 170
4.1.2 理解Tokenizer 171
4.1.3 理解TokenFilter 172
4.2 Solr分詞器 172
4.2.1 Analyzer 173
4.2.2 Tokenizer 174
4.2.3 TokenFilter 182
4.2.4 CharFilter 202
4.2.5 Solr自定義分詞 206
4.3 中文分詞器 217
4.3.1 IK分詞器 217
4.3.2 Ansj分詞器 223
4.3.3 MMSeg4J分詞器 233
4.3.4 Paoding分詞器 240
4.3.5 Jcseg分詞器 245
4.3.6 Ictclas分詞器 258
4.3.7 FudanNLP 259
4.3.8 HanLP 262
4.3.9 Jieba分詞器 266
4.3.10 分詞器使用建議 268
4.4 本章總結 270
第5章 Solr查詢 271
5.1 Solr查詢概述 271
5.2 Solr查詢相關度簡述 273
5.3 Solr的查詢語法解析器 275
5.4 Lucene的基本查詢語法 283
5.5 Solr的標準查詢語法解析器 287
5.6 Solr DisMax 288
5.7 Solr eDisMax 291
5.8 Solr的其他查詢語法解析器 298
5.9 Query VS Filter Query 305
5.9.1 fq VS q 306
5.9.2 Filter Query緩存 307
5.9.3 Filter Query執行順序 308
5.9.4 Post Filter 308
5.10 Solr返回結果 309
5.10.1 設置響應輸出格式 309
5.10.2 選擇返回域 310
5.10.3 分頁查詢 312
5.11 Solr排序 313
5.11.1 根據域進行排序 313
5.11.2 缺失值處理 314
5.11.3 排序的內存佔用 315
5.12 調試查詢結果 315
5.12.1 返回調試信息 315
5.12.2 開啟調試模式 316
5.13 本章總結 316
第6章 Solr Facet 317
6.1 理解Facet 317
6.2 Facet簡單示例 319
6.3 Query Facet 326
6.4 Range Facet 328
6.5 FacetFilter 330
6.6 Multiselect Faceting 335
6.6.1 key 335
6.6.2 tag 336
6.7 本章總結 339
第7章 Solr高亮 340
7.1 什麼是Solr高亮 340
7.2 Solr高亮的工作原理 342
7.2.1 Fragmenter 348
7.2.2 Scorer 349
7.2.3 Encoder & Formatter 349
7.3 Facet & Highlighting 350
7.4 高亮多值域 351
7.5 高亮參數 352
7.6 FastVectorHighlighter 355
7.7 PostingsHighlighter 356
7.8 本章總結 358
第8章 Solr Query Suggestion查詢建議 360
8.1 Spell-Check 361
8.1.1 Spell-Check簡單示例 361
8.1.2 Spell-Check查詢組件 362
8.2 Autosuggest 366
8.3 基於N-Gram實現Autosuggest 369
8.4 基於用戶行為實現Autosuggest 371
8.5 本章總結 375
第9章 Solr Group分組 376
9.1 Result grouping VS Field collapsing 377
9.2 按照指定域分組 377
9.3 每個分組返回多個文檔 381
9.4 按照Function動態計算值分組 382
9.5 按照任意Query分組 383
9.6 Group的分頁與排序 383
9.7 Group& Facet 384
9.8 Group分布式查詢 387
9.9 Group緩存 388
9.10 使用Collapsing Query Parser實現高效的Field Collapsing 388
9.11 Solr Group VS SQL Group by 389
9.12 本章總結 390
第10章 Solr企業級應用 391
10.1 Solr源碼編譯與補丁應用 391
10.2 部署Solr 396
10.2.1 構建你自己的Solr發布版本 397
10.2.2 Embedded Solr 397
10.3 Solr硬體要求與系統配置 397
10.3.1 內存和SSD 397
10.3.2 JVM配置 398
10.3.3 思考Solr索引與查詢性能 401
10.4 Solr數據批量導入 405
10.5 Solr Shard與Replication 406
10.5.1 Shard 406
10.5.2 Replicate 408
10.6 Core管理 410
10.7 Solr集群管理 412
10.7.1 Solr Ping健康檢測 412
10.7.2 Solr配置文件管理 413
10.8 如何與Solr交互 414
10.8.1 使用REST API與Solr交互 415
10.8.2 使用SolrJ與Solr進行交互 415
10.9 監控你的Solr 418
10.9.1 Solr的性能統計 418
10.9.2 Solr的緩存性能 419
10.9.3 Solr JMX 419
10.9.4 Solr日誌 424
10.9.5 Solr負載測試 424
10.10 Solr版本升級 428
10.11 本章總結 428

關注公眾號回複數字01141407,獲取電子書下載地址:

相關焦點

  • 乾貨 如何用Solr搭建大數據查詢平臺
    果斷Down了那個褲子,然後就一發不可收拾,走上了收藏褲子的不歸路,直到有一天,我發現收藏已經非常豐富了,粗略估計得好幾十億條數據,拍腦袋一想,這不能光收藏啊,我也搭個社工庫用吧……0x01 介紹社工庫怎麼搭呢,這種海量數據的東西,並不是簡單的用mysql建個庫,然後做個php查詢select * from sgk where username
  • Solr實踐|Solr常用檢索查詢業務Demo
    概述本文針對已經入門的同學,提供各種類型的場景查詢Demo,以及一些分析統計型的查詢Demo。
  • 《豔遇solr》5--solr6.3.0 AdminUI查詢中各參數的含義
    直觀的看,第一條數據,搜索詞出現3次,剩餘的兩條數據ipod只出現了一次。score的值不是固定不變的。它僅用於lucence內部做相關性排序使用,查詢詞不同,分數也不同。每一次查詢時,每一個文檔會被計算出一個和查詢詞匹配的分數,分數越高,文檔和查詢詞越相關。
  • Jazz公司solriamfetol在美國監管時間表延長3個月
    今年11月初,歐洲藥品管理局(EMA)也受理了solriamfetol的上市許可申請(MAA)。FDA認定,在討論solriamfetol標籤草案的過程中Jazz提交的一份NDA文件是對NDA的一項重大修改,因此將PDUFA目標日期延長了3個月,以便對申請文件進行更全面的審查。
  • 嗜睡新藥solriamfetol歐盟批准在即:治療發作性睡病/阻塞性睡眠...
    solriamfetol是一種雙重作用多巴胺和去甲腎上腺素再攝取抑制劑(DNRI),已被證實用於成人治療與發作性睡病或OSA相關的EDS可改善覺醒。現在,CHMP的意見將由歐盟委員會(EC)進行審查,該機構預計在未來2個月內做出最終決定。如果獲批,solriamfetol將是歐洲唯一一種被批准用於OSA成人患者治療EDS的藥物。
  • Apache Solr 3.5 發布,全文搜索伺服器
    下載地址:http://www.apache.org/dyn/closer.cgi/lucene/solr值得關注的改進內容有:Bug fixes and improvements from Apache Lucene 3.5.0, including a very substantial (3-5X) RAM reduction required to hold
  • 大數據分析資料精選
    與統計學、數據分析、數據挖掘、商業智能、數據開發、數據展現等相關的經典資料匯總,均搬運自網際網路上各數據愛好者對外分享公布,數據哥在此僅匯總整理作為學習
  • 500道高頻面試+4套Github商城項目教程(源碼+視頻)
    MyBatis、SpringBoot、SpringCloud、BIO、NIO、AIO、Netty、Tomcat、Redis、MySQL、Memcache、ElasticSearch、zookeeper、RabbitMQ、Vue、Dubbo、並發編程、Java虛擬機、TCP、Http、大數據
  • 大數據分析Python NumPy庫使用教程
    我將在大數據分析Python NumPy庫使用教程中學到什麼? 大數據分析Python NumPy庫使用教程為數據工程師提供有關NumPy的從零開始的培訓。這意味著您不需要具有NumPy的任何經驗,也不會浪費任何時間學習與數據工程工作無關的東西。
  • 我,30歲,部隊服役5年,零基礎轉大數據
    學習過程簡單粗暴,學完,開始面試,面完總結,繼續面,不過沒關係,繼續面...目前已拿到一家中型公司的大數據開發offer。選擇大數據在部隊裡其實就傾心大數據很久了,還記得買的第一本大數據書是《Big Data》。那時候就準備出去了就做這行業。當時感覺就是這個行業挺好的!出來之後最大的困難就是從畢業開始接近五年的時間,沒有工作經驗。雖然在部隊裡面做的也是相關的,偏資料庫的。簡歷沒法寫啊!
  • TEM制樣+操作+數據分析+教程書籍
    本期【材料測試表徵系列】針對TEM測試表徵過程中可能遇到的問題,整理出了TEM制樣﹑操作﹑數據分析﹑教程書籍資料大全,希望能為讀者提供一些有價值的信息。1.透射電鏡 PPT講義2.第4卷討論各種能譜的分析方法與技術。比如X射線譜、X射線定量定性分析、電子能量損失譜、離子能量損失譜等。在電子顯微學研究中最為基本的理論是衍射理論,因而該書利用相當大的篇幅介紹衍射理論以及與其緊密相關的晶體結構,這些知識是材料學專業的重要基礎理論之一。
  • hadoop與數據挖掘的關係_區別_哪個好
    hadoop與數據挖掘的關係 大數據就是Hadoop嗎?當然不是,但是很多人一提到大數據就會立刻想到Hadoop。現在數據科學家利用海量數據創建數據模型為企業帶來的利益是以前所不可想像的,但是數據的潛力已經被完全挖掘出來了嗎,它滿足了人們的期待了嗎?今天小編就從Hadoop項目開始為你抽絲剝繭了解hadoop。
  • 【Big Data】11項全球最具權威的大數據資質認證
    具備大數據分析相關經驗的數據科學家與分析師以及了解如何打理Hadoop集群與其它技術的工程師與開發人員如今正變得炙手可熱。當下與大數據緊密相關的認證數量正迅速提升,或許以下十一項資質認證是你最值得認真考慮的備選項目。數據科學家、數據分析師、工程師乃至開發人員注意了!只要擁有能夠處理大數據相關技術的能力,人才市場就會展現出慷慨的笑容與熱情的懷抱。想在下一次求職時更上一層樓?