Apache Pulsar 2.6.1 版本正式發布:功能增強,新增 OAuth2 支持

2020-12-23 開源中國

在 Apache Pulsar 2.6.0 版本發布後的 2 個月,2020 年 8 月 21 日,Apache Pulsar 2.6.1 版本正式發布!

Apache Pulsar 2.6.1 修復了 2.6.0 版本中的諸多問題,改進了一些功能,新增了對 OAuth2 的支持,覆蓋 Broker、Pulsar SQL、Pulsar Functions、Go Function、Java Client 和 C++ Client,進一步豐富了 Pulsar 作為雲原生流數據平臺的功能。

在 Pulsar 2.6.1 版本中,來自社區的 commit 有 102 個,越來越多的小夥伴開始參與到 Pulsar 社區建設中,成為 Contributor 的一員。下面一起來看看 2.6.1 版本有哪些更新吧。

Broker 相關改進

📣 將批處理大小限制為 「maxNumberOfMessages」 和 「 maxSizeOfMessages」 的最小值

在 2.6.0 版本之前,BatchReceive 策略中 maxNumberOfMessages 和maxSizeOfMessages 的最小值不會影響批處理大小。當批量大小大於 consumer 中設置的 receiveQueue 大小時(假設使用的批量大小為 3000,receiveQ 為 500),會出現以下問題:

在 consumer 中使用多主題模式,client 被阻塞,導致不接收任何消息;即使用戶在批處理中設置超時策略,client 也不會恢復。

在 2.6.1 版本中,我們把批處理大小設置為 「maxNumberOfMessages」 和 「maxSizeOfMessages」 中的最小值,修復了該問題。

更多詳情查看 PR-6865:https://github.com/apache/pul...。

📣 解決 Key_Shared 中使用粘性 hash range 導致的哈希範圍衝突問題

在以前的版本中,當用戶在 Key_Shared 訂閱模型中使用 「stickyHashRange」 時,consumer 指定的 hash 範圍不允許重疊。例如,consumer-1 的哈希範圍為:[[0,99],[400,65535]],consumer-2 的哈希範圍為:[[100,399]]。

這是因為在 broker 端,沒有對 stick hash range 中的 start 和 end 位置進行檢查。正常情況下不允許 start 大於 end 的位置。在 2.6.1 版本中,我們加入了相應的 check 機制,來避免出現 hash range 衝突的問題。

更多詳情查看 PR-7231:https://github.com/apache/pul...。

📣 修復獲取 lookup 權限的錯誤

當前,當 Pulsar AuthorizationService 檢查 lookup 權限時,擁有 canProducer 或 canConsumer 角色應該具備可以 canLookup 的能力,但實際上並沒有該能力。代碼如下:

javatry { return canLookupAsync(topicName, role, authenticationData) .get(conf.getZooKeeperOperationTimeoutSeconds(), SECONDS);}

如果 canProduce 或 canConsume 方法拋出異常,canLookup 只會拋出該異常,不檢查其他權限。

在 2.6.1 版本中,使用 canLookupAsync 代替原來的行為,更多詳情查看 PR-7234:https://github.com/apache/pul... 。

📣 修復創建 non-durable cursor 時無法刪除 topic 的錯誤

當非持久遊標創建失敗時,會返回 NPE。因為程序發生 NPE 後,仍在繼續創建訂閱實例:

javatry { cursor = ledger.newNonDurableCursor(startPosition, subscriptionName);} catch (ManagedLedgerException e) { subscriptionFuture.completeExceptionally(e);}return new PersistentSubscription(this, subscriptionName, cursor, false);

將導致該 topic 的引用計數加一。當用戶想要刪除這個 topic 時,由於引用計數沒有清零,所以即使使用 --force 強制刪除,也無法刪除 topic。在 2.6.1 版本中,我們解決了無法刪除 topic 的問題。

更多詳情查看 PR-7355:https://github.com/apache/pul...。

📣 避免在 ManagedLedgerImpl.isOffloadedNeedsDelete 方法中發生 NPE

在 2.6.1 版本之前,offload-deletion-lag 的默認值為 null,導致了 NPE 問題。在 2.6.1 版本中,我們在 ManagedLedgerImpl.isOffloadedNeedsDelete 方法中添加對 null 值的檢查,避免出現該問題。

更多詳情查看 PR-7389:https://github.com/apache/pul... 。

📣 修復創建新 ledger 時引發 NPE 導致生產者卡死的問題

由於無法解析網絡地址,在創建 ledger 時會引發 NPE。如果在添加超時任務之前引發了 NPE,則超時機制不起作用。無法解析的網絡地址在 Kubernetes 環境中很常見。當 bookie pod 或工作程序節點重新啟動時,可能會發生這種情況。

在 2.6.1 版本中,可通過以下操作來修復該問題:

  • 在創建一個新的 ledger 時,捕獲這個 NPE;
  • 觸發超時任務時,始終執行回調。因為回調只能觸發一次;
  • 添加機制檢測 「CreatingLedger」 狀態是否發生變化。

更多詳情查看 PR-7401:https://github.com/apache/pul...。

📣 修復使用 advertisedListeners 產生的 NPE 問題

當使用帶有外部 listener 名稱的 advertisedListeners = internal:pulsar:// node1:6650,external:pulsar://node1.external:6650 時,broker 無法獲取名稱空間包的所有權。如果未啟用 TLS,我們需要更改 BrokerServiceUrlTls

更多詳情查看 PR-7620:https://github.com/apache/pul... 。

📣 獲取最後一條 entry 時,client 錯誤地讀取 -1 這條 entry

在 2.6.1 版本之前,getLargestBatchIndexWhenPossible() 函數沒有 return 語句,當 entry 為 -1時,client 會對把相應的 MessageData 設置為當前位置的值,並將該值發送到 client,當 client 嘗試讀取該 entry,會出現如下問題:

16:34:25.779 [pulsar-io-54-7:org.apache.bookkeeper.client.LedgerHandle@748] ERROR org.apache.bookkeeper.client.LedgerHandle - IncorrectParameterException on ledgerId:0 firstEntry:-1 lastEntry:-116:34:25.779 [pulsar-client-io-82-1:org.apache.pulsar.client.impl.ConsumerImpl@1986] INFO org.apache.pulsar.client.impl.ConsumerImpl - [persistent://external-repl-prop/pulsar-function-admin/assignment][c-use-fw-localhost-0-function-assignment-initialize-reader-b21f7607c9] Successfully getLastMessageId 0:-116:34:25.779 [pulsar-client-io-82-1:org.apache.pulsar.client.impl.ClientCnx@602] WARN org.apache.pulsar.client.impl.ClientCnx - [id: 0xc78f4a0e, L:/127.0.0.1:55657 - R:localhost/127.0.0.1:55615] Received error from server: Failed to get batch size for entry org.apache.bookkeeper.mledger.ManagedLedgerException: Incorrect parameter input16:34:25.779 [pulsar-client-io-82-1:org.apache.pulsar.client.impl.ClientCnx@612] WARN org.apache.pulsar.client.impl.ClientCnx - [id: 0xc78f4a0e, L:/127.0.0.1:55657 - R:localhost/127.0.0.1:55615] Received unknown request id from server: 10

PR-7495 在代碼中增加了 return 語句,GetLastEntry() 會讀取最後一條 entry,而不是 -1。 

更多詳情查看 PR-7495:https://github.com/apache/pul...。

ZooKeeper 相關改進

📣 使用主機名進行 Bookie 機架感知映射

PR-5607 中添加了 useHostName() 和 return false。這意味著機架式策略會嘗試將 Bookie 主機名解析為 IP 地址,然後使用該 IP 地址來確定 Bookie 屬於哪個機架。

這會導致如下兩個問題:

  • IP 地址與在/ bookies z-節點中記錄的主機名不匹配;
  • 如果在解析 bookie 主機名時發生錯誤(例如:瞬態 DNS 錯誤),會觸發 NPE 異常;對 BookKeeper 客戶端來說,該 bookie 在集群中一直不可用。

例如,在下面代碼中的第 77 行會拋出 NPE,因為 getAddress() 給出了一個 null,而該地址沒有解析:

java74 if (dnsResolver.useHostName()) {75 names.add(addr.getHostName());76 } else {77 names.add(addr.getAddress().getHostAddress());78 }

默認情況下,DnsResolver.useHostName() 返回 true

更多詳情參考 PR-7361:https://github.com/apache/pul...。

Java Client 相關改進

📣 修復了無法重命名 Athenz 身份驗證中使用的 HTTP header 的問題

Athenz 的身份驗證插件允許用戶更改 HTTP header 的名稱,並通過 roleHeader 參數將身份驗證令牌發送到代理伺服器。更改 HTTP header 名稱會保留 「AuthenticationAthenz」 側的 「roleHeader」 參數的值,並將其直接用作標頭名稱。

更多詳情參考 PR-7311:https://github.com/apache/pul...。

📣 修復多次回收 batch ack 的集合

多次回收 batch ack 的根本原因是批量 Ack 刷新和累積確認中存在競爭條件。因此,為該 ackset 添加回收狀態檢查,避免多次回收 batch ack。

更多詳情參考 PR-7409:https://github.com/apache/pul...。

📣 添加支持 OAuth2 身份驗證的客戶端

Pulsar 支持使用 OAuth 2.0 訪問令牌驗證客戶端身份。可以使用令牌來標識 Pulsar 客戶端,並將令牌關聯到允許執行某些操作(例如:發布到主題或從主題消費)的某些 「principal」(或「role」)。

該模塊直接支持 OAuth 2.0 的 Pulsar 客戶端身份驗證插件。客戶端與 OAuth 2.0 伺服器進行通信後,將從 OAuth 2.0 伺服器獲取「訪問令牌」,並將該「訪問令牌」傳遞給 Pulsar broker 進行身份驗證。

因此,代理方仍然可以使用 「org.apache.pulsar.broker.authentication.AuthenticationProviderToken」,
用戶也可以添加自己的 AuthenticationProvider 來使用此模塊。

更多詳情參考 PR-7420:https://github.com/apache/pul...。

📣 在 consumer 關閉之後,不再訂閱這個 topic

當 consumer 重新連接到 broker 時,將競爭條件固定在 consumer 中。

在 consumer 重新連接到代理時會發生競爭條件,消費者重新連接到代理時連接設置為 null。如果此時關閉 cosnumer,客戶端不再向代理髮送關閉 consumer 的命令。因此,如果 consumer 重新連接到 broker,consuemr 將再次發送訂閱命令。

在 2.6.1 版本中,當 consumer 的連接打開時,consumer 會添加狀態檢查。如果使用者狀態為關閉或正在關閉,則無需發送訂閱命令。

更多詳情參考 PR-7589:https://github.com/apache/pul...。

📣 OAuth2 身份驗證插件使用 AsyncHttpClient

在之前的版本中,OAuth2 客戶端 auth 插件使用 Apache HTTP 客戶端庫發出請求,Apache HTTP 客戶端僅用於主機名驗證。如 PR-7612 所述,為了擺脫對 Apache HTTP 客戶端庫的依賴,在 2.6.1 版本中使用 AsyncHttpClient。AsyncHttpClient 在客戶端和 broker 中的其他地方都有使用。

更多詳情參考 PR-7615:https://github.com/apache/pul...。

CPP Client 相關改進

📣 在 CPP 客戶端中支持 OAuth2 的認證方式

Pulsar 支持使用 OAuth 2.0 訪問令牌對客戶端進行身份驗證。可以使用令牌來標識 Pulsar 客戶端,並將其與允許執行某些操作(例如:發布到主題或從主題消費)的某些「principal」(或「role」)關聯。 

在 2.6.1 版本中,允許用戶在 CPP 客戶端中使用 OAuth2 的認證方式。

更多詳情參考 PR-7467:https://github.com/apache/pul...。

📣 修復在關閉 callback 中 partition 索引的錯誤

在分區生產者/消費者中關閉 callback 時,分區索引始終為 0。我們需要將 ProducerImpl / ConsumerImpl 的內部 partition 索引欄位傳遞給 PartitionedProducerImpl / PartitionedConsumerImpl 的 close 回調。

更多詳情參考 PR-7282:https://github.com/apache/pul...。

📣 修復了 C++ 客戶端中計時器的競爭狀況導致的段崩潰

在 2.6.1 版本之前,競爭條件下會發生段崩潰:

  • 關閉操作,稱為 「keepAliveTimer_.reset()」;
  • 同時,在 startConsumerStatsTimer 和 handleKeepAliveTimeout 方法中訪問計時器。

在 2.6.1 版本中,我們修復了此問題,競爭條件下不再發生段崩潰。

更多詳情參考 PR-7572:https://github.com/apache/pul...。

📣 支持從文件讀取憑據

支持從文件讀取憑據,使其與 Java 客戶端保持一致。

更多詳情參考 PR-7606:https://github.com/apache/pul...。

📣 修復在連接出錯時多 topic consumer 的段錯誤

當創建 consumer 出現錯誤時,多主題 consumer 將觸發段錯誤。這是使用 null 回調關閉部分使用者的調用所致。

在 2.6.1 版本中,我們修復了此問題。

更多詳情參考 PR-7588:https://github.com/apache/pul...。

Functions 相關改進

📣 使用標準主機名作為 worker 的默認值

Java 8 和 Java 11 獲取主機名的方法不同。在 Java 8 中,使用 InetAddress.getLocalHost()參數,getHostName()返回完全限定的主機名。在 Java 11 中,則是返回簡單主機名。使用 getCanonicalHostName()` 參數後,在Java 8 和 Java 11 中都能返回完全限定的主機名。 

更多詳情參考 PR-7360
https://github.com/apache/pul...

📣 修復 2.6.0 引入的向後兼容問題

PR-5985 破壞了向後兼容性。如果分開運行 Function Worker 與 Broker,Function Worker 和 broker 從 2.5 版本單獨更新到 2.6 版本時會發生以下錯誤:

textjava.lang.NullPointerException: null\n\tat java.net.URI$Parser.parse(URI.java:3104) ~[?:?]java.net.URI.<init>(URI.java:600) ~[?:?]\n\tat java.net.URI.create(URI.java:881) ~[?:?]org.apache.pulsar.functions.worker.WorkerUtils.initializeDlogNamespace(WorkerUtils.java:160) ~[org.apache.pulsar-pulsar-functions-worker-2.7.0-SNAPSHOT.jar:2.7.0-SNAPSHOT]org.apache.pulsar.functions.worker.Worker.initialize(Worker.java:155) ~[org.apache.pulsar-pulsar-functions-worker-2.7.0-SNAPSHOT.jar:2.7.0-SNAPSHOT] org.apache.pulsar.functions.worker.Worker.start(Worker.java:69) ~[org.apache.pulsar-pulsar-functions-worker-2.7.0-SNAPSHOT.jar:2.7.0-SNAPSHOT] org.apache.pulsar.functions.worker.FunctionWorkerStarter.main(FunctionWorkerStarter.java:67) [org.apache.pulsar-pulsar-functions-worker-2.7.0-SNAPSHOT.jar:2.7.0-SNAPSHOT]

錯誤原因:2.5 版本中 broker 會對包含 bookkeeperMetadataServiceUri 欄位的請求做出響應,管理客戶端將返回該欄位為 null,從而導致 NPE。

在 2.6.1 版本中,當初始化 function worker 時,對 BookkeeperMetadataServiceUri 的 value 進行檢查,判斷其是否為 null

更多詳情參考 PR-7528:https://github.com/apache/pul...。

Pulsar Perf 相關改進

📣 在 pulsar-perf 的 producer/consumer/reader 中支持 tlsAllowInsecureConnection

在命令行工具 pulsar-perf 中支持 tlsAllowInsecureConnection 配置,以支持對不安全的 TLS 連接的集群進行 producer/consumer/reader 的性能測試。

更多詳情參考 PR-7300:https://github.com/apache/pul...。

參考信息

相關焦點

  • Pulsar Manger 0.2.0 正式發布, Apache Pulsar 的管理端
    Pulsar Manager 0.2.0 更新了以下特性:- 支持在初始化環境中配置多個地址。- 使用 PulsarAdmin 代替 HttpUtil 來管理 Pulsar 集群,這樣就可以使用 PulsarAdmin 所支持的功能。- 支持使用後端處理靜態文件,這樣用戶可以直接啟動整個的 pulsar-manager 服務,不需要配置代理。
  • Apache Pulsar 引入 Cloud Storage Sink 連接器:實現數據上雲
    如需自定義連接到其他服務提供商所需的密鑰,可以通過服務提供商接口(Service Provider Interface,SPI)註冊 `org.apache.pulsar.io.jcloud.credential.JcloudsCredential`。
  • Apache APISIX 發布 1.2 版本
    本次發布的 Apache APISIX 1.2 版本,是新特性最多的一次發布,新增了 Kafka、CORS、TCP 和 UDP logger、代理緩存、代理鏡像等多個插件,主要變更如下:內核 🌅 新增 CORS 插件.  🌅 新增 TCP logger 插件.  🌅 新增 UDP logger 插件.
  • 譯文|Pulsar Schema Registry
    解決方案:Pulsar Schema RegistryPulsar 2.0 版本[1]包含了新的 Pulsar schema registry[2]。針對上述問題,Pulsar schema registry 是一個更好的解決方案。
  • 架構師的選擇,Pulsar還是Kafka?
    > List of features: https://pulsar.apache.org/如您所見,Pulsar具有許多有趣的功能。$ wget https://archive.apache.org/dist/pulsar/pulsar-2.6.1/apache-pulsar-2.6.1-bin.tar.gz  下載連接器(可選): $ wget https://archive.apache.org/dist/pulsar/pulsar-2.6.1/connectors/{connector
  • Apache Kylin 2.4.0 發布,支持 Kafka 與 Hive 表 join
    Apache Kylin 2.4.0 發布了,Apache Kylin 是一個開源的分布式的 OLAP 分析引擎,來自 eBay
  • 譯文|LogDevice 與 Apache Pulsar 之間的對比
    原文連結: https://www.splunk.com/en_us/blog/it/comparing-logdevice-and-apache-pulsar.html 閱讀本文需要大約 8 分鐘。Facebook 已經發布開源 LogDevice[1]。
  • ...2.1 發布,租戶模式支持動態新增數據源 - OSCHINA - 中文開源...
    今日更新日誌:新增:1. 新增認證服務(zuihou-oauth-server:負責登錄、獲取用戶所有權限、資源、菜單等功能)2.
  • Apache Doris(incubating)0.11.0 版本正式發布
    經歷了三個多月的研發,Apache Doris(incubating) 0.11.0版本今天正式發布了。
  • Swoft 2.0.6 正式版本發布
    Swoft v2.0.6swoft 2.0 經過幾個版本的打磨和優化,已在大量的生產環境中使用,得到很多用戶的肯定和支持。正式版本我們做了許多改進和優化,擁有了更好的性能。新增和改進了兩個開發工具,方便開發者使用: swoft/swoole-tracker 可以幫開發者解決鏈路追蹤、內存洩漏、阻塞檢查意以及性能分析 swoft-cli 現在支持基本的應用骨架和組件結構創建,以及類文件生成功能調試利器 (swoft-swoole-tracker
  • Apache Flink 1.5.5 和 1.6.2 發布,通用數據處理平臺
    Apache Flink 1.5.5 和 1.6.2 發布了。
  • smart-doc 1.9.0 發布,新增 Open Api 3.0+ 支持
    功能特性 零註解、零學習成本、只需要寫標準java注釋。 基於原始碼接口定義自動推導,強大的返回結構推導。 支持Spring MVC,Spring Boot,Spring Boot Web Flux(controller書寫方式)。 支持Callable,Future,CompletableFuture等異步接口返回的推導。
  • 開源規則引擎 Apache Camel 2.22,支持 Spring Boot 2
    Apache Camel 的最新版本 2.22.0 已發布,這是第一個完全正式支持 Spring Boot 2 的版本。
  • 集成LNMP/LAMP/FAMP的LuNamp2.1正式版開源發布
    集成LNMP/LAMP/FAMP的LuNamp2.1正式版開源發布 LuNamp是網站環境的自動化安裝包,支持Linux和Unix系統,如FreeBSD/Debian/CentOS
  • LuNamp2.6開源(GPL)發布 不再支持FreeBSD
    LuNamp是網站環境的自動化安裝包,傻瓜化一鍵安裝,支持源碼安裝和rpm二進位安裝(使用rpm安裝PHP+MySQL環境只需要幾分鐘),是具有6年多歷史的FAMP的後續版本。目前支持的系統有Debian/CentOS/REH/Ubuntu系列(包括KUbuntu, 深度linux, 雨林木風Linux等)遺憾的提示:在此之前的版本都是支持FreeBSD系統的,但由於開發難度較大等原因,從本版本開始,暫時不再支持FreeBSD系統,希望各位用戶諒解!
  • Apache MXNet 發布 v0.11.0版,支持蘋果Core ML和Keras v1.2
    近日,孵化於 Apache 軟體基金會 Apache MXNet 發布了 v0.11.0 最終測試版本,它不僅具有一個 Core ML 模型轉換器,同時還支持 Keras v1.2。此外,該版本還包括額外的功能更新、性能提升以及一些修復。你可以從原始碼構建 MXNet 從而獲取新版本。
  • Apache Subversion 1.9.9 和 1.10.2 發布
    Apache Subversion 1.9.9 與 1.10.2 發布了,這兩版分別是 Subversion 1.9.X 與 Subversion 全系列最完整的版本,建議用戶儘快升級。
  • 新裡程碑:Cocos2d-x v3.0 正式版本發布!
    歷經半年多的精心打磨,Cocos2d-x v3.0正式版本最終發布!
  • FastJson 1.2.17 發布,BugFixed 功能增強版本
    Kubernetes 1.20 發布,這是 2020 年的第三版也是最終版。
  • Apache Kylin 2.3.0 發布,開源分布式分析引擎
    Apache Kylin 2.3.0 已發布,這是繼 2.2.0 之後的一個重要版本,包含超過 250 個錯誤修復和功能增強。