Apache Pulsar 2.6.1 版本正式發布:功能增強,新增 OAuth2 支持

2021-01-12 開源中國

在 Apache Pulsar 2.6.0 版本發布後的 2 個月,2020 年 8 月 21 日,Apache Pulsar 2.6.1 版本正式發布!

Apache Pulsar 2.6.1 修復了 2.6.0 版本中的諸多問題,改進了一些功能,新增了對 OAuth2 的支持,覆蓋 Broker、Pulsar SQL、Pulsar Functions、Go Function、Java Client 和 C++ Client,進一步豐富了 Pulsar 作為雲原生流數據平臺的功能。

在 Pulsar 2.6.1 版本中,來自社區的 commit 有 102 個,越來越多的小夥伴開始參與到 Pulsar 社區建設中,成為 Contributor 的一員。下面一起來看看 2.6.1 版本有哪些更新吧。

Broker 相關改進📣 將批處理大小限制為 「maxNumberOfMessages」 和 「 maxSizeOfMessages」 的最小值

在 2.6.0 版本之前,BatchReceive 策略中 maxNumberOfMessages 和maxSizeOfMessages 的最小值不會影響批處理大小。當批量大小大於 consumer 中設置的 receiveQueue 大小時(假設使用的批量大小為 3000,receiveQ 為 500),會出現以下問題:

在 consumer 中使用多主題模式,client 被阻塞,導致不接收任何消息;即使用戶在批處理中設置超時策略,client 也不會恢復。

在 2.6.1 版本中,我們把批處理大小設置為 「maxNumberOfMessages」 和 「maxSizeOfMessages」 中的最小值,修復了該問題。

更多詳情查看 PR-6865:https://github.com/apache/pul...。

📣 解決 Key_Shared 中使用粘性 hash range 導致的哈希範圍衝突問題

在以前的版本中,當用戶在 Key_Shared 訂閱模型中使用 「stickyHashRange」 時,consumer 指定的 hash 範圍不允許重疊。例如,consumer-1 的哈希範圍為:[[0,99],[400,65535]],consumer-2 的哈希範圍為:[[100,399]]。

這是因為在 broker 端,沒有對 stick hash range 中的 start 和 end 位置進行檢查。正常情況下不允許 start 大於 end 的位置。在 2.6.1 版本中,我們加入了相應的 check 機制,來避免出現 hash range 衝突的問題。

更多詳情查看 PR-7231:https://github.com/apache/pul...。

📣 修復獲取 lookup 權限的錯誤

當前,當 Pulsar AuthorizationService 檢查 lookup 權限時,擁有 canProducer 或 canConsumer 角色應該具備可以 canLookup 的能力,但實際上並沒有該能力。代碼如下:

javatry { return canLookupAsync(topicName, role, authenticationData) .get(conf.getZooKeeperOperationTimeoutSeconds(), SECONDS);}

如果 canProduce 或 canConsume 方法拋出異常,canLookup 只會拋出該異常,不檢查其他權限。

在 2.6.1 版本中,使用 canLookupAsync 代替原來的行為,更多詳情查看 PR-7234:https://github.com/apache/pul... 。

📣 修復創建 non-durable cursor 時無法刪除 topic 的錯誤

當非持久遊標創建失敗時,會返回 NPE。因為程序發生 NPE 後,仍在繼續創建訂閱實例:

javatry { cursor = ledger.newNonDurableCursor(startPosition, subscriptionName);} catch (ManagedLedgerException e) { subscriptionFuture.completeExceptionally(e);}return new PersistentSubscription(this, subscriptionName, cursor, false);

將導致該 topic 的引用計數加一。當用戶想要刪除這個 topic 時,由於引用計數沒有清零,所以即使使用 --force 強制刪除,也無法刪除 topic。在 2.6.1 版本中,我們解決了無法刪除 topic 的問題。

更多詳情查看 PR-7355:https://github.com/apache/pul...。

📣 避免在 ManagedLedgerImpl.isOffloadedNeedsDelete 方法中發生 NPE

在 2.6.1 版本之前,offload-deletion-lag 的默認值為 null,導致了 NPE 問題。在 2.6.1 版本中,我們在 ManagedLedgerImpl.isOffloadedNeedsDelete 方法中添加對 null 值的檢查,避免出現該問題。

更多詳情查看 PR-7389:https://github.com/apache/pul... 。

📣 修復創建新 ledger 時引發 NPE 導致生產者卡死的問題

由於無法解析網絡地址,在創建 ledger 時會引發 NPE。如果在添加超時任務之前引發了 NPE,則超時機制不起作用。無法解析的網絡地址在 Kubernetes 環境中很常見。當 bookie pod 或工作程序節點重新啟動時,可能會發生這種情況。

在 2.6.1 版本中,可通過以下操作來修復該問題:

在創建一個新的 ledger 時,捕獲這個 NPE; 觸發超時任務時,始終執行回調。因為回調只能觸發一次; 添加機制檢測 「CreatingLedger」 狀態是否發生變化。

更多詳情查看 PR-7401:https://github.com/apache/pul...。

📣 修復使用 advertisedListeners 產生的 NPE 問題

當使用帶有外部 listener 名稱的 advertisedListeners = internal:pulsar:// node1:6650,external:pulsar://node1.external:6650 時,broker 無法獲取名稱空間包的所有權。如果未啟用 TLS,我們需要更改 BrokerServiceUrlTls。

更多詳情查看 PR-7620:https://github.com/apache/pul... 。

📣 獲取最後一條 entry 時,client 錯誤地讀取 -1 這條 entry

在 2.6.1 版本之前,getLargestBatchIndexWhenPossible() 函數沒有 return 語句,當 entry 為 -1時,client 會對把相應的 MessageData 設置為當前位置的值,並將該值發送到 client,當 client 嘗試讀取該 entry,會出現如下問題:

16:34:25.779 [pulsar-io-54-7:org.apache.bookkeeper.client.LedgerHandle@748] ERROR org.apache.bookkeeper.client.LedgerHandle - IncorrectParameterException on ledgerId:0 firstEntry:-1 lastEntry:-116:34:25.779 [pulsar-client-io-82-1:org.apache.pulsar.client.impl.ConsumerImpl@1986] INFO org.apache.pulsar.client.impl.ConsumerImpl - [persistent://external-repl-prop/pulsar-function-admin/assignment][c-use-fw-localhost-0-function-assignment-initialize-reader-b21f7607c9] Successfully getLastMessageId 0:-116:34:25.779 [pulsar-client-io-82-1:org.apache.pulsar.client.impl.ClientCnx@602] WARN org.apache.pulsar.client.impl.ClientCnx - [id: 0xc78f4a0e, L:/127.0.0.1:55657 - R:localhost/127.0.0.1:55615] Received error from server: Failed to get batch size for entry org.apache.bookkeeper.mledger.ManagedLedgerException: Incorrect parameter input16:34:25.779 [pulsar-client-io-82-1:org.apache.pulsar.client.impl.ClientCnx@612] WARN org.apache.pulsar.client.impl.ClientCnx - [id: 0xc78f4a0e, L:/127.0.0.1:55657 - R:localhost/127.0.0.1:55615] Received unknown request id from server: 10

PR-7495 在代碼中增加了 return 語句,GetLastEntry() 會讀取最後一條 entry,而不是 -1。 

更多詳情查看 PR-7495:https://github.com/apache/pul...。

ZooKeeper 相關改進📣 使用主機名進行 Bookie 機架感知映射

PR-5607 中添加了 useHostName() 和 return false。這意味著機架式策略會嘗試將 Bookie 主機名解析為 IP 地址,然後使用該 IP 地址來確定 Bookie 屬於哪個機架。

這會導致如下兩個問題:

IP 地址與在/ bookies z-節點中記錄的主機名不匹配; 如果在解析 bookie 主機名時發生錯誤(例如:瞬態 DNS 錯誤),會觸發 NPE 異常;對 BookKeeper 客戶端來說,該 bookie 在集群中一直不可用。

例如,在下面代碼中的第 77 行會拋出 NPE,因為 getAddress() 給出了一個 null,而該地址沒有解析:

java74 if (dnsResolver.useHostName()) {75 names.add(addr.getHostName());76 } else {77 names.add(addr.getAddress().getHostAddress());78 }

默認情況下,DnsResolver.useHostName() 返回 true。

更多詳情參考 PR-7361:https://github.com/apache/pul...。

Java Client 相關改進📣 修復了無法重命名 Athenz 身份驗證中使用的 HTTP header 的問題

Athenz 的身份驗證插件允許用戶更改 HTTP header 的名稱,並通過 roleHeader 參數將身份驗證令牌發送到代理伺服器。更改 HTTP header 名稱會保留 「AuthenticationAthenz」 側的 「roleHeader」 參數的值,並將其直接用作標頭名稱。

更多詳情參考 PR-7311:https://github.com/apache/pul...。

📣 修復多次回收 batch ack 的集合

多次回收 batch ack 的根本原因是批量 Ack 刷新和累積確認中存在競爭條件。因此,為該 ackset 添加回收狀態檢查,避免多次回收 batch ack。

更多詳情參考 PR-7409:https://github.com/apache/pul...。

📣 添加支持 OAuth2 身份驗證的客戶端

Pulsar 支持使用 OAuth 2.0 訪問令牌驗證客戶端身份。可以使用令牌來標識 Pulsar 客戶端,並將令牌關聯到允許執行某些操作(例如:發布到主題或從主題消費)的某些 「principal」(或「role」)。

該模塊直接支持 OAuth 2.0 的 Pulsar 客戶端身份驗證插件。客戶端與 OAuth 2.0 伺服器進行通信後,將從 OAuth 2.0 伺服器獲取「訪問令牌」,並將該「訪問令牌」傳遞給 Pulsar broker 進行身份驗證。

因此,代理方仍然可以使用 「org.apache.pulsar.broker.authentication.AuthenticationProviderToken」,
用戶也可以添加自己的 AuthenticationProvider 來使用此模塊。

更多詳情參考 PR-7420:https://github.com/apache/pul...。

📣 在 consumer 關閉之後,不再訂閱這個 topic

當 consumer 重新連接到 broker 時,將競爭條件固定在 consumer 中。

在 consumer 重新連接到代理時會發生競爭條件,消費者重新連接到代理時連接設置為 null。如果此時關閉 cosnumer,客戶端不再向代理髮送關閉 consumer 的命令。因此,如果 consumer 重新連接到 broker,consuemr 將再次發送訂閱命令。

在 2.6.1 版本中,當 consumer 的連接打開時,consumer 會添加狀態檢查。如果使用者狀態為關閉或正在關閉,則無需發送訂閱命令。

更多詳情參考 PR-7589:https://github.com/apache/pul...。

📣 OAuth2 身份驗證插件使用 AsyncHttpClient

在之前的版本中,OAuth2 客戶端 auth 插件使用 Apache HTTP 客戶端庫發出請求,Apache HTTP 客戶端僅用於主機名驗證。如 PR-7612 所述,為了擺脫對 Apache HTTP 客戶端庫的依賴,在 2.6.1 版本中使用 AsyncHttpClient。AsyncHttpClient 在客戶端和 broker 中的其他地方都有使用。

更多詳情參考 PR-7615:https://github.com/apache/pul...。

CPP Client 相關改進📣 在 CPP 客戶端中支持 OAuth2 的認證方式

Pulsar 支持使用 OAuth 2.0 訪問令牌對客戶端進行身份驗證。可以使用令牌來標識 Pulsar 客戶端,並將其與允許執行某些操作(例如:發布到主題或從主題消費)的某些「principal」(或「role」)關聯。 

在 2.6.1 版本中,允許用戶在 CPP 客戶端中使用 OAuth2 的認證方式。

更多詳情參考 PR-7467:https://github.com/apache/pul...。

📣 修復在關閉 callback 中 partition 索引的錯誤

在分區生產者/消費者中關閉 callback 時,分區索引始終為 0。我們需要將 ProducerImpl / ConsumerImpl 的內部 partition 索引欄位傳遞給 PartitionedProducerImpl / PartitionedConsumerImpl 的 close 回調。

更多詳情參考 PR-7282:https://github.com/apache/pul...。

📣 修復了 C++ 客戶端中計時器的競爭狀況導致的段崩潰

在 2.6.1 版本之前,競爭條件下會發生段崩潰:

關閉操作,稱為 「keepAliveTimer_.reset()」; 同時,在 startConsumerStatsTimer 和 handleKeepAliveTimeout 方法中訪問計時器。

在 2.6.1 版本中,我們修復了此問題,競爭條件下不再發生段崩潰。

更多詳情參考 PR-7572:https://github.com/apache/pul...。

📣 支持從文件讀取憑據

支持從文件讀取憑據,使其與 Java 客戶端保持一致。

更多詳情參考 PR-7606:https://github.com/apache/pul...。

📣 修復在連接出錯時多 topic consumer 的段錯誤

當創建 consumer 出現錯誤時,多主題 consumer 將觸發段錯誤。這是使用 null 回調關閉部分使用者的調用所致。

在 2.6.1 版本中,我們修復了此問題。

更多詳情參考 PR-7588:https://github.com/apache/pul...。

Functions 相關改進📣 使用標準主機名作為 worker 的默認值

Java 8 和 Java 11 獲取主機名的方法不同。在 Java 8 中,使用 InetAddress.getLocalHost()參數,getHostName()返回完全限定的主機名。在 Java 11 中,則是返回簡單主機名。使用 getCanonicalHostName()` 參數後,在Java 8 和 Java 11 中都能返回完全限定的主機名。 

更多詳情參考 PR-7360
https://github.com/apache/pul...

📣 修復 2.6.0 引入的向後兼容問題

PR-5985 破壞了向後兼容性。如果分開運行 Function Worker 與 Broker,Function Worker 和 broker 從 2.5 版本單獨更新到 2.6 版本時會發生以下錯誤:

textjava.lang.NullPointerException: null\n\tat java.net.URI$Parser.parse(URI.java:3104) ~[?:?]java.net.URI.<init>(URI.java:600) ~[?:?]\n\tat java.net.URI.create(URI.java:881) ~[?:?]org.apache.pulsar.functions.worker.WorkerUtils.initializeDlogNamespace(WorkerUtils.java:160) ~[org.apache.pulsar-pulsar-functions-worker-2.7.0-SNAPSHOT.jar:2.7.0-SNAPSHOT]org.apache.pulsar.functions.worker.Worker.initialize(Worker.java:155) ~[org.apache.pulsar-pulsar-functions-worker-2.7.0-SNAPSHOT.jar:2.7.0-SNAPSHOT] org.apache.pulsar.functions.worker.Worker.start(Worker.java:69) ~[org.apache.pulsar-pulsar-functions-worker-2.7.0-SNAPSHOT.jar:2.7.0-SNAPSHOT] org.apache.pulsar.functions.worker.FunctionWorkerStarter.main(FunctionWorkerStarter.java:67) [org.apache.pulsar-pulsar-functions-worker-2.7.0-SNAPSHOT.jar:2.7.0-SNAPSHOT]

錯誤原因:2.5 版本中 broker 會對包含 bookkeeperMetadataServiceUri 欄位的請求做出響應,管理客戶端將返回該欄位為 null,從而導致 NPE。

在 2.6.1 版本中,當初始化 function worker 時,對 BookkeeperMetadataServiceUri 的 value 進行檢查,判斷其是否為 null。

更多詳情參考 PR-7528:https://github.com/apache/pul...。

Pulsar Perf 相關改進📣 在 pulsar-perf 的 producer/consumer/reader 中支持 tlsAllowInsecureConnection

在命令行工具 pulsar-perf 中支持 tlsAllowInsecureConnection 配置,以支持對不安全的 TLS 連接的集群進行 producer/consumer/reader 的性能測試。

更多詳情參考 PR-7300:https://github.com/apache/pul...。

參考信息

相關焦點

  • Apache Pulsar 2.6.1 正式版發布:功能增強
    在 Apache Pulsar 2.6.0 版本發布後的 2 個月,2020 年 8 月 21 日,Apache Pulsar 2.6.1 版本正式發布!Apache Pulsar 2.6.1 修復了 2.6.0 版本中的諸多問題,改進了一些功能,新增了對 OAuth2
  • Apache Pulsar 的分層存儲
    本文介紹了 Apache Pulsar 的分層存儲特性(在 2.1 及之後的版本可用),分層存儲支持在不影響終端用戶的條件下,將較舊的數據移動到長期存儲中。Pulsar 通過提供分層存儲(Apache Pulsar 2.1 起新增的特性)減少了成本/大小的損失。
  • Pulsar Manger 0.2.0 正式發布, Apache Pulsar 的管理端
    Pulsar Manager 0.2.0 更新了以下特性:- 支持在初始化環境中配置多個地址。- 使用 PulsarAdmin 代替 HttpUtil 來管理 Pulsar 集群,這樣就可以使用 PulsarAdmin 所支持的功能。- 支持使用後端處理靜態文件,這樣用戶可以直接啟動整個的 pulsar-manager 服務,不需要配置代理。
  • Pulsar Flink Connector 2.5.0 發布, 支持 Flink 1.11
    Pulsar 支持 Flink 的批流融合計算計算,無需用戶再進行多餘的操作。 以下是 Pulsar Flink Connector 2.5.0 中添加的一些主要的功能。 Pulsar-Flink 相關 支持 Flink 1.11 和 flink-sql DDL  Flink 1.11 版本升級的幅度較大,一些公共 API 發生了增刪,導致 Flink 1.9、Flink 1.11 的 Pulsar 連接器無法做到兼容。本次變更使項目分為兩個模塊,來支持不同版本的 Flink。BIGO 的陳航、吳展鵬童鞋為此特性付出了很大的努力。
  • Apache Axis2 1.6.2 發布
    Apache Axis2 團隊今天發布了三個軟體更新版本,分別是:- Axis2 1.6.2- Sandesha2 1.6.2- Rampart 1.6.2
  • oauth2-shiro 0.1-beta 發布
    經過不斷地試錯與研究, 整合oauth2與shiro的 oauth2-shiro項目 0.1-beta 發布. 整合Apache Oltu 與 Shiro.
  • Apache Kylin v2.6.1 發布,開源的分布式分析引擎
    Apache Kylin v2.6.1 發布了。新版是個 Bug 修復版本,包含7個功能增強和19個 Bug 修復。
  • StreamNative 宣布開源 MoP:Apache Pulsar 支持原生 MQTT 協議
    GitHub:https://github.com/apache/pulsar。Pulsar 是一種多租戶、高性能解決方案,用於在伺服器之間傳遞消息。Pulsar 支持以下關鍵特性: Pulsar 的單個實例原生支持多個集群,支持跨地域在集群間無縫複製消息 極低的發布延遲和端到端延遲 支持擴展到數百萬個 Topic 通過 Apache BookKeeper 提供的持久化消息存儲機制保證消息傳遞目前,Apache Pulsar 已經廣泛應用於多個領域
  • oauth2-shiro 0.1-rc 發布
    經過國慶期間的假期, oauth2-shiro的0.1-rc版本發布了, 相比0.1-beta版本, 更新內容如下:1. 重構項目結構,實現模塊化.
  • Apache Kylin 2.6.3 發布,Bug 修復版本
    Apache Kylin 2.6.3 發布了。新版是個 Bug 修復版本,包含 7 個增強功能和 9 個 bug 修復。
  • OneinStack 2.0 發布,增強自動模式功能
    OneinStack 2.0 發布了,增強自動模式功能,工具為了快速在生產環境上部署lnmp/lamp/lnmpa/lnmt(Linux、Nginx/Tengine/OpenResty、 MySQL
  • Apache DolphinScheduler 1.3.2 發布,性能提升 2~3 倍
    1.3.2 正式版本。DolphinScheduler-1.3.2 有超過 30 名貢獻者參與開發,性能較 1.2 版本有 2 ~ 3 倍的提升,相對 1.2 版本,1.3.x 增加了諸如 K8s支持、多目錄管理等重要的新特性和新的任務類型。
  • Apache Axis2 1.6.0 發布
    Apache Axis2 團隊今天發布了下面三個軟體的最新 1.6.0 版本: - Axis2 1.6.0- Sandesha2 1.6.0- Rampart 1.6.0
  • Apache Tomcat 6.0.43 發布,支持 TLS v1.1/1.2
    Apache Tomcat 6.0.43 發布,該版本主要是 bug 修復,值得關注的改進有:- Update to Tomcat Native Library version
  • 架構師的選擇,Pulsar還是Kafka?
    · 下載Pulsar並解壓縮:$ wget https://archive.apache.org/dist/pulsar/pulsar-2.6.1/apache-pulsar-2.6.1-bin.tar.gz2.下載連接器(可選):$ wget https://archive.apache.org/dist/pulsar/pulsar-2.6.1
  • ZStack 3.2.0 正式發布,新增資源標籤分組、阿里雲 EBS 支持等功能!
    2018年12月27日,ZStack正式發布最新版本 ZStack 3.2.0,涵蓋資源標籤分組、阿里雲EBS支持、通過Access Key授權ZStack API調用等功能,
  • 新增系統監控功能,JumpServer堡壘機v2.6.0發布
    12月21日,JumpServer開源堡壘機正式發布v2.6.0版本。該版本的新增功能包括:新增系統監控功能,方便監控各個組件健康狀態;支持通過Excel文件對資源進行導入/導出;支持手動修改資產信息配置;支持對指定資產進行批量推送系統用戶;以及統一社區版和企業版Release包。
  • 「開源資訊」Apache ZooKeeper 3.6.2發布
    簡介zookeeper是Hadoop的正式子項目,它是一個針對大型分布式系統的可靠協調系統,提供的功能包括:配置維護、名字服務、分布式同步、組服務等。ZooKeeper的目標就是封裝好複雜易出錯的關鍵服務,將簡單易用的接口和性能高效、功能穩定的系統提供給用戶。
  • Apache 官宣!Sharding-Sphere 首個 Apache 版本發布
    它將今年1月份發布的3.1.0.M1,3.1.0以及未正式發布的3.1.0.1的功能進行重新打磨和規劃,並在此基礎上進行其他重量級功能的開發, 修復相關Bug,穩定內核基礎,終於以相對完善的姿態於今日與大家見面。
  • Apache Kylin v3.1.0 重點功能推介
    Apache Kylin v3.1.0 已於上周正式發布,其中包含了許多值得一試的新功能,本文選擇了 Presto 查詢下壓引擎、Flink 構建引擎、Kylin on Kubernetes 解決方案、新版 Hive 全局字典、增強的 Cube 遷移服務這五項重點功能進行介紹。