原標題:前NSA與亞馬遜工程師攜手創立數據託管協作平臺Gretel來源:cnBeta.COM
對於想要構建新功能和更好地開展創新的開發者與工程師們來說,數據有著極高的價值。然而現實是,這些數據通常高度敏感且無法訪問,在合規性和鎖定狀態的處理上也相當麻煩。好消息是,大約半年前,由前美國國家安全局(NSA)和亞馬遜工程師組建的一支團隊,就已經在致力於打造一個「適用於數據託管的GitHub平臺」了。
據悉,前NSA和亞馬遜工程師們創立了一家名叫Gretel的初創企業,旨在幫助開發者對敏感數據展開實時、安全地共享。
聯合創始人之一的Alex Watson(其他創始人包括John Myers、Ali Golshan和Laszlo Bock)描繪了一個常見的問題:
通常情況下,開發者無需訪問資料庫的完整權限,而是只請求一部分或某個特定的示例。然而在用於酷炫的案例之前,平臺首先得確保數據能夠被安全地共享。
好消息是,以GitHub為代表的企業,已經證實了此類源碼分享平臺的廣闊前景、且有助於簡化代碼的訪問和協作。目前他們缺少的,只是與GitHub體量相當的數據。
Alex Watson補充道:「外媒當前正在開發的軟體,已允許開發者自動檢出數據集的匿名版本」。
這種所謂的『合成數據』,實質上是人造出來的。其外觀和工作方式,有些類似於常規的敏感用戶數據。
Gretel使用機器學習對數據進行分類(如名稱、地址和其它客戶標識符),並為數據分配儘可能多的類型標籤。
一旦該數據被標記,即可應用訪問策略。然後藉助匿名處理大量數據的差異化隱私技術,使之不再與客戶信息捆綁到一起。
顯然,這種藉助機器學習生成的完全人造的數據集,已經引起了業內的廣泛關注。此外值得一提的是,Gretel計劃採用與亞馬遜雲服務類似的按需收費政策。
目前這家初創企業已經拿到由Greylock Partners牽頭的350萬美元種子輪資金,其它投資者包括Moonshots Capital、Village Global和幾位天使投資人。
來源: cnBeta