空間基因:建築信息編碼簡史(二)

2021-01-13 BIMBOX

瀏覽器版本過低,暫不支持視頻播放

你好,這裡是BIMBOX。

上一期我們說到計算機對自然語言的編碼,以及人們怎樣解決編碼中遇到的問題,這一期我們開始進入建築行業的信息編碼。

上次我們留了一個問題給大家:

如果編碼只需要考慮語言兼容的問題,為什麼光是北美地區就先後出現了三種建築編碼體系?比起語言編碼,建築編碼是不是有更複雜的問題需要解決呢?

要回答這個問題,我們先來看看2018年新執行的標準名字:《建築信息模型分類和編碼標準》。

你看,我們說完了編碼,還有個重要的東西沒說,那就是分類。

上次說到的語言編碼Unicode,儘管它也會按照一定規則對編碼進行分類,比如把同一個國家的語言字符放到一起,但這個分類對人們並沒有太大的影響。

我們來舉另外一個例子:生物的分類。

食肉動物和圓形耳朵的動物

目前,人類已經命名的生物有170多萬種,這個數字還在以每年1.5萬的速度在增長。科學家預計,地球上的生物可能有1億種以上。

你可以想像,如果把1億種生物的名字和編碼毫無規律的寫進一本詞典,對任何人都是沒有意義的。

於是人們開始對生物進行分類。早期的分類比較粗糙,中國的李時珍把生物分為植物和動物,植物分為草、谷、菜、果、木五種;動物分為蟲、鱗、介、禽、獸五種。

隨著被發現的物種越來越多,生物的分類越來越細緻,分類的層數也就越來越多。

現代分類方法把生物分為域、界、門、綱、目、科、屬、種八層,每一層都包含多個更低層次的分類,越是低層的同類相同點就越多,只有最底層「種」才對應著實際存在的生物。

就像是電腦裡的文件夾,一層一層的展開,只有最後一層裡才有實際的文件。

比如,貓就屬於:真核生物域、動物界、脊索動物門、哺乳綱、食肉目、貓科、貓屬、貓種。

這種像樹一樣展開的分類方法,叫做結構化分類,也叫線分類法。用這種分類方法進行編碼,有幾個好處:

第一,操作更人性化。比如研究貓科動物的人,可以在「貓屬」這個小類別裡把貓編號為1,虎編號為2,不需要考慮和犬屬裡面狗的編碼會不會衝突,也不必花心思去研究犬屬的編碼。

第二,擴容性好。新發現一個物種,只需要把它按照一定特點放到相應層面的分類裡,按順序往下編碼就行了,對其他分類的編碼沒有影響。實在需要的話,可以在某一層重新創建一個新的分類。

第三,編碼的檢索非常高效。你要查找貓,只需要知道貓大概屬於哺乳動物這一個綱,就可以完全忽略其他的域、界、門、綱裡成千上萬的物種,搜索量大大減少。

第四,數據可以分級管理。比如,一個專門研究食肉類動物全球分布情況的專家,可以在「目」這個層面調取「食肉目」,它自然就包含了裡面貓科、犬科等所有動物,而不需要再往下逐層查找。

現代動物的分類已經很統一了,但它並不能滿足所有人的需求,尤其是第四點,分級管理。

對於一個研究食肉動物的專家來說,這種分類方法當然很好,但如果一個人專門研究所有「圓形耳朵的動物」,那他就得自己去很多類別裡自己查找再匯總,就會覺得這個分類方法不怎麼好用。

通過這個例子我們可以看到,像文字編碼這種很少需要人類參與的活動,對分類的需求比較低。工程師不需要記住所有文字的編碼,只需要事先選好一個編碼格式,每個文字使用的時候自動調取就行了。

而像生物研究這種需要人類深度參與的體系,對分類的要求就很高。

建造者們的分類方法

回到我們的主題。

建築業是一個需要人深度參與的行業,而且不同層面的人所需要的數據完全不一樣。有的人負責採購物資,有的人負責規劃工序,有的人負責招投標,有的人負責投資戰略,如果把所有建築信息一股腦丟給他們,就等於是什麼都沒給。

所以,建築業的編碼同樣需要按層次分類。不同分類方式對不同需求的人來說,也是有好有壞。

我們今天先請出第一個建築信息分類編碼標準——Masterformat。

1963年,美國建築規範協會CSI聯合加拿大建築規範協會CSC,共同發布了CSI建築規範格式,目標是用於項目檔案管理、造價管理和編寫組織規範。到了1978年,這兩個協會又對它進行了修正,頒布了Masterformat第一版。

我們不看發布者對它的功能定義,先看看它是怎麼給建築信息分類的。

最早的Masterformat一共有16個分類,主要是按照工種工藝和材料來區分。

最早的Masterformat小的分項一共也就160多種,所以不需要多層分類,總共就兩層,在大分類下就是一層具體的項目。每個小項由5位編碼組成,前兩位代表它所在的分類,後三位是對自身的編碼。

比如,第三類混凝土工程進一步分成了9個項目,分別是03300現澆混凝土、03400預製混凝土、03900混凝土修復和清潔等等。

這個版本的Masterformat主要是面向房建項目,一直維護到1995年。

後來,很多新的產品、材料和工藝湧入建築業,機械和管道越來越複雜,同時也有越來越多的市政和工業項目需要編碼。這些新的信息都無法編排到Masterformat1995裡面。

於是在2004年,CSI發布了Masterformat2004版,把原來的16個類別擴展為50個類別,又把這50個類歸納到六個分組裡。

這六個分組分別是:招投標與合同需求、通用需求、設施建設、設施服務、場地和基礎設施、工藝設備。

從2010年開始,CSI每隔一到兩年對它進行一次更新,一直保持著六個分組、50個大類別的基本框架。最新版本是2018年6月版。

新版的Masterformat雖然列出了50個分類,但並沒有對所有分類進行編碼,比如15~20、29~30、36~39等大類都是空的,留給未來擴展用。

新版Masterformat編碼的分層也更加詳細,編碼共分為三組,每組兩位數,高層類別的後幾位編號用00補位。

比如「03 00 00」代表最高層的第3類,混凝土;「03 20 00」代表混凝土大類裡面的第20小類,混凝土加固。

其中第二層的編碼比較特殊,當第一位不為0,第二位為0的情況下,可以多展開一層,比如「03 40 00」預製混凝土,可以進一步分為「03 41 00 結構預製混凝土」和「03 45 00 建築預製混凝土」。

第三層編碼需要進一步分類的時候,就在後邊加一個點,然後補兩位擴展編碼,比如「03 11 13」現澆混凝土成型,可以進一步細分,「03 11 13.16」是其中的混凝土支護分項。

這樣,Masterformat就形成了最多五層的樹狀線性分類。

就像前面我們舉例的生物分類一樣,Masterformat採用這樣的分類方法,能夠帶來操作人性化、擴容性好、檢索快速,以及數據分級管理幾個優勢。

前幾個優點比較好理解,我們重點說一下樹狀分類法的第四個優勢:數據分級管理。

比如你把Masterformat用作工作流程管理,那麼高一層的任務就可以包括低一層的所有任務,當每個負責較低層次的人員追蹤並提交任務進展的時候,高一級別的任務也就可以自動進行數位化追蹤。

如果你把Masterformat用作成本計算,也可以通過逐層分解來實現數據的管理。負責混凝土用量的人只需要在03 00 00這一個大類裡計算人材機料,而不需要在意其他層次的類別。比他負責的層次要高的人員,可以了把他的數據直接拿來用。

實際上,歐美和中東地區的很多項目,雖然項目形式各不相同,但工程量清單、招投標文件、項目執行規範的編排,採用的都是Masterformat體系,文件編制後可以用計算機進行管理,也方便不同項目的數據互通。

從前面的內容你可以看到,Masterformat是把一個建築的建造過程拆解成不同的工序、材料和設備,然後再把這些拆解好的項目分門別類進行編碼,所以我們說Masterformat是面向工種和材料的編碼方式,這一點請你記住,後面還會和其他編碼方式做比較。

Masterformat,遠不是終極解決方案

在生物分類的例子最後我們說到,現代的生物學分類方法對於研究食肉動物的專家來說很好用,但對於專門研究所有「圓形耳朵的動物」的人來說,就不怎麼好用。

同樣,面向工種和材料的Masterformat,對於建設單位來說已經很好用了,但對於其他人,比如投資方或者設計師,就不是很友好了。

我們來看看對於這些人來說,建築信息編碼都用來做什麼,以及用Masterformat來完成這些任務的缺點:

第一:投資估算

項目的投資數據分為方案階段的估算,初步設計階段的概算和施工設計階段的預算。概算和預算的計算方式都是先計算工程的材料、人力、設備等直接費用,再計算費率得到,可以按照材料和工種進行分解。

而在項目大前期的估算階段,還沒有細部設計,這些費用是算不出來的。

甲方的投資估算,一般都是根據歷史項目的數據分析,把類似的建築花了多少錢拆解成小的分類,然後把這些小分類按照新建項目的構成比例組合到一起,從而估算出新項目的投資。

每一個被分解出來的小分類,在歷史項目的投資佔比,就反應著這種分類方式的敏感性。

Proffenberger在一項對編碼體系的研究中公布了這樣的結果:企業對已建成項目的投資數據進行分析的時候,Masterformat體現出的敏感性比較低。比如辦公樓項目,混凝土佔整個工程投資比例為2%~32%,磚石為0%~20%,金屬為0~21%,木材為0~38%。

這就意味著:這個項目木材多一些石材少一些,那個項目可能就沒使用磚石,每種材料都在一個很大的範圍裡上下波動,這在估算新項目的時候誤差就會很大了。

除了對單個項目的估算,對於長期經營活動中數據的積累和分析,Masterformat也顯得力不從心。

第二:對設計的指導

在方案設計和估算完成後,就是初步設計和深化設計。如果方案階段使用的是面向材料和工種的分解,數據就很難指導深化設計。

對於設計師來說,只能按照項目的構成和使用部位來做限額設計,比如樓板總面積、柱子的總體積等,如果把這些數據都融成一鍋粥,就沒有意義了。比如估算階段預計混凝土使用量為2萬方,木材使用量為20噸,然後告訴設計師,按照這個限額來進行深化設計,設計就蒙圈了。

美國建築師學會出版的《建築師使用手冊》也說到:「面向材料和工種工程的投資分解和編碼體系,不適合項目設計階段的投資控制。」

CSI在一開始頒布Masterformat的時候也說了:目標是用於項目檔案管理、造價管理和編寫組織規範。

第三:動態成本控制

工程投資是一個動態過程,甲方的投資是分批給乙方的,打完地基給一筆錢,起完標準層再給一筆,不同的分包結算也是動態的。

比如預算中有「C40混凝土牆」這個分解項,但這一項可能分布在地下和地上的各個樓層,Masterformat很少考慮施工先後順序帶來的任務安排變化,因此對工程任務組織和分解表達不夠充分,也就很難符合動態成本分析的需求。

再比如,同樣的混凝土材料和工種,在預算裡可能分布在不同的分包合同裡,在對比概預算和結算來支付工程款的時候,把所有材料大鍋燉的Masterformat也會帶來一些衝突。

在這裡需要強調一下,這幾個缺點,只要有人工介入,雖然麻煩一點,也都是可以解決的。而當我們說一個編碼體系的分類方式是否好用的時候,所指的一定是用計算機進行編碼,並進行自動的數據計算和分析。

在上一期內容裡我們已經講了,想通過自然語言的介入,把一個已經定義好的編碼規則進行擴容,一定會帶來體積大、效率低,甚至是編碼衝突的問題。

所以,當一個編碼體系的分類方式明顯不適合一類人的時候,更好的辦法不是在原有基礎上修修補補,而是設計一套新的編碼體系。

當然,別忘了我們也說過,為了解決一個麻煩而創造一個新編碼體系,也很可能會帶來新的麻煩。

投資方為了解決這幾個麻煩,該怎麼設計新的編碼體系,又會帶來哪些新問題?這就是我們下一期要講的內容。

歡迎你把問題和想法留給我們,我們會在後面的內容裡補充給大家。

有態度,有深度,BIMBOX,咱們下期見!

相關焦點

  • 《空間簡史》
    《空間簡史》 [意]託馬斯·馬卡卡羅、克勞迪奧·M.達達裡 著 四川文藝出版社 2019年1月 ISBN:978-7-5411-5180-4 定價:39.80與《時間簡史》《人類簡史》《未來簡史》並稱「四大簡史」。 從模糊的地域認知到窺探宇宙星辰;從肉眼可見的維度到量子化的世界;從日心說、大爆炸理論到多元宇宙理論等空間假說和概念,人類求知的腳步從未停止,對空間的探索也從未停止…… 《空間簡史》按照時間線索,向讀者展現了一段人類探索無涯空間,找尋自我定位的崎嶇旅程。
  • 大亞基由葉綠體基因編碼,小亞基由核基因編碼
    高等植物的Rubisco外形呈桶狀圓柱體,四對交互結合的L2大亞基二聚體排列成八聚體(L8)。在大亞基8聚體的兩端有一個小亞基四聚體,每個小亞基陷窩在大亞基之間的裂縫中。大亞基由葉綠體基因編碼,小亞基由核基因編碼。Rubisco的活化和催化部位在大亞基上,小亞基的功能不清楚,可能在大亞基之間起間隔的作用,有利於維持酶蛋白分子的穩定性。
  • 調控基因是編碼能與操縱序列結合的調控蛋白的基因
    最早只把與阻遏蛋白結合、起阻遏作用的序列稱為操縱子,但其後發現有的操縱元中同一操縱序列與不同構像的蛋白質結合,可以分別起阻遏或激活基因表達的作用,阿拉伯糖操縱元中的序列就是典型的例子。因而凡能與調控蛋白特異性結合、從而影響基因轉錄強弱的序列,不論其對基因轉錄的作用是減弱、阻止或增強、開放,都可稱為操縱子。
  • 空間簡史
    空間簡史  [意]託馬斯·馬卡卡羅  託馬斯·馬卡卡羅,義大利天體物理學家,從事空間和天體物理研究幾十年。過往的理論或被證實,或被推翻,但我們探索空間的腳步從未停歇,「哪裡」這個不斷變化的概念也在等著「後來的我們」去開拓。
  • 圖書封底右下角的那一串編碼包括什麼信息
    昨天我們簡單介紹了郵政編碼以及身份證號碼的編碼規律。從這些編碼中我們能讀取非常多的信息。打個最簡單的比方,通過身份證號碼的倒數第2位,我們就能知道這個人,是男還是女,因為男性是單數,女性是雙數。通過出生日期數位段也以算出他的年齡。
  • 宇宙是個宏量子:信息、信息量與信息編碼以及信息同一性原理
    1唯資訊理論綱要1.1信息和信息量與信息編碼信息是個無量綱的純數,信息本身不可定義。信息量(包含信息的多少)可以定義,信息量的本質是編碼長度,用最小的編碼長度,表達一個確定的狀態。信息的起源必須是真隨機。沒有真隨機,信息=0。偽隨機信息=0。
  • 為什麼外星文明有可能理解我們的編碼信息
    第三部分則表示人類 DNA 的雙螺旋結構,中間是一個小人,左邊則說明了人體的大致尺寸,它由一條與小人等高的豎線段和一個橫著寫的二進位數 14 組成,表示人類的平均身高是這段電波的波長(126 毫米)的 14 倍,也就是1.764 米。右邊表示數字4 292 853 750,這是 1974 年全球的人口數量。第五部分描繪了太陽系,左邊的大方塊表示太陽,右邊那些小塊兒則表示九大行星。
  • Science:對人類血細胞中的所有蛋白編碼基因進行全基因組轉錄組分析
    在此之前,人類蛋白質圖譜包括來自外周血單核細胞的基因表達信息,但不包括來自許多其他血細胞亞群的基因表達信息。為了提高解析度,人們需要對血液中的細胞進行了深入表徵,以提供人血細胞中基因表達的詳細細節,並將它們與體內的其他組織相關聯在一起。
  • 大腦簡史:孕育新生
    大腦簡史:孕育新生
  • 細菌基因組信息分析與解讀專題系列(二)——細菌基因組注釋Ⅰ(基因預測和ncRNA)
    基因組注釋(Genome annotation)是利用生物信息學方法和工具,對基因組所有基因的生物學功能進行高通量注釋,是當前功能基因組學研究的一個熱點。基因組注釋的研究內容包括基因識別、基因組功能注釋,而基因組功能注釋包括基因預測、ncRNA、重複序列、CRISPR預測、分泌蛋白預測等。
  • Science|華大基因聯合瑞典科學家構建大腦的蛋白編碼基因圖譜
    2020年3月6日,由卡羅林斯卡學院、瑞典皇家理工學院和華大等團隊合作在Science上發表文章An atlas of the protein-coding genes in the human, pig, and mouse brain(人類、豬、小鼠大腦中的蛋白編碼基因圖譜)。
  • 空間簡史實在沒有閱讀的必要
    最近讀了(空間簡史),讀完的感受就是:它都講了什麼?一個字:「懵」!為什麼這麼說呢?我發表發表我讀這本書的感悟吧!在讀這本書之前我先大致翻了翻這本書,初始感覺:嗯,不錯不錯,總共就兩百頁,也不多,認真看的話一天就能看完」。
  • 基因編碼可以進化出超級人類嗎
    > X 基因編碼可以進化出超級人類嗎
  • 讀完時間簡史,想了解下多維空間,有什麼相關的書推薦
    昨天晚上,讀了一點霍金的《時間簡史》,像這種書吧,很難一口氣讀完,下一次再讀,也不知道是啥時候了。當思緒從茫茫的太空中回到地球表面後,又獨立思考了半宿,霍老爺子研究的諸多理論,咋也弄不明白,受限於知識的局限,於是想著想著就想了一些別的事情。
  • 關於項目信息編碼的說法,正確的是()。
    關於項目信息編碼的說法,正確的是()。 關於項目信息編碼的說法,正確的是(  )。 A.投資項編碼應採用概預算定額確定的分部分項工程編碼 B.項目實施的工作項編碼就是指對施工和設備安裝工作項的編碼 C.進度項編碼應根據不同層次的進度計劃工作需要分別建立 D.項目管理組織結構編碼要依據組織結構圖,對每一個工作部門進行編碼 查看答案解析 【正確答案】D
  • 陪你讀書:《空間簡史》開啟你的時空之旅
    陪你讀書40期-空間簡史03:05來自新東方在線中小學親愛的同學們,如果你是一位科學愛好者,那麼你翻開這本《空間簡史》就對了。《空間簡史》討論了人們對空間認識和發展的過程,大到星系宇宙,小到微觀物質,都是空間內的存在。《空間簡史》裡有這樣一段話:時空是無時無刻不伴隨著我們每個人的。再也沒有比時空問題與我們人類關係更密切、更直接的了。人一降生下來,就立即投入到了時空的懷抱。人們從孩提時代開始,就對自身生存的時空有了漸漸的認識,並各自都對此有著無限的遐想。
  • 《未來簡史》作者7月8日重磅分享 揭秘智能未來
    7月8日,《未來簡史》作者尤瓦爾·赫拉利 將首次在華分享其觀點!他在2011年出版的《人類簡史》一書讓他一舉成名,隨後成為世界超級暢銷書。在最新一本《未來簡史》當中,尤瓦爾預測了一個可怕的場景——「隨著人工智慧加速進化,未來99%的人類將變成無用之人」。  演講嘉賓:John Hopcroft 康奈爾大學計算機系教授,1986年圖靈獎得主
  • 海馬神經元群體活動如何編碼位置信息?用機器學習來加速解碼
    神經元通常被認為是編碼單個變量的專一功能單元,然而許多神經元被觀察到對不同感覺、認知和行為變量的混合變量起反應。從這種表徵形式可以看出,信息是分布在多個神經元上的。那麼就存在一個問題:海馬神經元群體活動如何編碼位置信息?為了回答這一問題,本文作者研究了海馬的兩個亞區-DG和CA1-的神經元群體活動,其中DG的神經元反應是高度稀釋且多樣的,而CA1與空間導航相關。
  • Co-LncRNA:lncRNA與蛋白編碼基因的共表達網絡資料庫
    在生物信息學中,對於基因功能的挖掘,通常的做法就是利用GO和KEGG等功能資料庫,但是這些資料庫中都是蛋白編碼基因的功能,為了利用這些資料庫中的信息,我們需要在lncRNA與mRNA之間建立起聯繫,常見的思路有以下幾種通過lncRNA和mRNA之間的相互作用很多文獻和資料庫中都有報導的lncRNA與mRNA之間相互作用,也可以通過軟體來預測二者之間的結合
  • 《人類簡史》作者尤瓦爾·赫拉利:信息與合作是戰勝新冠肺炎疫情的...
    《人類簡史》作者、以色列希伯來大學尤瓦爾·赫拉利教授國際在線報導(記者 孫伶俐):截止當地時間3月21日,以色列新冠肺炎確診病例累計已超過800例,而全球確診病例累計超過28萬,已造成1萬多人喪生。中央廣播電視總臺駐耶路撒冷記者孫伶俐近日採訪了希伯來大學歷史系教授、《人類簡史》作者尤瓦爾·赫拉利。面對這場還在全球持續升溫的疫情,他指出只有公開信息與國際合作才是人類戰勝疫情的關鍵。全球矚目的新銳歷史學家、以色列希伯來大學赫拉利教授創作的《人類簡史》三部曲一經面市就成為暢銷書。