以人工智能技術(shù)賦能建筑行業(yè)前期咨詢工作為目標(biāo),探討了構(gòu)建人工智能生成可行性研究報(bào)告平臺(tái)的可能性和路徑。基于人工智能寫作的商業(yè)化現(xiàn)狀,建筑領(lǐng)域的數(shù)字化升級(jí)需求以及NLP(自然語言處理)等技術(shù)的日漸成熟。通過分析建筑業(yè)發(fā)展現(xiàn)狀和未來趨勢,設(shè)計(jì)了一套實(shí)現(xiàn)方案并依次解析結(jié)構(gòu),以顆粒度設(shè)計(jì)和語言網(wǎng)絡(luò)為主軸介紹平臺(tái)數(shù)據(jù)化的思路,以賦能工程前期咨詢工作,加快全行業(yè)的產(chǎn)業(yè)轉(zhuǎn)型。
1 智能寫作的市場分析
1.1 智能寫作的現(xiàn)狀
人工智能寫作的產(chǎn)品以技術(shù)路徑角度劃分主要有兩類:主動(dòng)創(chuàng)作型和輔助創(chuàng)作型。主動(dòng)創(chuàng)作型的智能寫作應(yīng)用主要有兩點(diǎn)特征。第一是半原創(chuàng)性,與傳統(tǒng)寫作相比,它僅需用戶劃定足夠精確的顆粒度范圍,提供文章所需的關(guān)鍵詞即可,接下來的工作將交付程序自行完成,大大降低了人力投入成本,但又未脫離用戶對(duì)文章走向的把控[1]。第二是高度依賴語言模型,對(duì)語言模型的選擇直接關(guān)系到應(yīng)用平臺(tái)的工作模式、處理時(shí)間以及結(jié)果質(zhì)量。
然而,在當(dāng)前的技術(shù)邊界下,人工智能寫作能否達(dá)到主動(dòng)創(chuàng)作能力,無論是從技術(shù)還是投資角度都有著很高的門檻。在提高勞動(dòng)產(chǎn)率和確保良率上,不少產(chǎn)品偏向于選擇對(duì)作品質(zhì)量更有保障的輔助創(chuàng)作型。輔助創(chuàng)作相對(duì)主動(dòng)創(chuàng)作而言,從經(jīng)濟(jì)角度可縮減研發(fā)投入,從產(chǎn)品角度能夠輕松得完成商業(yè)化。但這一類型的智能寫作工具往往聚焦于對(duì)原始文本的改造、擴(kuò)寫或填充。
1.2 商用產(chǎn)品調(diào)研
當(dāng)前,人工智能寫作領(lǐng)域的產(chǎn)品主要集中于內(nèi)置模板和算法續(xù)寫兩類模式。前者根據(jù)不同文案場景內(nèi)置對(duì)應(yīng)模板,根據(jù)用戶提供的關(guān)鍵詞搭配模板生成文章內(nèi)容,其優(yōu)勢在于在較低的開發(fā)難度下,盡可能保證了寫作結(jié)果的基本質(zhì)量及主題貼合度。但其相對(duì)保守的智能寫作方案決定了此類產(chǎn)品偏向于“寫作”而非“智能”,產(chǎn)品維護(hù)更新的時(shí)間成本、人力成本、經(jīng)濟(jì)成本偏高。與之不同的是實(shí)行算法續(xù)寫方案的產(chǎn)品。此類產(chǎn)品高度依賴預(yù)訓(xùn)練語言算法模型,以用戶視角看,該模式可在維持文章結(jié)構(gòu)的前提下,擺脫模板對(duì)應(yīng)用場景的一定限制;從開發(fā)者角度看,優(yōu)質(zhì)且獨(dú)立的算法將成為應(yīng)對(duì)同質(zhì)競爭的有力武器。然而,由于當(dāng)前語言模型算法的技術(shù)邊界限制,該方案所呈現(xiàn)的效果上限明確。
作者以推廣度、軟件下載量和開發(fā)單位背景等多維度論證,在眾多方案不一的人工智能寫作產(chǎn)品[2]中提取出如表1所示的6個(gè)成熟的商業(yè)化產(chǎn)品。

表1 產(chǎn)品分析
國內(nèi)產(chǎn)品的采取方案以內(nèi)置模板和算法續(xù)寫為主。以智搜寫作和火龍果寫作為例,前者提供大量的場景接口,以內(nèi)置模板作為應(yīng)用邏輯達(dá)到匹配自定義關(guān)鍵詞的場景,輔助實(shí)現(xiàn)人工智能的目標(biāo)。而火龍果寫作則以預(yù)訓(xùn)練語言模型為基礎(chǔ),根據(jù)上文內(nèi)容續(xù)寫下文選段,并一次生成多種不同走向的續(xù)寫文案供用戶挑選,以實(shí)現(xiàn)對(duì)文章結(jié)構(gòu)和文筆風(fēng)格等方面進(jìn)行調(diào)整、優(yōu)化與再創(chuàng)造的目標(biāo)。美國的Jarvis.AI是主動(dòng)創(chuàng)作型人工智能寫作工具的代表,它通過使用復(fù)雜的神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí),理解和輸出數(shù)百萬個(gè)單詞。該模型還根據(jù)以前生成的AI內(nèi)容進(jìn)行學(xué)習(xí),以便多樣、靈活地輸出無窮無盡的文本段落,以成為文字工作者的生產(chǎn)力提升器。而在輔助創(chuàng)作型工具中,以Grammarly為代表的文案斧正軟件更受歡迎。通過自身的語言數(shù)據(jù)庫,Grammarly根據(jù)文章的自定義目的來微調(diào)語法,針對(duì)讀者的范圍,文章的形式,應(yīng)用領(lǐng)域,語氣語境等,調(diào)用對(duì)應(yīng)的詞匯語法數(shù)據(jù)庫替代不合適當(dāng)下目標(biāo)的語句和詞匯,通過細(xì)微的上下文線索判斷文筆情緒。
1.3 落地可行性研究報(bào)告領(lǐng)域的可行性
基于以上成熟智能生成產(chǎn)品的分析調(diào)研,通過分解可行性研究報(bào)告結(jié)構(gòu),捋順可研報(bào)告智能生成的落地可行邏輯。通過基于NLP自然語言處理技術(shù)和應(yīng)用深度學(xué)習(xí)模型循環(huán)神經(jīng)網(wǎng)絡(luò),輸入關(guān)鍵要素,通過數(shù)據(jù)獲取、清洗、分析、共享,即可實(shí)現(xiàn)可研報(bào)告的AI智能生成。而鏈狀循環(huán)神經(jīng)網(wǎng)絡(luò)可以通過循環(huán)保存過往記憶信息,實(shí)現(xiàn)模擬人腦的認(rèn)知判斷,每次指定新的項(xiàng)目特征參數(shù)時(shí)都可以根據(jù)過往的記憶序列進(jìn)行模擬生成相似的文本報(bào)告。
近年來,從Transformer中脫胎出的成熟的預(yù)訓(xùn)練語言模型BERT和GPT-2語言模型被廣泛地應(yīng)用,這將大大的減少本項(xiàng)目的前期開發(fā)投入成本,避免重復(fù)“造輪子“的尷尬。可行性研究報(bào)告的文本雖然具有創(chuàng)造性,但同時(shí)其文本結(jié)構(gòu)也具備一定的格式性。平臺(tái)內(nèi)置的模板和數(shù)據(jù)庫可做到精確貼合可行性研究報(bào)告的格式屬性,將人工智能的功效圈定在可行性研究報(bào)告的結(jié)構(gòu)框架下,有效的提高報(bào)告生成質(zhì)量和效率。

2 可研智能生成平臺(tái)的定位
將人工智能寫作與可行性研究報(bào)告相結(jié)合,顛覆前期咨詢領(lǐng)域的工作方式,賦能建筑行業(yè)的智能化產(chǎn)業(yè)升級(jí)。通過綜上對(duì)國內(nèi)智能建筑特別是可行性研究報(bào)告領(lǐng)域的情況研究,當(dāng)前我國建筑領(lǐng)域的智能化建設(shè)還處于初級(jí)階段,在項(xiàng)目進(jìn)行的各個(gè)環(huán)節(jié),智能化升級(jí)仍存在很大的發(fā)展空間。在工程前期咨詢階段,可行性研究報(bào)告是決定項(xiàng)目建設(shè)成敗的重要因素之一,以此領(lǐng)域作為主軸,以差異化為突破口,以技術(shù)融合為手段,盡力打造出一款于當(dāng)前垂直細(xì)分領(lǐng)域的首款龍頭應(yīng)用。
3 智能生成方案設(shè)計(jì)
可研智能生成平臺(tái)將聚焦于智能生成、文本糾錯(cuò)、內(nèi)容分類三大主要功能模塊,為報(bào)告編寫者實(shí)現(xiàn)從材料輸入,過濾,分析,生成到糾錯(cuò)的全過程服務(wù)。方案設(shè)計(jì)主要涉及顆粒度劃分、語言網(wǎng)絡(luò)及功能運(yùn)用。
3.1 可行性研究報(bào)告的顆粒度
顆粒度劃分精準(zhǔn)程度直接影響智能生成報(bào)告質(zhì)量的好壞。依據(jù)可行性研究報(bào)告大綱的結(jié)構(gòu),構(gòu)建以一級(jí)標(biāo)題為主,二級(jí)標(biāo)題為輔的顆粒度,分為總論、建設(shè)單位及相關(guān)簡介、建設(shè)背景及必要性、選址、政策及行業(yè)準(zhǔn)入分析、現(xiàn)狀及整體改造建議、需求分析及規(guī)模、產(chǎn)業(yè)分析、市場分析、項(xiàng)目定位、設(shè)計(jì)方案等三十個(gè)基本類別。每項(xiàng)大類細(xì)分多個(gè)小項(xiàng),以總論為例,下分項(xiàng)目由來、項(xiàng)目概況、研究內(nèi)容及編制依據(jù)、主要技術(shù)經(jīng)濟(jì)指標(biāo)、結(jié)論及建議。
3.2 語言網(wǎng)絡(luò)
語言網(wǎng)絡(luò)涉及BERT和GPT-2。BERT主要實(shí)現(xiàn)文本摘要,可捕捉詞語和句子級(jí)別的representation;GPT-2實(shí)現(xiàn)文本生成,預(yù)訓(xùn)練語料主要來自THUCNews。語料來自業(yè)務(wù)報(bào)告積累和政府級(jí)建設(shè)項(xiàng)目網(wǎng)站等,約近百個(gè)建設(shè)項(xiàng)目可行性研究報(bào)告。
算法層由深度學(xué)習(xí)、知識(shí)圖譜、機(jī)器學(xué)習(xí)和大數(shù)據(jù)等功能模塊組成,主要解決在海量的結(jié)構(gòu)化信息灌輸下,平臺(tái)如何有效地找到匹配。算法是指對(duì)大量已知或未知的對(duì)象進(jìn)行分析并將其轉(zhuǎn)化為可識(shí)別結(jié)果的過程。這其中,對(duì)于深度學(xué)習(xí)方面的要求尤為重要。首先,識(shí)別并抽取要處理的對(duì)象,然后選擇合適的分類歸檔方法。再接著使用正確的技術(shù)路線來做到對(duì)歷史記錄的數(shù)據(jù)化存儲(chǔ),構(gòu)建知識(shí)圖譜,最終可在下次下一次任務(wù)時(shí)完成對(duì)信息的檢索匹配。
3.3 功能運(yùn)用
人工智能可研平臺(tái)將包含文本語法糾錯(cuò)、文本查重、語義情感分析與改寫等能力。功能運(yùn)用描述如表2所示。

表2 功能運(yùn)用描述
4 學(xué)習(xí)能力考驗(yàn)與督查
4.1 人工智能自主學(xué)習(xí)能力有限
通過算法成就的自主學(xué)習(xí)能力也是軟件平臺(tái)在同類型競品中的天然“護(hù)城河”,形成了可持續(xù)發(fā)展的隱形競爭力。由于當(dāng)前業(yè)界對(duì)于語言預(yù)訓(xùn)練模型的構(gòu)建尚處于不成熟階段,大部分現(xiàn)有產(chǎn)品的質(zhì)量和技術(shù)邊界參差不齊,盡管有類似GPT-3和BERT這一類的預(yù)訓(xùn)練模型證明了人工智能在生產(chǎn)力升級(jí)時(shí)的巨大潛力,但這一技術(shù)邊界僅代表文本完全自主生成的初級(jí)階段。當(dāng)用戶對(duì)所產(chǎn)生的文本小幅度的修改,并將重復(fù)同一個(gè)語句時(shí),人工智能匹配文本與前文文本相比沒有任何變化,證明人工智能匹配文本缺乏更正錯(cuò)誤和記住錯(cuò)誤的邏輯步驟,產(chǎn)品難以記住帶有個(gè)人印記的寫作邏輯。
4.2 督查與監(jiān)管
對(duì)人工智能大數(shù)據(jù)的依賴意味著它對(duì)每一種文本作品的著作權(quán)發(fā)起了挑戰(zhàn)。根據(jù)我國《著作權(quán)法》的規(guī)定[5],著作權(quán)的主體是著作人,所保護(hù)的對(duì)象是表達(dá)而非思想。人工智能寫作的主體雖然不是人類,但在算法的背后依然存在著人為思想引導(dǎo)的證據(jù)。即使有人類的參與,也很難判斷這項(xiàng)行為于法律層面是否為純粹的創(chuàng)作行為。雖然目前國內(nèi)對(duì)人工智能寫作領(lǐng)域的著作權(quán)仍存在諸多爭議,但在版權(quán)保護(hù)的探索實(shí)踐還在不斷進(jìn)行。
5 結(jié)語
本文以建筑領(lǐng)域的數(shù)字化升級(jí)背景為開端,剖析了人工智能可行性研究報(bào)告的市場需求和產(chǎn)品定位,以顆粒度為主軸介紹了方案設(shè)計(jì)的數(shù)據(jù)化實(shí)現(xiàn)思路,以BERT和GPT語言網(wǎng)絡(luò)探究了方案框架搭建的基本邏輯。如今,隨著后疫情時(shí)代對(duì)勞動(dòng)力產(chǎn)出效率的要求逐漸提高,行業(yè)為深度人員優(yōu)化,使得人工智能技術(shù)賦能詳盡性、程序性的工作成為趨勢,智能可行性研究報(bào)告作為咨詢服務(wù)數(shù)字化升級(jí)的突破口,是未來全行業(yè)進(jìn)步的“試金石”,與人工智能有機(jī)結(jié)合可幫助行業(yè)積累充分詳備的路徑經(jīng)驗(yàn),在不久的將來,今天的路線探索可作為成熟的指導(dǎo)建議賦能建筑領(lǐng)域其他業(yè)務(wù)的智能數(shù)字化升級(jí)工作,加快全行業(yè)的產(chǎn)業(yè)轉(zhuǎn)型。(作者:孟獻(xiàn)寶,熊躍華,王凱文)