從驅動面向顧客的聊天機器人、到追蹤契約承諾內容,到進行大部分的會議,自然語言處理有極大的潛力讓你的企業轉型。
文/Mary Branscombe 譯/高忠義
近期在自然語言處理(NLP)上的改善正強化具備語音與文字能力的主流科技,無論是用自然的音調大聲唸出電子郵件,或者透過Excel程式讓你可以鍵入有關試算表資料的問題,並獲得以自動生成圖表及樞紐分析表(PivotTables)方式提供的答案。
隨著自然語言變得更準確也更普遍,它的潛力包括在預定問題上驅動顧客支援聊天機器人,以至於處理質性、半結構化與未結構化的資料。最終實現知識採礦承諾,而能解開公司流程、資產與債務之謎萃選資訊,以創造更好的工作流程以及對組織更即時的檢視。
「自然語言處理將文字拆解成最簡化的形式,並辨識他們之間的模式、規則與關係,」apexanalytix應用與先進科技資深副總裁 Walt Kristick 這樣解釋。「它使用電腦演算法以解析並詮釋書寫與口語的自然語言而讓系統可以學習並瞭解人類的語言。」
自然語言處理的用途從翻譯及語言生成(摘要、註解或甚至解釋其他機械學習模型)到分類與群集分析、情感分析以及其他資訊萃取。自然語言處理的最簡單形式已經普遍運用,Kristick指出:拼字檢查、建議電子郵件與簡訊回覆,以及像是Siri那樣的虛擬助理全都使用自然語言處理,而聊天機器人也是如此。
「對於從文字與無相關性資料來源分析並萃取意義的能力之需求日漸升高,尤其是在醫療保健與生命科學產業市場」Kristick提到這點。
以下說明自然語言處理的現狀,以及可能適合你的組織的用途。
自然語言處理服務居主導地位
雖然藉著像是 Python NLTK, Sanford CoreNLP 與 Apache OpenNLP 這類的框架,有很多演算法可以用來建構你自己的自然語言處理專案,但最有效果的模型都極其龐大。在撰寫這篇文章時,微軟的170億個參數Turing自然語言生成模型是迄今已發表的模型中最大的,而BERT與GPT-2也有數十億的參數。
「光是將這些模型從架上取下來,還不足以為公司處理某些需要做的複雜工作」微軟的對話式人工智慧企業服務副總經理程麗麗(Lili Cheng)如此警告。「對許多公司來說,存放這些大模型、加以管理,並進行各種工作可能就是極具挑戰性的事。有些人想那麼做,但我們相信更多的顧客只想要客製化的產品,並加入他們自己的資訊,」Cheng那樣說,並提到對許多組織來說,聘請自然語言專家是很大的挑戰。
即使有些組織內部聘了人工智慧專家,仍然時常轉向尋求微軟、亞馬遜、Google與IBM這樣的自然語言處理服務廠商之協助,以利專業開發者與商務使用者也能由新科技中獲益。
Telefonica是微軟的顧客,他們有自己的人工智慧團隊,但也正使用微軟的Power平台讓沒有開發專業能力的企業使用者可以利用像是 Q&A Maker 來創造自己的工具。「你用它點選PDF檔案或常見問題網頁,然後以這些資源為基礎建立知識,讓人們提出問題與解答,或是搜尋或進行對話,」Cheng這麼說。
在此,聊天機器人是關鍵的自然語言處理運用。聊天機器人可以接單、從常見問答集中提供答案、查詢路徑、預訂會議並在必要時將通話轉接真人。自然語言處理也是強大的工具可以從公司愈來愈多的文字及語音檔案更深入瞭解顧客,Confirmit產品管理資深總監 Paul Quinn 這麼說。
「企業時常有超過 100 terabytes 的未結構化資料,從客服中心的記錄與顧客電子郵件到問卷中的意見各種東西都有,」他這麼說。「任何努力想改善顧客體驗或得到有關其品牌更詳細的情報之公司都可運用自然語言處理,從大量的資料中找出藏在其中黃金般的實用資料。」
Signoi的目標是要藉由找出最常用的字,顯現正面與負面的詞語,並用人口統計群體加以彙整,以此處理問卷中的開放式意見。獨立經營的英國運輸服務使用者監督組織 Transport Focus 便利用Signoi來找出通勤者最關切的事項,以及休閒旅客對各種火車服務的最關切事項。商務旅客對於某條路線過於擁擠的情況非常憤怒,那些搭火車休閒旅遊的人則想要更好的停車場,還要更多的空間可以放行李與腳踏車。
但不只有零售業與其他面向顧客的產業可以受惠於自然語言處理,IBM院士兼人工智慧首席設計師 Dakshi Agrawal 那麼說。任何需要與客戶往來的公司都能利用自然語言處理而從他們的互動中獲取深入的情報,Agrawal這麼說,也補充「許多公司現在不只為了外部客戶與合作夥伴委託的工作,也為了內部員工與一般人資委託的工作採用新科技。」舉例來說,主題群集分析便使用諸如語句嵌入之類的自然語言處理科技,而不只是關鍵字萃取,因為客戶對於問題可能使用不同的詞語,所以這種科技更能準確地將問題分類。在儀表板上顯示那些群集有助於突顯趨勢議題或重複發生的問題。
自然語言處理可以用來生成語言以解釋結果。微軟的 Power BI 商業分析服務以及 Salesforce.com 的Tableau,這兩種都能提供特殊功能讓使用者鍵入有關其資料的問題並得出圖表或自動分析的回應。
瞭解企業知道些什麼
自然語言處理有很大的潛力可以協助組織萃取還不知道自己已經知道的事。
例如 ABBY Text Analytics for Contracts、Exigent Contract Management Solution 或 Seal Contract Discovery and Analytics 這類特別由人工智慧驅動的工具可以從契約中找出條款與期限而協助組織瞭解自己到底答應了什麼。XML共同發明人 Jean Paoli 設立的新創事業Docugami之目標則是處理結構化程度較低的文件。
「企業中只有15%的資料儲存在資料庫裡。我們全都運用簡訊、電子郵件與文件互相溝通。真相並不在於那些可愛的結構化資料庫裡。真相藏在所有文件中,」Paoli這樣告訴我們。
「舉一個有大量文件的企業為例,例如商用不動產公司。一個前台的企業使用者花費時間一週做出十五份租賃契約,而他們的經理每週一都會問「你們做了什麼?有效的交屋日是什麼時候?你們有談到停車位嗎?他們是否想要委託我們維護物業?一旦你簽了一份文件,那些就是公司必須寫上去的條款,但那些資訊被埋在文件裡,」Paoli這麼說。
解開這樣的「暗黑資料」就可以取代每週一早上的最新狀況會報,並改善企業的敏捷度,Paoli表示目前這點的重要性已經升高到前所未有的情況,無論是星巴克要求房東重新協商他們的租賃契約或是餐廳需要瞭解他們的保單內容。
「此時此刻,使用自然語言處理以分析你的企業文件是更加重要的,因為企業正重新思考他們的商業模式。他們可能需要重新協商每件事,而他們需要瞭解他們有哪些義務與風險」Paoli這麼說。專業服務廠商Accenture正那樣做,運用它自己的自然語言處理以分析超過一百萬份的契約,藉此瞭解它的承諾與責任。
根據Paoli的說明,內部並未聘用自然語言處理專家的組織,Docugami’s SaaS 提供三十種範本文件可運用在工作上,並且可以從一個企業文件檔案夾中自行選擇,還能協助企業使用者整理出三十分鐘的回饋意見以訓練某個模型。
,Docugami會將資訊儲存到資料庫裡以協助創設儀表板,而你可以在瀏覽器上檢視、或者將它整合到Excel或Tableau。「我們可以說,看吧,這已經過期,或者這些文件都有這個特殊條款,但那一份沒有,」Paoli這麼說。
釋放會議的隱藏力量
從會議與對話中萃取有用的資訊是很費力的人工程序。有些公司的電話通話內容因為法令遵循的原因已經記錄下來,但是它們很少被分析。企業可以從會議中說過的話瞭解多少有關專案進度或即將到來的工作期限呢?
如果企業員工常態性地投入30%以上的時間開會,那些會議所製造的資訊中有許多並未按著如同其他企業資料那樣有意義的方式加以掌握,Otter.ai 的執行長梁松如此指出。
「人們如何才能同步,尤其現在你用Zoom開著一場又一場的會議?」梁松如此表示。
像Otter那樣的轉錄工具可以協助此項工作。在PowerPoint簡報與Teams會議上同步顯示標題,或者在 Azure Streams 廣播平台上提供可搜尋的會議現場記錄,經證明能有效地做出記錄以利之後繼續對話,而不用依靠真人手工記錄。
微軟的Cheng表示,未來,平台將使用轉錄與文件分析還有影像識別以萃取「會議的集體情報」以便在會議之後群組繼續工作時可以讀取使用。「有機會可以記錄更多正在發生的事情,然後更方便與你的團隊分享,」她這麼說。
例如,Bridgewater Associates 就記錄下過去十五年來所有的內部會議,而任何員工都能觀看這些記錄。但因為難以尋找,所以很少人看,而公司現在使用Otter萃取舊會議的內容。
與此相似的,運用 Azure Cognitive Services 語音輸入API而執行的 Azure Media Services 現場會議轉錄也能很快地轉錄聲音檔並上傳到OneDrive。開發者已經可以運用那些APIs設計轉錄apps,但其功能則可以直接內建在平台上,讓這些功能可以更廣泛地運用。
分析與準確性
雖然完全轉錄假以時日可以實現Cheng所說的,藉由背景搜尋找到「有趣的資訊金塊」,但完全轉錄未必始終都是應用自然語言處理技術的最佳結果。
Otter能擷取標籤作為自動的摘要以指示文件內容。自動編寫的文件摘要已納入作為 IBM Watson Natural Language Understanding 這類程式的工具,而 Otter.ai 正開發相似的工具,但你還是必須記得查詢記錄。在2018年微軟展示一套Teams的原型系統,可以從會議記錄中自動生成工作任務並分派出去,也可以自動將會議記錄分派給與會者。
再一段時間,自然語言處理就能提供會議分析:是否持續出現相同議題,是否相同的期限一再被推遲,是否有些員工講得比別人多,或是與人討論。
這一切的價值都仰賴於轉錄的準確性,而對於自然語言處理一般來說準確性是很難衡量的。就某些正式的指標來說,許多自然語言處理系統達到與真人工作相似的品質,但是它們大部分是以對話為基礎,所以不能達到你所想要的準確比較。Cheng指出,並沒有單一的實用衡量方法。
「我們正看到人們整合這些能力成為多模式的系統。你可能發現你的對話系統確實非常優越,但它未並真的能做好搜尋或是混合系統的工作,你在其中可能有語音與文字以及影像還有文件,而你想將它們通通整合在一起,」她這麼說。
轉錄準確度可能隨著錄音品質、背景噪音量、講者的腔調以及人們談論的主題而有不同。Otter.ai 的梁松表示,一個以英文為母語的講者在安靜的環境中其轉錄的準確度可以超過95%。實際上,你能得到一些實用的轉錄,但仍不是盡善盡美。
無論你用哪一種自然語言處理工具,你應該準備好投入時間針對就你的事業來說重要的觀念與關聯性客製化適當的字彙,例如你的產業的專門術語,或是你的產品名稱,以及員工的姓名,這樣系統才能準確辨識。
組織需要留意,若將自然語言處理運用在簡化工作或找資料以外的功能,可能需要先釐清可接受的錯誤水準如何,而Cheng建議,更應著重在端到端的體驗。
「你如何整合這一切以做出人們真正願意使用的東西,而能幫助你的公司或幫助你的顧客做些更有效率的事?」她這麼問。
「你不想要誇下海口,人工智慧並非魔術,它們只是自然語言工具能夠改善的眾多事物之一。今天你的公司面臨的最大問題可能是如何組織你的資訊,從你所有的文件中找出更多的資訊,並讓專業的人來帶領」Cheng這麼說。「我們現在有許多人遠距工作,而我們可以用人工智慧在遠距工作上表現更好。」