核心技術

掌握建立領域大型語言模型(LLM)的關鍵技術、國際NLP主流技術預訓練模型架構,研發文本理解與生成技術,包含繁體中文斷詞器、詞彙萃取、主題分群、文本分類、情緒辨識、與摘要生成等



應用領域

轉化研發成果為基礎解決方案,應用於各產業領域,節省人工閱讀時間,達到人機協同創作,提升工作效率。例如:網路輿情與客服對話、稅務字詞、法律文件等分析流程,已應用於市政、電信、稅務、司法等領域



成果體驗

01 法律領域大型語言模型:TLibra

以領域LLM產製工具,自主訓練法律LLM: TLibra,可精準做到台灣法律書狀理解與生成

02 智慧法律助理

將會議錄音轉成文字,經由AI理解重點後產生文件

03 分析/斷詞(詞性標記)

輸入一篇中文文章,以繁體中文斷詞器進行「斷詞」處理與「詞性標記」,方便後續文本分析及量化統計
詞性標記符號請參考

04 分析/關鍵詞(命名實體識別)

基於斷詞後的結果,以命名實體識別(NER)技術辨識人物、地名、組織等實體標籤,再加入詞彙長度、詞性、TF/IDF值計算權重分數,找出文章中的關鍵詞

05 分析/摘要(節錄式)

針對文章內容與特徵,比較不同句子/文章之間的相似程度,自動擷取重要句子或段落

06 探索/文本理解與分析

以數百篇輿情新聞為例,透過關鍵字調整,結合斷詞、關鍵詞、節錄式摘要、動態主題模型、與潛力熱詞預測等自主研發技術,呈現量化圖表如文字雲、熱詞統計,與質化敘述如重要句等整體概貌資訊

07 分析/情緒識別

經AI學習的情緒模型,計算整篇文章之正負面與中立情緒分數,進而掌握該篇文章內容的語意情緒