

核心技術
掌握建立領域大型語言模型(LLM)的關鍵技術、國際NLP主流技術預訓練模型架構,研發文本理解與生成技術,包含繁體中文斷詞器、詞彙萃取、主題分群、文本分類、情緒辨識、與摘要生成等
應用領域
轉化研發成果為基礎解決方案,應用於各產業領域,節省人工閱讀時間,達到人機協同創作,提升工作效率。例如:網路輿情與客服對話、稅務字詞、法律文件等分析流程,已應用於市政、電信、稅務、司法等領域
成果體驗 |
---|
01 法律領域大型語言模型:TLibra 以領域LLM產製工具,自主訓練法律LLM: TLibra,可精準做到台灣法律書狀理解與生成 |
02 智慧法律助理 將會議錄音轉成文字,經由AI理解重點後產生文件 |
03 分析/斷詞(詞性標記) 輸入一篇中文文章,以繁體中文斷詞器進行「斷詞」處理與「詞性標記」,方便後續文本分析及量化統計 |
04 分析/關鍵詞(命名實體識別) 基於斷詞後的結果,以命名實體識別(NER)技術辨識人物、地名、組織等實體標籤,再加入詞彙長度、詞性、TF/IDF值計算權重分數,找出文章中的關鍵詞 |
05 分析/摘要(節錄式) 針對文章內容與特徵,比較不同句子/文章之間的相似程度,自動擷取重要句子或段落 |
06 探索/文本理解與分析 以數百篇輿情新聞為例,透過關鍵字調整,結合斷詞、關鍵詞、節錄式摘要、動態主題模型、與潛力熱詞預測等自主研發技術,呈現量化圖表如文字雲、熱詞統計,與質化敘述如重要句等整體概貌資訊 |
07 分析/情緒識別 經AI學習的情緒模型,計算整篇文章之正負面與中立情緒分數,進而掌握該篇文章內容的語意情緒 |