【“ZiDongHua”之創(chuàng)新&科技觀察:自動語音識別、泰語語音識別AI】由Chula Computer Engineering的Ekapol Chuangsuwanich博士牽頭的團隊開發(fā)了"Gowajee",這個泰語語音識別AI能夠更自然、更準確地理解和執(zhí)行泰語命令。實際使用情況表明,語言錯誤發(fā)生率僅為9%,而其他語言識別AI則為15%。

 

 

"Gowajee"----來自Chula的泰語語音識別AI

 

 

Chula Engineering教授設計了"Gowajee",這是一種泰語語音識別AI,具有母語使用者的準確性,可確保用戶的數(shù)據(jù)安全。該AI現(xiàn)已被部署到呼叫中心,并用于抑郁癥患者篩查。

 


"Gowajee"——來自Chula的泰語語音識別AI

我們已習慣對Google或Siri等AI使用語音命令,但泰語使用者可能會厭煩AI不理解他們的吐字發(fā)音,從而導致轉(zhuǎn)錄發(fā)生錯誤。

意識到這個問題,Chula Computer Engineering的Ekapol Chuangsuwanich博士牽頭的團隊開發(fā)了"Gowajee",這個泰語語音識別AI能夠更自然、更準確地理解和執(zhí)行泰語命令。實際使用情況表明,語言錯誤發(fā)生率僅為9%,而其他語言識別AI則為15%。

Gowajee這個名字來源于"Go"和"Wajee"(意思是單詞)。這個詞被設計成類似于"OK Google"或"Hey Siri"的命令。Gowajee一詞經(jīng)過精心設計,與泰語中使用的任何其他單詞都不同。

泰語聲音數(shù)據(jù)庫的編制工作于2017年開始,已經(jīng)能夠獲取5000小時的數(shù)據(jù),該團隊認為這些數(shù)據(jù)足以準確地轉(zhuǎn)錄泰語。該AI有3個主要功能:

  1. 自動語音識別(ASR),可將語音轉(zhuǎn)換為文本。
  2. 文本轉(zhuǎn)語音(TTS),將一段文字轉(zhuǎn)錄成口語。
  3. 自動說話人驗證(ASV),即通過聲音進行身份驗證。

Gowajee已被各種機構使用,如大學、公共和私營部門,尤其是在呼叫中心,其用戶滿意度非常高。

Gowajee也被用于在DMIND系統(tǒng)中篩查抑郁癥患者。盡管情感環(huán)境具有挑戰(zhàn)性,但Gowajee在解碼情緒線索方面表現(xiàn)出色。

Gowajee和AI技術可用于許多其他場合,如牙科診所、言語不清患者中風風險的檢測、生活指導和聽力障礙輔助。

"數(shù)據(jù)安全"是Gowajee的另一個優(yōu)勢,所有數(shù)據(jù)都存儲在用戶的數(shù)據(jù)庫中,以確保其安全,對于像銀行這樣需要極高數(shù)據(jù)安全性的組織非常有用。