(資料圖片)
語音是人類交流的重要方式,但說話者的健康狀態(例如神經疾病、癌癥、外傷等原因導致的聲音障礙)和周圍環境(噪音干擾、傳播介質)往往會影響聲音的傳輸和識別。研究人員一直在改進通用語音識別和交互技術,這些技術可以很好地處理細微的聲音或嘈雜的環境。多通道聲波傳感器可以提高聲音識別的精度,但因體積較大而無法佩戴。近期,清華大學的研究團隊開發了一種基于石墨烯的智能可穿戴人工喉(AT),可以實現語音感知和發聲。研究成果發表在《Nature Machine Intelligence》期刊,論文的標題“Mixed-modality speech recognition and interaction using a wearable artificial throat”。
該研究團隊通過激光直寫技術在超薄聚酰亞胺薄膜上轉化出基于石墨烯的智能可穿戴人工喉(AT),實現了對聲音信號和機械運動的混合模態的感知,使AT能夠獲得低基頻信號,同時具有抗噪聲的語音感知能力。實驗結果表明,混合模態AT能夠檢測基本語音元素(音素、聲調和單詞),平均準確率達到99.05%。此外,通過集成AI模型,AT識別出了喉切除術患者含糊說出的日常詞匯,準確率超過90%。同時,AT還可以通過熱聲效應實現聲音的播放功能,以恢復患者的發聲能力。
該研究提出的AT具有制作工藝簡單、性能穩定、抗噪性強、可集成發聲等特點,使其成為下一代語音識別和交互系統的有力工具。
注:此研究成果摘自《Nature Machine Intelligence》雜志,文章內容不代表本網站觀點和立場,僅供參考。
知前沿,問智研。智研咨詢是中國一流產業咨詢機構,十數年持續深耕產業研究領域,提供深度產業研究報告、商業計劃書、可行性研究報告及定制服務等一站式產業咨詢服務。專業的角度、品質化的服務、敏銳的市場洞察力,專注于提供完善的產業解決方案,為您的投資決策賦能。
關鍵詞:
責任編輯:Rex_04