加入星計劃,您可以享受以下權益:

  • 創(chuàng)作內容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 聲學標志物應用于臨床的可行性提高
    • 谷歌大模型下場,進入聲學標志物AI領域研究
    • Eko人工智能算法獲FDA首批,進一步加速產業(yè)發(fā)展
    • 其他企業(yè)也在該領域取得了實質性進展
    • 聲學標志物AI在發(fā)展過程中面臨著一系列挑戰(zhàn)
    • 結尾:
  • 推薦器件
  • 相關推薦
  • 電子產業(yè)圖譜
申請入駐 產業(yè)圖譜

產業(yè)丨谷歌進場,F(xiàn)DA首批,聲學標志物AI進展加速

09/07 08:55
805
閱讀需 13 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者 | 方文三

人體器官的物理結構會隨著生理和病理狀態(tài)的變化而改變,這導致不同疾病患者發(fā)出的聲音以及器官自身發(fā)聲產生特異性變化,這些聲音特征可以作為疾病的[聲音標志物]。

聲學標志物應用于臨床的可行性提高

一個簡單的例子是,感冒患者的聲音會變得沙啞,這便是聲音特征變化的一種體現(xiàn)。

隨著數(shù)字時代的到來,聽診器這一擁有超過兩百年歷史的醫(yī)療工具煥發(fā)了新的生機。

數(shù)字聽診器通過電子技術將聲波轉換為高精度的數(shù)字化電信號,并經過放大與處理,實現(xiàn)了比傳統(tǒng)聽診器更為清晰的聲音輸出。

加之人工智能技術的迅猛發(fā)展,將生物聲學標志物應用于臨床的可行性正逐漸從[遙不可及]轉變?yōu)閇觸手可及]。

然而,這一進程并非一帆風順。環(huán)境噪聲等外部因素會對音頻信號造成干擾,影響到咳嗽音特征的提取與分析。

受限于硬件性能,過去難以捕捉到高質量的聲音信號。

值得慶幸的是,傳感器技術的快速進步有效彌補了這一缺陷。

新一代電子聽診器采用壓電陶瓷傳感器作為拾音部件,相較于以往產品,其信號質量和頻率響應曲線更為優(yōu)異,能夠提供更準確、清晰的心肺音信號,進而精確獲取用戶的健康數(shù)據。

更為關鍵的是,智能手機作為聲音標志物采集設備,在經歷了多年的激烈競爭和技術革新后,其麥克風拾音性能普遍有了顯著提升,足以滿足基本的音頻信號采集需求。

在克服了硬件障礙之后,聲學標志物的發(fā)展正步入快車道。

谷歌大模型下場,進入聲學標志物AI領域研究

今年初,谷歌發(fā)布了名為Health Acoustic Representations(簡稱HeAR)的生物聲學基礎模型,該模型旨在協(xié)助研究人員開發(fā)出能夠通過監(jiān)聽人體聲音來識別早期疾病征兆的系統(tǒng)。

谷歌Research團隊利用了一個包含三億條經過去識別化處理的音頻數(shù)據集對HeAR進行了訓練,特別使用了一億條咳嗽聲音數(shù)據來訓練咳嗽識別模型。

像HeAR這樣的解決方案,將使AI驅動的聲學分析在結核病篩查和檢測領域開辟新的可能性,為最需要的人群提供一種潛在的低成本、易于獲取的工具。

這項AI系統(tǒng)經過對數(shù)百萬個音頻剪輯樣本的訓練,未來有望輔助醫(yī)生診斷包括COVID-19和肺結核在內的肺部疾病,并對個人的肺功能進行評估。

HeAR的創(chuàng)新之處在于其使用的龐大訓練數(shù)據集,以及其能夠針對多種不同任務進行微調的能力。

在該領域開發(fā)的大多數(shù)人工智能工具都是通過音頻記錄進行訓練的,例如咳嗽的錄音,這些錄音與發(fā)出聲音者的健康信息相匹配。

例如,這些錄音片段可能會被標記為錄音時該人患有支氣管炎。這些人工智能工具通過監(jiān)督學習(Supervised Learning)的訓練過程,將聲音特征與數(shù)據標簽相關聯(lián)。

而在本項研究中,谷歌的研究人員采用了自監(jiān)督學習(Self-supervised Learning),使用未標記的數(shù)據,并通過自動化過程,從公開的YouTube視頻中提取了超過三億個咳嗽、呼吸、清喉嚨及其他人類聲音的短片段。

每個片段被轉換為聲音的視覺表示——頻譜圖。研究團隊隨后對頻譜圖的片段進行了屏蔽處理,以幫助模型學習預測缺失的部分。

這與聊天機器人ChatGPT的大型語言模型在經過大量人類文本示例訓練后學會預測句子中下一個單詞的過程類似。

利用這種方法,研究團隊構建了一個基礎模型,該模型能夠適應多種不同的任務。

研究顯示,HeAR在多項任務中的平均表現(xiàn)超越了其他模型,尤其在跨麥克風泛化能力方面,展現(xiàn)了其在捕捉與健康相關的聲學數(shù)據中的顯著模式識別能力。

基于HeAR訓練的模型即使在數(shù)據量有限的情況下也能實現(xiàn)高性能,這對于醫(yī)療研究領域中數(shù)據稀缺的問題具有特別重要的意義。

HeAR現(xiàn)已向研究人員開放,目的是促進定制化生物聲學模型的快速發(fā)展,即使在數(shù)據稀缺或面臨成本和計算能力限制的情況下,也能為特定疾病和人群的研究提供支持。

8月底,谷歌宣布了HeAR模型的第一個應用項目,將與印度企業(yè)Salcit Technologies合作,將HeAR應用于肺結核的早期篩查。

Eko人工智能算法獲FDA首批,進一步加速產業(yè)發(fā)展

在今年五月,Eko公司宣布其與數(shù)字聽診器相輔相成的人工智能軟件——[Eko低射血分數(shù)工具(eleft)]獲得了批準。

這一軟件被認定為美國食品藥品監(jiān)督管理局(FDA)批準的首個能夠輔助進行心力衰竭早期篩查的人工智能算法,標志著醫(yī)學領域的一項重大創(chuàng)新,緊接著在6月完成了4100萬美元的D輪融資。

通過Eko的人工智能技術,醫(yī)生能夠在短短15秒內,僅憑數(shù)字聽診器采集到的心音,檢測出心臟低射血分數(shù)(亦稱心臟低EF值)——這一指標反映了心臟的收縮泵血能力。

射血分數(shù)降低型心力衰竭(HFrEF)是心力衰竭的主要類型之一。

據數(shù)據顯示,在美國超過六百萬的心力衰竭患者中,約有一半患有射血分數(shù)降低型心力衰竭。

Eko的人工智能算法與配套的數(shù)字聽診器相結合,能夠識別心臟雜音,有望在最初的常規(guī)檢查中,盡早識別出射血分數(shù)降低型心力衰竭患者。

被識別出的患者隨后可以接受進一步的檢查,以便及時進行干預。

在2020年至2023年期間,Eko公司還獲得了多款醫(yī)療器械的批準,這些不僅包括升級版的數(shù)字聽診器,還包括能夠生成心音圖并對其進行分析的人工智能算法。

其他企業(yè)也在該領域取得了實質性進展

另一家在業(yè)界享有盛譽的公司TytoCare,在去年8月完成了4900萬美元的融資。

其人工智能算法在7月底也獲得了FDA的進一步批準,該算法能夠檢測成人及兩歲以上兒童的肺部濕啰音,從而有助于早期發(fā)現(xiàn)潛在的肺部疾病。

除了肺結核,哮喘和慢性阻塞性肺疾?。璺危┮彩巧锫晫W標志物研究的重點。

澳大利亞的Resapp Health在該領域有著長期的研究積累,并已在澳大利亞上市。

該公司旗下兩款產品之一——SleepCheckRx,用于識別阻塞性睡眠呼吸暫停,已獲得FDA批準;

另一款產品ResAppDx則通過分析咳嗽和呼吸聲來輔助診斷肺部疾病,也已獲得CE認證。

2022年底,制藥巨頭輝瑞以1.79億美元收購了Resapp Health。

例如,日本AMI(Acute Medical Innovation)旗下的AI聽診器,它能夠輔助識別瓣膜性心臟?。òㄖ鲃用}瓣狹窄)的早期征兆,在2022年10月獲得了日本醫(yī)療器械的審批。

TytoCare 在去年 8 月完成了 4900 萬美元的融資,其人工智能算法在 7 月底獲得了 FDA 的額外批準,可用于檢測成人和兩歲以上兒童的肺部濕啰音。

韓國的研究人員運用了基于進化深度學習的逆向設計技術,成功研發(fā)出一種先進的聲學超材料。

釜山國立大學所開發(fā)的通風聲學諧振器(VAR)超材料,具備了降低噪音與提供通風的雙重功能。

傳統(tǒng)分析方法在處理形狀復雜的VAR時存在局限性,僅能實現(xiàn)基礎的參數(shù)設計。

釜山的研究團隊創(chuàng)新性地開發(fā)了一種基于深度學習的逆向設計方法,該方法能夠靈活地設計復雜的非參數(shù)VAR,從而提升性能并降低計算成本。

在所提出的逆向設計方法中,條件變分自動編碼器(CVAE)——一種深度學習生成模型——對潛在空間中的VAR幾何特征進行編碼。

潛在空間是一個低維空間,它包含了高維輸入(本例中為VAR)的核心信息。

這種聲學超材料的設計方法標志著人工智能驅動的先進制造(AM)以及其他復雜機械結構設計領域邁出了關鍵性的一步。

這些企業(yè)的努力和成就共同推動了聲學標志物 AI 領域的快速發(fā)展,使得這一新興領域展現(xiàn)出巨大的潛力和廣闊的應用前景。

聲學標志物AI在發(fā)展過程中面臨著一系列挑戰(zhàn)

①高質量的音頻數(shù)據對于訓練精準有效的人工智能模型至關重要,但目前大多數(shù)醫(yī)療機構尚未建立完善的音頻數(shù)據庫,這給模型的訓練和優(yōu)化帶來了極大困難。

②由于聲音特征的復雜性和多變性,模型在不同環(huán)境和人群中的表現(xiàn)可能存在差異,導致結果的可靠性受到影響。此外,診斷準確度的提升仍有很大空間。

盡管聲學標志物AI展現(xiàn)出一定的潛力,但在面對復雜的疾病和個體差異時,仍可能出現(xiàn)誤診或漏診的情況。

③在通用音頻特征的基礎上,針對咳嗽的發(fā)聲特性以及特定疾?。ɡ绶谓Y核)的病理特征和癥狀表現(xiàn),設計精準的特定疾病患者咳嗽音的靶點特征,以實現(xiàn)對特定疾病患者與健康人群以及其他肺部疾病患者的精確區(qū)分,這一問題仍需解決。

④通常,模型訓練所用的音頻數(shù)據較為理想,但在實際應用中,需要識別的音頻信號會受到各種干擾,這會影響咳嗽音特征的提取和分析。

不同拾音設備的性能差異也可能導致咳嗽音頻質量和特性發(fā)生變化,進而影響模型的診斷結果。

由于音頻數(shù)據的采集及標注都較為困難,這要求模型在少量精標注數(shù)據的條件下仍然保持較好的檢測性能。

如何解決小樣本數(shù)據和復雜模型學習之間的矛盾,也是一個亟待解決的課題。

結尾:

在模型訓練過程中,如何通過數(shù)據增強、噪聲抑制等方法減輕噪聲影響,利用領域泛化技術消除設備差異,從而提升診斷模型的魯棒性,將是提升生物聲學標志物模型實際可用性的關鍵問題。

部分資料參考:

醫(yī)健網:《谷歌?AI用聲音數(shù)據預測健康風險,讓聲音成為健康監(jiān)測新工具》,生物世界:《谷歌最新論文:用AI通過咳嗽聲來診斷疾病》,vb動脈網:《谷歌大模型下場,F(xiàn)DA完成首批,這個AI賽道起飛在即》,DeepTech深科技:《AI軟件通過患者咳嗽聲識別結核病,已通過3.3萬次自發(fā)咳嗽檢驗》,21dB聲學人:《聲學研究新進展:AI創(chuàng)造聲學超材料》

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據手冊 ECAD模型 風險等級 參考價格 更多信息
ATXMEGA128A1-CUR 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, PBGA100, 9 X 9 MM, 1.20 MM HEIGHT, 0.80 MM PITCH, GREEN, CBGA-100
$10.58 查看
ATXMEGA256D3-AUR 1 Microchip Technology Inc IC MCU 8BIT 256KB FLASH 64TQFP
$6.07 查看
PIC32MX575F512L-80I/PT 1 Microchip Technology Inc 32-BIT, FLASH, 80 MHz, RISC MICROCONTROLLER, PQFP100, 12 X 12 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-100

ECAD模型

下載ECAD模型
$8.67 查看
谷歌

谷歌

谷歌公司(Google Inc.)成立于1998年9月4日,由拉里·佩奇和謝爾蓋·布林共同創(chuàng)建,被公認為全球最大的搜索引擎公司。谷歌是一家位于美國的跨國科技企業(yè),業(yè)務包括互聯(lián)網搜索、云計算、廣告技術等,同時開發(fā)并提供大量基于互聯(lián)網的產品與服務,其主要利潤來自于關鍵詞廣告等服務。

谷歌公司(Google Inc.)成立于1998年9月4日,由拉里·佩奇和謝爾蓋·布林共同創(chuàng)建,被公認為全球最大的搜索引擎公司。谷歌是一家位于美國的跨國科技企業(yè),業(yè)務包括互聯(lián)網搜索、云計算、廣告技術等,同時開發(fā)并提供大量基于互聯(lián)網的產品與服務,其主要利潤來自于關鍵詞廣告等服務。收起

查看更多

相關推薦

電子產業(yè)圖譜

AI芯天下是智能芯片行業(yè)垂直自媒體。采用媒體+行業(yè)的模式,堅持從芯出發(fā),用心服務的理念,致力于豐富的網絡基礎資源建設。官網:http://www.world2078.com/ 公眾號:World_2078