• <u id="j7xcw"><thead id="j7xcw"></thead></u>

    <wbr id="j7xcw"><table id="j7xcw"><button id="j7xcw"></button></table></wbr>
    <u id="j7xcw"></u>

      1. <wbr id="j7xcw"></wbr>
        <input id="j7xcw"></input>

        中國企業報集團主管主辦

        中國企業信息交流平臺

        微博 微信

        網上問醫斷病,這輪AI行不行?

        2023-07-18 10:31 來源:科技日報 次閱讀
         
        網上問醫斷病,這輪AI行不行?

        你在網上搜過“我哪哪疼是不是得了啥啥病”嗎?答案可能不盡如人意。但隨著ChatGPT等大型自然語言模型(LLM)風生水起,人們開始嘗試用它來回答醫學問題或醫學知識。

          不過,靠譜嗎?

          就其本身而言,人工智能(AI)給出的答案是準確的。但英國巴斯大學教授詹姆斯·達文波特指出了醫學問題和實際行醫之間的區別,他認為“行醫并不只是回答醫學問題,如果純粹是回答醫學問題,我們就不需要教學醫院,醫生也不需要在學術課程之后接受多年的培訓了。”

          鑒于種種疑惑,在《自然》雜志新近發表的一篇論文中,全球頂尖的人工智能專家們展示了一個基準,用于評估大型自然語言模型能多好地解決人們的醫學問題。

          現有的模型尚不完善

          最新的這項評估,來自谷歌研究院和深度思維公司。專家們認為,人工智能模型在醫學領域有許多潛力,包括知識檢索和支持臨床決策。但現有的模型尚不完善,例如可能會編造令人信服的醫療錯誤信息,或納入偏見加劇健康不平等。因此才需要對其臨床知識進行評估。

          相關的評估此前并非沒有。然而,過去通常依賴有限基準的自動化評估,例如個別醫療測試得分。這轉化到真實世界中,可靠性和價值都有欠缺。

          而且,當人們轉向互聯網獲取醫療信息時,他們會遭遇“信息超載”,然后從10種可能的診斷中選擇出最壞的一種,從而承受很多不必要的壓力。

          研究團隊希望語言模型能提供簡短的專家意見,不帶偏見、表明其引用來源,并合理表達出不確定性。

          5400億參數的LLM表現如何

          為評估LLM編碼臨床知識的能力,谷歌研究院的專家謝庫菲·阿齊茲及其同事探討了它們回答醫學問題的能力。團隊提出了一個基準,稱為“MultiMedQA”:它結合了6個涵蓋專業醫療、研究和消費者查詢的現有問題回答數據集以及“HealthSearchQA”——這是一個新的數據集,包含3173個在線搜索的醫學問題。

          團隊隨后評估了PaLM(一個5400億參數的LLM)及其變體Flan-PaLM。他們發現,在一些數據集中Flan-PaLM達到了最先進水平。在整合美國醫師執照考試類問題的MedQA數據集中,Flan-PaLM超過此前最先進的LLM達17%。

          不過,雖然Flan-PaLM的多選題成績優良,進一步評估顯示,它在回答消費者的醫療問題方面存在差距。

          專精醫學的LLM令人鼓舞

          為解決這一問題,人工智能專家們使用一種稱為設計指令微調的方式,進一步調試Flan-PaLM適應醫學領域。同時,研究人員介紹了一個專精醫學領域的LLM——Med-PaLM。

          設計指令微調是讓通用LLM適用新的專業領域的一種有效方法。產生的模型Med-PaLM在試行評估中表現令人鼓舞。例如,Flan-PaLM被一組醫師評分與科學共識一致程度僅61.9%的長回答,Med-PaLM的回答評分為92.6%,相當于醫師作出的回答(92.9%)。同樣,Flan-PaLM有29.7%的回答被評為可能導致有害結果,Med-PaLM僅5.8%,相當于醫師所作的回答(6.5%)。

          研究團隊提到,結果雖然很有前景,但有必要作進一步評估,特別是在涉及安全性、公平性和偏見方面。

          換句話說,在LLM的臨床應用可行之前,還有許多限制要克服。

        ◎本報記者 張夢然

        點贊()
        上一條:上海德達醫院團隊受邀參加美國血管外科協會年會2023-07-11
        下一條:美首例機器人肝移植手術成功2023-07-19

        相關稿件

        治療帕金森病常備藥多地斷供 網售價高出醫保價十余倍 2021-10-22
        阿里大語言模型“通義千問”亮相 引發市場關注 2023-04-12
        王毅答記者問 這十五句精彩回應 擲地有聲 2021-03-08
        關愛“罕見” 點亮生命之光——我國加速破解罕見病診療和用藥保障之困 2023-03-01
        ChatGPT來了 AI企業如何應對 2023-02-14
        國務院國有資產管理委員會 中國企業聯合會 中國企業報 中國社會經濟網 中國國際電子商務網 新浪財經 鳳凰財經 中國報告基地 企業社會責任中國網 杭州網 中國產經新聞網 環球企業家 華北新聞網 和諧中國網 天機網 中貿網 湖南經濟新聞網 翼牛網 東莞二手房 中國經濟網 中國企業網黃金展位頻道 硅谷網 東方經濟網 華訊財經 網站目錄 全景網 中南網 美通社 大佳網 火爆網 跨考研招網 當代金融家雜志 借貸撮合網 大公財經 誠搜網 中國鋼鐵現貨網 證券之星 融易在線 2014世界杯 中華魂網 納稅人俱樂部 慧業網 商界網 品牌家 中國國資報道 金融界 中國農業新聞網 中國招商聯盟 和訊股票 經濟網 中國數據分析行業網 中國報道網 九州新聞網 投資界 北京科技創新企業誠信聯盟網 中國白銀網 炣燃科技 中企媒資網 中國石油化工集團 中國保利集團公司 東風汽車公司 中國化工集團公司 中國電信集團公司 華為技術有限公司 廈門銀鷺食品有限公司 中國恒天集團有限公司 濱州東方地毯集團有限公司 大唐電信科技股份有限公司 中國誠通控股集團有限公司 喜來健醫療器械有限公司 中國能源建設股份有限公司 內蒙古伊利實業集團股份有限公司 中國移動通信集團公司 中國化工集團公司 貴州茅臺酒股份有限公司
        亚洲黄色无码免费网站_亚洲国产精品综合久久久_国产成人观看免费全部完_亚洲日韩精品中文字幕第21页
      1. <u id="j7xcw"><thead id="j7xcw"></thead></u>

        <wbr id="j7xcw"><table id="j7xcw"><button id="j7xcw"></button></table></wbr>
        <u id="j7xcw"></u>

          1. <wbr id="j7xcw"></wbr>
            <input id="j7xcw"></input>
            在线网站亚洲观看AV | 亚洲四色在线影院 | 亚洲国产日韩欧美在线看片 | 色综合一区二区三区 | 亚洲AV综合A国产AV中文 | 日韩视频亚洲视频 |