文章出處:法規(guī)動(dòng)態(tài) 網(wǎng)責(zé)任編輯: 金飛鷹 閱讀量: 發(fā)表時(shí)間:2024-04-16
近日,北京市藥監(jiān)局發(fā)布《北京市人工智能醫(yī)療器械生產(chǎn)質(zhì)量管理規(guī)范檢查指南(2024版)》(以下簡(jiǎn)稱《檢查指南》),我們將其中第四部分“設(shè)計(jì)開(kāi)發(fā)”內(nèi)容轉(zhuǎn)載如下:
生產(chǎn)企業(yè)應(yīng)結(jié)合質(zhì)量管理體系要求,建立人工智能醫(yī)療器械生存周期過(guò)程,開(kāi)展與軟件安全性級(jí)別相匹配的產(chǎn)品質(zhì)量保證工作,確定需求分析、數(shù)據(jù)收集、算法設(shè)計(jì)、驗(yàn)證與確認(rèn)、部署運(yùn)行、更新控制等活動(dòng)要求,將風(fēng)險(xiǎn)管理、可追溯分析(需包含算法和數(shù)據(jù))貫穿于生存周期全程,形成記錄。
1. 需求分析應(yīng)當(dāng)以用戶需求與風(fēng)險(xiǎn)為導(dǎo)向,結(jié)合產(chǎn)品的預(yù)期用途、使用場(chǎng)景、核心功能,綜合分析法律、法規(guī)、規(guī)章、標(biāo)準(zhǔn)、用戶、產(chǎn)品、功能、性能、接口、用戶界面、網(wǎng)絡(luò)安全、警示提示等需求,明確風(fēng)險(xiǎn)管理、可追溯性分析、數(shù)據(jù)收集、算法性能、使用限制、現(xiàn)成軟件(現(xiàn)成算法)的驗(yàn)證與確認(rèn)等活動(dòng)要求,形成相應(yīng)文件。
2. 數(shù)據(jù)收集應(yīng)當(dāng)確保數(shù)據(jù)來(lái)源的合規(guī)性、充分性和多樣性,數(shù)據(jù)分布的科學(xué)性和合理性,數(shù)據(jù)質(zhì)控的充分性、有效性和準(zhǔn)確性。
3. 算法性能需結(jié)合醫(yī)療實(shí)際和產(chǎn)品定位,明確假陰性與假陽(yáng)性、重復(fù)性與再現(xiàn)性、魯棒性/健壯性、實(shí)時(shí)性等性能指標(biāo)的適用性及其要求,并兼顧不同性能指標(biāo)的制約關(guān)系。
4. 使用限制需考慮產(chǎn)品禁用、慎用等場(chǎng)景,準(zhǔn)確表述產(chǎn)品使用場(chǎng)景,提供必要警示提示信息。
1. 數(shù)據(jù)采集
數(shù)據(jù)采集應(yīng)當(dāng)明確采集設(shè)備、采集過(guò)程、數(shù)據(jù)脫敏等質(zhì)控要求,并建立數(shù)據(jù)采集操作規(guī)范。若使用歷史數(shù)據(jù),應(yīng)當(dāng)結(jié)合樣本規(guī)模、采集難度等影響因素合理選擇數(shù)據(jù)采集方式,明確數(shù)據(jù)篩選標(biāo)準(zhǔn)并對(duì)采集的數(shù)據(jù)進(jìn)行質(zhì)量評(píng)估。
采集的數(shù)據(jù)應(yīng)進(jìn)行數(shù)據(jù)脫敏以保護(hù)患者隱私,數(shù)據(jù)脫敏需明確脫敏的類型(靜態(tài)、動(dòng)態(tài))、規(guī)則、方法以及脫敏內(nèi)容的確定依據(jù)。如使用歷史數(shù)據(jù),企業(yè)接收的數(shù)據(jù)應(yīng)為脫敏后的數(shù)據(jù),不得有敏感數(shù)據(jù)流入企業(yè)。
2. 數(shù)據(jù)整理
數(shù)據(jù)整理應(yīng)基于原始數(shù)據(jù)庫(kù)明確數(shù)據(jù)清洗、數(shù)據(jù)預(yù)處理的質(zhì)控要求。數(shù)據(jù)清洗應(yīng)當(dāng)明確清洗的規(guī)則、方法、結(jié)果,數(shù)據(jù)預(yù)處理應(yīng)當(dāng)明確處理的方法(如濾波、增強(qiáng)、重采樣、尺寸裁剪、均一化等)、結(jié)果。數(shù)據(jù)經(jīng)整理后形成基礎(chǔ)數(shù)據(jù)庫(kù),需明確樣本類型、樣本量、樣本分布等信息。
3. 數(shù)據(jù)標(biāo)注
數(shù)據(jù)標(biāo)注應(yīng)當(dāng)明確標(biāo)注資源管理、標(biāo)注過(guò)程質(zhì)控、標(biāo)注質(zhì)量評(píng)估等要求,并建立數(shù)據(jù)標(biāo)注操作規(guī)范。標(biāo)注過(guò)程質(zhì)控包括人員職責(zé)(如人員資質(zhì)、人員數(shù)量、職責(zé)分工)、標(biāo)注規(guī)則(如臨床指南、專家共識(shí)、專家評(píng)議、文獻(xiàn)分析)、標(biāo)注流程(如標(biāo)注對(duì)象、標(biāo)注形式、標(biāo)注輪次、標(biāo)注步驟、結(jié)果審核)、分歧處理(如仲裁人員、仲裁方式)、可追溯性(如數(shù)據(jù)、操作)等要求。數(shù)據(jù)經(jīng)標(biāo)注后形成標(biāo)注數(shù)據(jù)庫(kù),樣本類型可分為數(shù)據(jù)塊(如圖像區(qū)域、數(shù)據(jù)片段)、單一數(shù)據(jù)(由多個(gè)數(shù)據(jù)塊組成)、數(shù)據(jù)序列(由多個(gè)單一數(shù)據(jù)組成)。標(biāo)注數(shù)據(jù)庫(kù)的樣本量、樣本分布等要求及風(fēng)險(xiǎn)考量與基礎(chǔ)數(shù)據(jù)庫(kù)相同。
數(shù)據(jù)標(biāo)注若使用自動(dòng)標(biāo)注軟件,結(jié)果不得直接使用,應(yīng)由標(biāo)注人員審核后方可使用。
4. 數(shù)據(jù)集構(gòu)建
基于標(biāo)注數(shù)據(jù)庫(kù)構(gòu)建訓(xùn)練集、調(diào)優(yōu)集(若有)、測(cè)試集,應(yīng)當(dāng)明確訓(xùn)練集、調(diào)優(yōu)集、測(cè)試集的劃分方法、劃分依據(jù)、數(shù)據(jù)分配比例。訓(xùn)練集原則上需保證樣本分布具有均衡性,測(cè)試集、調(diào)優(yōu)集原則上需保證樣本分布符合真實(shí)情況,訓(xùn)練集、調(diào)優(yōu)集、測(cè)試集的樣本應(yīng)兩兩無(wú)交集并通過(guò)查重予以驗(yàn)證。
數(shù)據(jù)擴(kuò)增(若有)應(yīng)當(dāng)明確擴(kuò)增的對(duì)象、范圍、方式(離線、在線)、方法(如翻轉(zhuǎn)、旋轉(zhuǎn)、鏡像、平移、縮放、濾波、生成對(duì)抗網(wǎng)絡(luò)等)、倍數(shù),在線擴(kuò)增亦需予以記錄,擴(kuò)增需考慮數(shù)據(jù)偏倚的影響及風(fēng)險(xiǎn)。原則上不得對(duì)測(cè)試集進(jìn)行數(shù)據(jù)擴(kuò)增,對(duì)抗測(cè)試除外。
數(shù)據(jù)經(jīng)擴(kuò)增后應(yīng)當(dāng)形成擴(kuò)增數(shù)據(jù)庫(kù),需列表對(duì)比擴(kuò)增數(shù)據(jù)庫(kù)與標(biāo)注數(shù)據(jù)庫(kù)在樣本量、樣本分布(注明擴(kuò)增倍數(shù))等差異,以證實(shí)擴(kuò)增數(shù)據(jù)庫(kù)樣本量的充分性以及樣本分布的合理性。
1. 算法選擇
算法選擇應(yīng)當(dāng)提供所用算法的名稱、類型(如有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí),基于模型、基于數(shù)據(jù),白盒、黑盒)、結(jié)構(gòu)(如層數(shù)、參數(shù)規(guī)模)、輸入輸出數(shù)據(jù)類型、流程圖、算法編程框架、運(yùn)行環(huán)境等基本信息,并明確算法選用依據(jù),包括選用的理由和基本原則。若組合使用集成學(xué)習(xí)、遷移學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等,需提供算法基本信息以及算法選用依據(jù)。
2. 算法訓(xùn)練
算法訓(xùn)練應(yīng)當(dāng)基于訓(xùn)練集、調(diào)優(yōu)集進(jìn)行訓(xùn)練和調(diào)優(yōu),考慮評(píng)估指標(biāo)、訓(xùn)練方式、訓(xùn)練目標(biāo)、調(diào)優(yōu)方式、訓(xùn)練數(shù)據(jù)量—評(píng)估指標(biāo)曲線等要求。
3. 算法性能評(píng)估
算法性能評(píng)估應(yīng)當(dāng)基于測(cè)試集對(duì)算法設(shè)計(jì)結(jié)果進(jìn)行評(píng)估,綜合評(píng)估假陰性與假陽(yáng)性、重復(fù)性與再現(xiàn)性、魯棒性/健壯性、實(shí)時(shí)性等適用性,以證實(shí)算法性能滿足算法設(shè)計(jì)目標(biāo),并作為軟件驗(yàn)證、軟件確認(rèn)的基礎(chǔ)。若使用第三方數(shù)據(jù)庫(kù)開(kāi)展算法性能評(píng)估,應(yīng)當(dāng)提供第三方數(shù)據(jù)庫(kù)的基本信息(如名稱、創(chuàng)建者、數(shù)據(jù)總量等)和使用情況(如測(cè)試數(shù)據(jù)樣本量、評(píng)估指標(biāo)、評(píng)估結(jié)果等)。
對(duì)于黑盒算法,應(yīng)開(kāi)展算法性能影響因素分析,并提供算法性能影響因素分析報(bào)告,明確影響算法性能的主要因素及其影響程度,以及產(chǎn)品使用限制和必要警示提示信息。
1. 軟件驗(yàn)證
軟件驗(yàn)證應(yīng)當(dāng)基于軟件需求予以開(kāi)展,保證軟件的安全有效性,并作為軟件確認(rèn)的基礎(chǔ)。
2. 軟件確認(rèn)
軟件確認(rèn)測(cè)試應(yīng)當(dāng)基于用戶需求,由預(yù)期用戶在真實(shí)或模擬使用場(chǎng)景下予以開(kāi)展,涵蓋現(xiàn)成軟件、網(wǎng)絡(luò)安全的測(cè)試要求,確定缺陷管理、風(fēng)險(xiǎn)管理、可追溯性分析、評(píng)審等活動(dòng)要求,形成用戶測(cè)試記錄、測(cè)試報(bào)告以及評(píng)審記錄并經(jīng)批準(zhǔn),適時(shí)更新并經(jīng)批準(zhǔn)??勺匪菪苑治龃藭r(shí)應(yīng)當(dāng)分析用戶測(cè)試與用戶需求、用戶測(cè)試與風(fēng)險(xiǎn)管理的關(guān)系。同時(shí),開(kāi)展算法性能比較分析,若各類測(cè)試場(chǎng)景(含臨床評(píng)價(jià))算法性能變異度較大,詳述原因并基于分析結(jié)果明確產(chǎn)品使用限制和必要警示提示信息。最后,結(jié)合算法訓(xùn)練、算法性能評(píng)估、臨床評(píng)價(jià)等結(jié)果開(kāi)展算法性能綜合評(píng)價(jià),針對(duì)訓(xùn)練樣本量和測(cè)試樣本量過(guò)少、測(cè)試結(jié)果明顯低于算法設(shè)計(jì)目標(biāo)、算法性能變異度過(guò)大等情況,對(duì)產(chǎn)品的適用范圍、使用場(chǎng)景、核心功能進(jìn)行必要限制。
基于測(cè)評(píng)數(shù)據(jù)庫(kù)開(kāi)展的,除滿足數(shù)據(jù)庫(kù)通用要求(如數(shù)據(jù)管理、網(wǎng)絡(luò)安全與數(shù)據(jù)安全、可擴(kuò)展性)外,還應(yīng)滿足權(quán)威性、科學(xué)性、規(guī)范性、多樣性、封閉性和動(dòng)態(tài)性要求。不應(yīng)使用公開(kāi)數(shù)據(jù)庫(kù)作為測(cè)評(píng)數(shù)據(jù)庫(kù)。
算法發(fā)布和更新時(shí)應(yīng)在相關(guān)文件列明算法關(guān)鍵模塊的功能、接口、版本、存儲(chǔ)形式(如pt、pth、bin、onnx、pb、keras、ckpt、pkl等);主要功能組件模塊及相互依賴和接口關(guān)系;軟件的前后端部署方式;對(duì)基礎(chǔ)軟件和硬件的依賴和兼容性要求等。
人工智能醫(yī)療器械若發(fā)生算法更新、軟件更新,均應(yīng)當(dāng)按照質(zhì)量管理體系的要求,開(kāi)展與算法更新、軟件更新的類型、內(nèi)容和程度相適宜的驗(yàn)證與確認(rèn)活動(dòng),將風(fēng)險(xiǎn)管理、可追溯分析貫穿于更新全程,形成記錄。此外,算法更新、軟件更新均需考慮引入回滾機(jī)制,以保證醫(yī)療業(yè)務(wù)的連續(xù)性,特別是對(duì)風(fēng)險(xiǎn)較高的軟件。
軟件版本控制應(yīng)當(dāng)基于合規(guī)性要求確定軟件版本命名規(guī)則,涵蓋自研軟件、現(xiàn)成軟件、算法(算法驅(qū)動(dòng)型更新或數(shù)據(jù)驅(qū)動(dòng)型更新)網(wǎng)絡(luò)安全的全部軟件更新類型,明確并區(qū)分重大軟件更新和輕微軟件更新,并符合軟件版本命名規(guī)則的要求。
對(duì)數(shù)據(jù)集進(jìn)行用途(如訓(xùn)練、調(diào)優(yōu)、測(cè)試、驗(yàn)證等)的變更,應(yīng)按照數(shù)據(jù)集管理體系的要求進(jìn)行確認(rèn)形成記錄。高控制等級(jí)的數(shù)據(jù)集停用后數(shù)據(jù)可流入低控制等級(jí)的數(shù)據(jù)集,不允許低控制等級(jí)的數(shù)據(jù)集向高控制等級(jí)流動(dòng)(測(cè)試集數(shù)據(jù)可變更為訓(xùn)練和調(diào)優(yōu)使用,不可將訓(xùn)練集、調(diào)優(yōu)集的數(shù)據(jù)變更為測(cè)試使用)。數(shù)據(jù)集數(shù)據(jù)的變更,應(yīng)按照建立數(shù)據(jù)集過(guò)程相同的質(zhì)量體系進(jìn)行管理,并記錄更新內(nèi)容和版本變更。
人工智能醫(yī)療器械全生命周期過(guò)程中應(yīng)當(dāng)考慮網(wǎng)絡(luò)安全與數(shù)據(jù)安全問(wèn)題,對(duì)網(wǎng)絡(luò)與數(shù)據(jù)安全過(guò)程的控制要求形成文件,包括數(shù)據(jù)轉(zhuǎn)移要求,數(shù)據(jù)整理、數(shù)據(jù)集構(gòu)建、算法訓(xùn)練等內(nèi)部活動(dòng)開(kāi)展過(guò)程中的數(shù)據(jù)污染防護(hù)措施,以及數(shù)據(jù)標(biāo)注、軟件確認(rèn)等涉及外部活動(dòng)開(kāi)展過(guò)程中的數(shù)據(jù)污染防護(hù)措施及數(shù)據(jù)接口要求。
各數(shù)據(jù)庫(kù)(集)均需進(jìn)行數(shù)據(jù)備份,明確備份的方法、頻次、數(shù)據(jù)恢復(fù)方法。
數(shù)據(jù)庫(kù)和數(shù)據(jù)集訪問(wèn)應(yīng)明確授權(quán)訪問(wèn)管理要求,形成文件及記錄。
人工智能醫(yī)療器械軟件應(yīng)明確算法的軟件安全性級(jí)別(輕微、中等、嚴(yán)重)并詳述判定理由。應(yīng)形成算法風(fēng)險(xiǎn)管理資料,明確過(guò)擬合與欠擬合、假陰性與假陽(yáng)性、數(shù)據(jù)污染與數(shù)據(jù)偏倚(如數(shù)據(jù)擴(kuò)增引入的偏倚)、中外差異等風(fēng)險(xiǎn)的控制措施。
可追溯性分析應(yīng)當(dāng)建立控制程序,涵蓋軟件、現(xiàn)成軟件、算法及數(shù)據(jù)、網(wǎng)絡(luò)安全的控制要求,形成軟件及算法的可追溯性分析報(bào)告。使用可追溯性分析工具保證軟件開(kāi)發(fā)、軟件更新過(guò)程滿足可追溯性要求,并貫穿于軟件生存周期全過(guò)程。提供算法可追溯性分析報(bào)告等相關(guān)文件及記錄,即追溯算法需求、算法設(shè)計(jì)、算法實(shí)現(xiàn)、算法驗(yàn)證與確認(rèn)、風(fēng)險(xiǎn)管理、數(shù)據(jù)集的管理。若無(wú)單獨(dú)文檔可提供軟件可追溯性分析報(bào)告,并注明算法可追溯性分析所在位置。
以上僅對(duì)《檢查指南》部分內(nèi)容進(jìn)行轉(zhuǎn)載,如需查看全文,請(qǐng)點(diǎn)擊“閱讀原文”
信息來(lái)源:北京市藥監(jiān)局
排版整理:金飛鷹藥械
醫(yī)療器械注冊(cè)咨詢認(rèn)準(zhǔn)金飛鷹 深圳:0755-86194173 廣州:020 - 82177679 四川:028 - 68214295 湖南:0731-22881823 湖北:181-3873-5940 江蘇:135-5494-7827 廣西:188-2288-8311 海南:135-3810-3052