聚慕 - 專(zhuān)業(yè)醫(yī)療器械服務(wù)商
設(shè)為首頁(yè) 收藏本頁(yè) 人事招聘 關(guān)于聚慕
400-901-5099
全部商品分類(lèi)
北數(shù)所發(fā)布100個(gè)ai大模型高質(zhì)量訓(xùn)練數(shù)據(jù)集,涉及醫(yī)療健康、醫(yī)藥研發(fā)20余個(gè)
發(fā)布時(shí)間:2024-04-03 09:41:33

3月29日,2024北京AI原生產(chǎn)業(yè)創(chuàng)新大會(huì)暨北京數(shù)據(jù)基礎(chǔ)制度先行區(qū)成果發(fā)布會(huì)在京舉行。會(huì)上,北京國(guó)際大數(shù)據(jù)交易所(下稱(chēng)“北數(shù)所”)牽頭,正式發(fā)布了首批100個(gè)人工智能大模型高質(zhì)量訓(xùn)練數(shù)據(jù)集。

本批數(shù)據(jù)集首次匯聚了來(lái)自中科院大氣物理所、北京市科學(xué)技術(shù)研究院、中國(guó)知網(wǎng)、中汽智聯(lián)、北方健康、中文在線(xiàn)、中國(guó)搜索、牡丹集團(tuán)、瑞萊智慧等36家機(jī)構(gòu)及企業(yè)提供的非公開(kāi)數(shù)據(jù)集作為大模型語(yǔ)料訓(xùn)練數(shù)據(jù)。

數(shù)據(jù)集內(nèi)容覆蓋科技創(chuàng)新、金融服務(wù)、醫(yī)療健康、醫(yī)藥研發(fā)、自動(dòng)駕駛、氣象服務(wù)、商業(yè)航天、影視創(chuàng)作等20多個(gè)應(yīng)用場(chǎng)景,共計(jì)100余個(gè)語(yǔ)料數(shù)據(jù),數(shù)據(jù)總量逾150PB,涵蓋了專(zhuān)業(yè)知識(shí)問(wèn)答、中外論文期刊、古今文化書(shū)籍、互聯(lián)網(wǎng)輿情資訊、知識(shí)產(chǎn)權(quán)多語(yǔ)種音視頻、教學(xué)資源題庫(kù)、科研數(shù)據(jù)、駕駛環(huán)境場(chǎng)景數(shù)據(jù)、高清圖片等多領(lǐng)域、多模態(tài)數(shù)據(jù)語(yǔ)料。

其中,涉及醫(yī)療健康、醫(yī)藥研發(fā)場(chǎng)景的約20個(gè)數(shù)據(jù)集,具體包括:

單細(xì)胞代謝、轉(zhuǎn)錄組數(shù)據(jù)

多肽藥物庫(kù)

二型糖尿病人群隊(duì)列基因位點(diǎn)

核酸適配數(shù)據(jù)庫(kù)

基于醫(yī)保數(shù)據(jù)構(gòu)建藥物平價(jià)替代智能推薦算法模型

就近購(gòu)藥、就診智能推薦模型

就診醫(yī)生、醫(yī)院信息智能推薦模型

臨床知識(shí)數(shù)據(jù)集

腦電預(yù)訓(xùn)練數(shù)據(jù)

匿名化健康醫(yī)療大數(shù)據(jù)

騙保行為AI自動(dòng)識(shí)別算法模型

生物醫(yī)藥研發(fā)質(zhì)量控制與精準(zhǔn)

小分子藥物庫(kù)

藥店評(píng)價(jià)智能推薦模型

藥物化合物結(jié)構(gòu)式及ADMET數(shù)據(jù)

醫(yī)學(xué)大模型監(jiān)督微調(diào)數(shù)據(jù)集

用于反向虛擬篩選的蛋白質(zhì)數(shù)據(jù)庫(kù)

中醫(yī)藥消費(fèi)趨勢(shì)判斷

中醫(yī)知識(shí)數(shù)據(jù)集

醫(yī)藥衛(wèi)生科技(期刊、報(bào)紙、論文)           

北數(shù)所表示,通過(guò)北數(shù)所進(jìn)行人工智能數(shù)據(jù)集進(jìn)場(chǎng)交易,將更好的為模型訓(xùn)練提供更加合規(guī)可靠、便捷化、規(guī)模化的數(shù)據(jù)服務(wù),進(jìn)一步提高數(shù)據(jù)來(lái)源合規(guī)性,降低數(shù)據(jù)交易成本。北京金控集團(tuán)董事長(zhǎng)、北數(shù)所董事長(zhǎng)范文仲表示,建議積極推動(dòng)高價(jià)值數(shù)據(jù)訓(xùn)練集和智能算力進(jìn)場(chǎng)交易,不斷提高人工智能模型訓(xùn)練的合規(guī)性,增加透明度,共同推動(dòng)數(shù)據(jù)要素的開(kāi)放利用,推動(dòng)北京數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展。

會(huì)上,北京亦莊發(fā)布了《北京經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)關(guān)于加快打造AI原生產(chǎn)業(yè)創(chuàng)新高地的若干政策》,提出到2026年,培育性能達(dá)到國(guó)際先進(jìn)水平的通用大模型,打造人工智能標(biāo)桿應(yīng)用場(chǎng)景10個(gè),集聚人工智能產(chǎn)業(yè)鏈企業(yè)100家,實(shí)現(xiàn)園區(qū)營(yíng)業(yè)收入1000億元,建成人工智能算力10000 PFlops。

文件明確了一系列補(bǔ)貼和獎(jiǎng)勵(lì)政策,例如:

每年將發(fā)放1億元的算力券;

支持企業(yè)深耕垂直領(lǐng)域,重點(diǎn)圍繞AI+新藥研發(fā)等領(lǐng)域進(jìn)行技術(shù)攻關(guān),打造行業(yè)垂直領(lǐng)域大模型;

采取“揭榜掛帥”機(jī)制,鼓勵(lì)重點(diǎn)圍繞“大模型+”醫(yī)療等領(lǐng)域,打造一批可復(fù)制、可推廣的標(biāo)桿型示范應(yīng)用場(chǎng)景;

每年發(fā)放1億元模型券;

推動(dòng)“大模型+醫(yī)藥研發(fā)”,加強(qiáng)數(shù)字生物學(xué)、計(jì)算機(jī)藥物發(fā)現(xiàn)、實(shí)驗(yàn)室自動(dòng)化、AI輔助臨床試驗(yàn)等領(lǐng)域研發(fā),鼓勵(lì)大模型在藥物發(fā)現(xiàn)、設(shè)計(jì)、合成和生產(chǎn)全過(guò)程應(yīng)用。

與此同時(shí),北京亦莊人工智能公共算力平臺(tái)3000PFlops規(guī)模的算力設(shè)備正式點(diǎn)亮并投入使用,這也是北京最大規(guī)模的高性能人工智能計(jì)算集群,可以幫助企業(yè)推動(dòng)開(kāi)展大模型訓(xùn)練,推廣行業(yè)應(yīng)用,進(jìn)一步夯實(shí)了北京大模型研發(fā)創(chuàng)新與行業(yè)應(yīng)用的算力底座。

注:文章來(lái)源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系刪除

為您找貨 · 告訴我們您想要找什么商品?我們將盡快給您答復(fù)。
* 商品名稱(chēng):
* 您想了解:
  • 商品資料
  • 貨期
  • 價(jià)格
  • 安調(diào)
  • 其他
* 手機(jī)號(hào)碼:
* 姓名: