【6.18】“青年科技工作者園地”第118次活動_基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的高能物理數(shù)據(jù)熱度預(yù)測
講座內(nèi)容: 基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的高能物理數(shù)據(jù)熱度預(yù)測
主講人:程振京
時間:6月18日(周二)下午15:00
地點:計算中心二樓會議室
報告簡介:
高能物理計算是典型的數(shù)據(jù)密集型計算,每年需要分析PB級的海量物理數(shù)據(jù),對數(shù)據(jù)訪問性能有著越來越高的要求。構(gòu)建統(tǒng)一命名空間的分級存儲系統(tǒng)方案已經(jīng)被廣泛采用。一般根據(jù)訪問熱度不同將數(shù)據(jù)存儲于不同性能、不同價格的存儲設(shè)備上。當(dāng)數(shù)據(jù)熱度變化時,再將數(shù)據(jù)遷移至合適的存儲層級。目前數(shù)據(jù)熱度預(yù)測廣泛采用基于人工經(jīng)驗的啟發(fā)式算法,由于不同用戶計算模式的差異,預(yù)測準(zhǔn)確率較低。提出了一種借助LSTM深度學(xué)習(xí)算法,基于文件訪問特征預(yù)測未來訪問熱度的方法,作為分級存儲中數(shù)據(jù)遷移的依據(jù)。以高能物理實驗LHAASO的真實數(shù)據(jù)為例做了對比測試,結(jié)果表明,在相同測試條件下,與已有預(yù)測模型相比,該模型具有更高的預(yù)測精度和更強的適用性。
附件下載: