摘 要:當(dāng)前互聯(lián)網(wǎng)技術(shù)飛速發(fā)展,針對網(wǎng)絡(luò)上存在的海量數(shù)據(jù)以及動態(tài)網(wǎng)站的出現(xiàn),文中提出了一種用戶自定規(guī)則的AJAX網(wǎng)頁信息采集功能,該功能能夠提取動態(tài)網(wǎng)站上的數(shù)據(jù),避免垃圾信息的干擾。與傳統(tǒng)信息提取系統(tǒng)相比,用戶可以自定規(guī)則,確定目標(biāo)網(wǎng)站,半自動化以及自定規(guī)則操作,使信息提取更加準(zhǔn)確和高效。