- 相關推薦
數(shu)據挖掘論文(wen)(wen)精(jing)選5篇論文(wen)(wen)
數據挖掘論文一:
題目(mu):數據挖掘(jue)技術(shu)在神經(jing)根型頸椎病方劑研究中的(de)優勢及應用進展(zhan)
關鍵詞(ci):數據挖掘技術; 神經(jing)根型頸椎病; 方劑; 綜述;
1 數據挖掘技術簡介
數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)挖(wa)(wa)(wa)(wa)掘(jue)技(ji)術(shu)(shu)[1] (Knowledge Discovery in Datebase, KKD) , 是(shi)一種(zhong)新興的(de)(de)(de)(de)(de)信息處(chu)理(li)技(ji)術(shu)(shu), 它融(rong)匯了人(ren)工(gong)(gong)智能、模式(shi)別、模糊數(shu)(shu)(shu)(shu)(shu)(shu)學(xue)、數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)庫(ku)、數(shu)(shu)(shu)(shu)(shu)(shu)理(li)統計等(deng)(deng)多種(zhong)技(ji)術(shu)(shu)方法, 專門用(yong)于(yu)(yu)海量(liang)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)的(de)(de)(de)(de)(de)處(chu)理(li), 從大(da)量(liang)的(de)(de)(de)(de)(de)、不(bu)(bu)完全(quan)的(de)(de)(de)(de)(de)、有(you)噪聲的(de)(de)(de)(de)(de)、模糊的(de)(de)(de)(de)(de)、隨(sui)機的(de)(de)(de)(de)(de)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)集中(zhong)(zhong)(zhong), 提(ti)取(qu)隱含在其(qi)中(zhong)(zhong)(zhong)的(de)(de)(de)(de)(de)、人(ren)們事先(xian)不(bu)(bu)知道(dao)的(de)(de)(de)(de)(de)、但又是(shi)潛(qian)在的(de)(de)(de)(de)(de)有(you)用(yong)的(de)(de)(de)(de)(de)信息和(he)知識, 其(qi)目(mu)的(de)(de)(de)(de)(de)是(shi)發現(xian)規(gui)律而不(bu)(bu)是(shi)驗(yan)證假設。數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)挖(wa)(wa)(wa)(wa)掘(jue)技(ji)術(shu)(shu)主(zhu)要(yao)適用(yong)于(yu)(yu)龐大(da)的(de)(de)(de)(de)(de)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)庫(ku)的(de)(de)(de)(de)(de)研(yan)究(jiu)(jiu), 其(qi)特(te)點在于(yu)(yu):基于(yu)(yu)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)分析(xi)方法角度的(de)(de)(de)(de)(de)分類(lei), 其(qi)本質屬于(yu)(yu)觀察性研(yan)究(jiu)(jiu), 數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)來源(yuan)于(yu)(yu)日常(chang)診療工(gong)(gong)作資料, 應用(yong)的(de)(de)(de)(de)(de)技(ji)術(shu)(shu)較傳統研(yan)究(jiu)(jiu)更(geng)先(xian)進, 分析(xi)工(gong)(gong)具、理(li)論模型與傳統研(yan)究(jiu)(jiu)區別較大(da)。其(qi)操(cao)作步(bu)驟(zou)包括(kuo)[2]:選擇數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju), 數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)處(chu)理(li), 挖(wa)(wa)(wa)(wa)掘(jue)分析(xi), 結(jie)果解(jie)釋, 其(qi)中(zhong)(zhong)(zhong)結(jie)果解(jie)釋是(shi)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)挖(wa)(wa)(wa)(wa)掘(jue)技(ji)術(shu)(shu)研(yan)究(jiu)(jiu)的(de)(de)(de)(de)(de)關鍵。其(qi)方法包括(kuo)分類(lei)、聚類(lei)、關聯、序(xu)列、決策(ce)樹、貝斯網絡、因子(zi)、辨別等(deng)(deng)分析(xi)[3], 其(qi)結(jie)果通(tong)常(chang)表(biao)示為概念、規(gui)則、規(gui)律、模式(shi)、約束、可視化(hua)等(deng)(deng)形式(shi)圖(tu)[4]。當今(jin)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)挖(wa)(wa)(wa)(wa)掘(jue)技(ji)術(shu)(shu)的(de)(de)(de)(de)(de)方向主(zhu)要(yao)在于(yu)(yu):特(te)定(ding)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)挖(wa)(wa)(wa)(wa)掘(jue), 高效挖(wa)(wa)(wa)(wa)掘(jue)算法, 提(ti)高結(jie)果的(de)(de)(de)(de)(de)有(you)效性、確定(ding)性和(he)表(biao)達性, 結(jie)果的(de)(de)(de)(de)(de)可視化(hua), 多抽象層上的(de)(de)(de)(de)(de)交互式(shi)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)挖(wa)(wa)(wa)(wa)掘(jue), 多元數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)挖(wa)(wa)(wa)(wa)掘(jue)及(ji)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)的(de)(de)(de)(de)(de)安全(quan)性和(he)保(bao)密性。因其(qi)優勢(shi)和(he)獨特(te)性被(bei)運(yun)用(yong)于(yu)(yu)多個領域中(zhong)(zhong)(zhong), 且結(jie)果運(yun)用(yong)后取(qu)得顯著(zhu)成效, 因此(ci)越(yue)來越(yue)多的(de)(de)(de)(de)(de)中(zhong)(zhong)(zhong)醫方劑研(yan)究(jiu)(jiu)者(zhe)將其(qi)運(yun)用(yong)于(yu)(yu)方劑中(zhong)(zhong)(zhong)藥(yao)物(wu)的(de)(de)(de)(de)(de)研(yan)究(jiu)(jiu)。
2 數據挖掘術在神經根型頸椎病治方研究中的優勢
中(zhong)(zhong)(zhong)(zhong)(zhong)醫(yi)對(dui)(dui)于神(shen)經(jing)根型頸(jing)椎病(bing)(bing)(bing)(bing)(bing)的(de)(de)(de)(de)(de)治(zhi)(zhi)(zhi)療(liao)(liao)準則為辨(bian)證(zheng)(zheng)論治(zhi)(zhi)(zhi), 從(cong)古(gu)至今(jin)神(shen)經(jing)根型頸(jing)椎病(bing)(bing)(bing)(bing)(bing)的(de)(de)(de)(de)(de)中(zhong)(zhong)(zhong)(zhong)(zhong)醫(yi)證(zheng)(zheng)型有(you)(you)很多(duo), 其治(zhi)(zhi)(zhi)方(fang)(fang)(fang)是(shi)(shi)集中(zhong)(zhong)(zhong)(zhong)(zhong)醫(yi)之(zhi)(zhi)理(li)、法、方(fang)(fang)(fang)、藥(yao)(yao)為一(yi)體的(de)(de)(de)(de)(de)數(shu)(shu)(shu)據(ju)(ju)(ju)集合, 具有(you)(you)以(yi)(yi)(yi)“方(fang)(fang)(fang)-藥(yao)(yao)-證(zheng)(zheng)”為核心的(de)(de)(de)(de)(de)多(duo)維(wei)結(jie)構。方(fang)(fang)(fang)劑配伍本(ben)質上表現(xian)為方(fang)(fang)(fang)與(yu)方(fang)(fang)(fang)、方(fang)(fang)(fang)與(yu)藥(yao)(yao)、藥(yao)(yao)與(yu)藥(yao)(yao)、藥(yao)(yao)與(yu)劑量(liang)(liang), 以(yi)(yi)(yi)及(ji)方(fang)(fang)(fang)藥(yao)(yao)與(yu)證(zheng)(zheng)、病(bing)(bing)(bing)(bing)(bing)、癥交叉錯綜的(de)(de)(de)(de)(de)關(guan)聯(lian)與(yu)對(dui)(dui)應[5], 而中(zhong)(zhong)(zhong)(zhong)(zhong)醫(yi)方(fang)(fang)(fang)劑講(jiang)究君臣佐使的(de)(de)(de)(de)(de)配伍, 藥(yao)(yao)物(wu)有(you)(you)升(sheng)降沉(chen)浮, 四氣五味及(ji)歸經(jing)之(zhi)(zhi)別, 對(dui)(dui)于神(shen)經(jing)根型頸(jing)椎病(bing)(bing)(bing)(bing)(bing)的(de)(de)(de)(de)(de)治(zhi)(zhi)(zhi)療(liao)(liao), 治(zhi)(zhi)(zhi)方(fang)(fang)(fang)中(zhong)(zhong)(zhong)(zhong)(zhong)藥(yao)(yao)物(wu)的(de)(de)(de)(de)(de)種類、炮制方(fang)(fang)(fang)法、用(yong)(yong)量(liang)(liang)、用(yong)(yong)法等都是(shi)(shi)千變萬化(hua)的(de)(de)(de)(de)(de), 而這(zhe)些(xie)海(hai)量(liang)(liang)、模(mo)糊(hu)、看似隨(sui)機的(de)(de)(de)(de)(de)藥(yao)(yao)物(wu)背(bei)后(hou)隱藏(zang)著(zhu)對(dui)(dui)臨床(chuang)有(you)(you)用(yong)(yong)的(de)(de)(de)(de)(de)信息(xi)和(he)(he)規(gui)(gui)(gui)律, 但這(zhe)些(xie)大(da)(da)數(shu)(shu)(shu)據(ju)(ju)(ju)是(shi)(shi)無法在可承(cheng)受(shou)的(de)(de)(de)(de)(de)時間范圍內(nei)(nei)可用(yong)(yong)常規(gui)(gui)(gui)軟(ruan)(ruan)件(jian)工(gong)具進(jin)行(xing)(xing)(xing)捕捉、管理(li)和(he)(he)處理(li)的(de)(de)(de)(de)(de), 是(shi)(shi)需要一(yi)個新處理(li)模(mo)式才能(neng)具有(you)(you)更(geng)強(qiang)的(de)(de)(de)(de)(de)決(jue)策力(li)、洞察力(li)和(he)(he)流程優(you)化(hua)能(neng)力(li), 而數(shu)(shu)(shu)據(ju)(ju)(ju)挖(wa)掘技術(shu)有(you)(you)可能(neng)從(cong)這(zhe)些(xie)海(hai)量(liang)(liang)的(de)(de)(de)(de)(de)的(de)(de)(de)(de)(de)數(shu)(shu)(shu)據(ju)(ju)(ju)中(zhong)(zhong)(zhong)(zhong)(zhong)發現(xian)新知(zhi)識, 揭示背(bei)后(hou)隱藏(zang)的(de)(de)(de)(de)(de)關(guan)系和(he)(he)規(gui)(gui)(gui)則, 并且對(dui)(dui)未(wei)知(zhi)的(de)(de)(de)(de)(de)情況進(jin)行(xing)(xing)(xing)預測[6]。再者, 中(zhong)(zhong)(zhong)(zhong)(zhong)醫(yi)辨(bian)治(zhi)(zhi)(zhi)充滿非線(xian)性(xing)思(si)維(wei), “方(fang)(fang)(fang)-藥(yao)(yao)-證(zheng)(zheng)”間的(de)(de)(de)(de)(de)多(duo)層關(guan)聯(lian)、序(xu)列組合、集群對(dui)(dui)應, 形成了(le)整體論的(de)(de)(de)(de)(de)思(si)維(wei)方(fang)(fang)(fang)式和(he)(he)原則, 而數(shu)(shu)(shu)據(ju)(ju)(ju)挖(wa)掘技術(shu)數(shu)(shu)(shu)據(ju)(ju)(ju)挖(wa)掘在技術(shu)線(xian)路上與(yu)傳統數(shu)(shu)(shu)據(ju)(ju)(ju)處理(li)方(fang)(fang)(fang)法不(bu)同在于其能(neng)對(dui)(dui)數(shu)(shu)(shu)據(ju)(ju)(ju)庫(ku)內(nei)(nei)的(de)(de)(de)(de)(de)數(shu)(shu)(shu)據(ju)(ju)(ju)以(yi)(yi)(yi)線(xian)性(xing)和(he)(he)非線(xian)性(xing)方(fang)(fang)(fang)式解析, 尤善處理(li)模(mo)糊(hu)的(de)(de)(de)(de)(de)、非量(liang)(liang)化(hua)的(de)(de)(de)(de)(de)數(shu)(shu)(shu)據(ju)(ju)(ju)。例如趙(zhao)睿曦等[7]在研(yan)(yan)究張(zhang)氏骨傷治(zhi)(zhi)(zhi)療(liao)(liao)腰(yao)椎間盤(pan)突(tu)(tu)出(chu)癥的(de)(de)(de)(de)(de)用(yong)(yong)藥(yao)(yao)規(gui)(gui)(gui)律時, 選取了(le)100張(zhang)治(zhi)(zhi)(zhi)方(fang)(fang)(fang), 因(yin)該病(bing)(bing)(bing)(bing)(bing)病(bing)(bing)(bing)(bing)(bing)因(yin)病(bing)(bing)(bing)(bing)(bing)機復雜, 證(zheng)(zheng)候不(bu)一(yi), 骨傷名師(shi)張(zhang)玉柱先生對(dui)(dui)該病(bing)(bing)(bing)(bing)(bing)的(de)(de)(de)(de)(de)治(zhi)(zhi)(zhi)則治(zhi)(zhi)(zhi)法、藥(yao)(yao)物(wu)使用(yong)(yong)是(shi)(shi)不(bu)同的(de)(de)(de)(de)(de)。因(yin)此(ci)(ci)他們利(li)用(yong)(yong)Excel建立(li)方(fang)(fang)(fang)證(zheng)(zheng)數(shu)(shu)(shu)據(ju)(ju)(ju)庫(ku), 采用(yong)(yong)SPPS Clementine12.0軟(ruan)(ruan)件(jian)對(dui)(dui)這(zhe)些(xie)數(shu)(shu)(shu)據(ju)(ju)(ju)的(de)(de)(de)(de)(de)用(yong)(yong)藥(yao)(yao)頻次、藥(yao)(yao)物(wu)關(guan)聯(lian)規(gui)(gui)(gui)則及(ji)藥(yao)(yao)物(wu)聚(ju)類進(jin)行(xing)(xing)(xing)分析, 最后(hou)總結(jie)出(chu)張(zhang)氏骨傷治(zhi)(zhi)(zhi)療(liao)(liao)腰(yao)椎間盤(pan)突(tu)(tu)出(chu)癥遵循病(bing)(bing)(bing)(bing)(bing)從(cong)肝治(zhi)(zhi)(zhi)、病(bing)(bing)(bing)(bing)(bing)從(cong)血治(zhi)(zhi)(zhi)、標(biao)本(ben)兼治(zhi)(zhi)(zhi)的(de)(de)(de)(de)(de)原則, 也(ye)歸納出(chu)治(zhi)(zhi)(zhi)療(liao)(liao)三種不(bu)同證(zheng)(zheng)型的(de)(de)(de)(de)(de)腰(yao)突(tu)(tu)癥的(de)(de)(de)(de)(de)三類自擬方(fang)(fang)(fang)。由此(ci)(ci)看出(chu)數(shu)(shu)(shu)據(ju)(ju)(ju)挖(wa)掘技術(shu)在方(fang)(fang)(fang)劑研(yan)(yan)究中(zhong)(zhong)(zhong)(zhong)(zhong)的(de)(de)(de)(de)(de)應用(yong)(yong)對(dui)(dui)數(shu)(shu)(shu)據(ju)(ju)(ju)背(bei)后(hou)信息(xi)、規(gui)(gui)(gui)律等的(de)(de)(de)(de)(de)挖(wa)掘及(ji)名家經(jing)驗的(de)(de)(de)(de)(de)推廣具有(you)(you)重(zhong)大(da)(da)意義, 因(yin)此(ci)(ci)數(shu)(shu)(shu)據(ju)(ju)(ju)挖(wa)掘技術(shu)在神(shen)經(jing)根型頸(jing)椎病(bing)(bing)(bing)(bing)(bing)的(de)(de)(de)(de)(de)治(zhi)(zhi)(zhi)方(fang)(fang)(fang)研(yan)(yan)究中(zhong)(zhong)(zhong)(zhong)(zhong)也(ye)同樣發揮著(zhu)巨大(da)(da)的(de)(de)(de)(de)(de)作(zuo)用(yong)(yong)。
3 數據挖掘技術在神經根型頸椎治方中的應用進展
神(shen)(shen)經(jing)(jing)(jing)(jing)根(gen)(gen)(gen)型(xing)頸(jing)(jing)椎(zhui)(zhui)病(bing)(bing)在所有(you)(you)(you)頸(jing)(jing)椎(zhui)(zhui)病(bing)(bing)中(zhong)(zhong)(zhong)(zhong)最(zui)常見(jian), 約(yue)占(zhan)50%~60%[8], 醫(yi)家對(dui)其(qi)治(zhi)(zhi)(zhi)方(fang)(fang)(fang)(fang)(fang)(fang)(fang)的(de)(de)(de)(de)(de)(de)(de)(de)研(yan)(yan)究也(ye)(ye)是(shi)不計其(qi)數(shu)(shu)(shu)。近年來(lai)數(shu)(shu)(shu)據挖(wa)掘(jue)技術也(ye)(ye)被(bei)運用(yong)(yong)于(yu)其(qi)治(zhi)(zhi)(zhi)方(fang)(fang)(fang)(fang)(fang)(fang)(fang)研(yan)(yan)究中(zhong)(zhong)(zhong)(zhong), 筆者通過萬方(fang)(fang)(fang)(fang)(fang)(fang)(fang)、中(zhong)(zhong)(zhong)(zhong)國知(zhi)網等(deng)總共(gong)(gong)檢(jian)(jian)索出(chu)(chu)(chu)以(yi)(yi)下幾篇文獻(xian), 雖數(shu)(shu)(shu)量不多但其(qi)優勢明顯。劉向前等(deng)[9]在挖(wa)掘(jue)古(gu)方(fang)(fang)(fang)(fang)(fang)(fang)(fang)治(zhi)(zhi)(zhi)療(liao)神(shen)(shen)經(jing)(jing)(jing)(jing)根(gen)(gen)(gen)型(xing)頸(jing)(jing)椎(zhui)(zhui)病(bing)(bing)的(de)(de)(de)(de)(de)(de)(de)(de)用(yong)(yong)藥(yao)(yao)(yao)(yao)(yao)規(gui)律時(shi), 通過檢(jian)(jian)索《中(zhong)(zhong)(zhong)(zhong)華醫(yi)典》并從(cong)中(zhong)(zhong)(zhong)(zhong)篩(shai)選以(yi)(yi)治(zhi)(zhi)(zhi)療(liao)頸(jing)(jing)項肩臂痛為(wei)(wei)主(zhu)(zhu)(zhu)的(de)(de)(de)(de)(de)(de)(de)(de)古(gu)方(fang)(fang)(fang)(fang)(fang)(fang)(fang)219首并建立(li)數(shu)(shu)(shu)據庫(ku), 對(dui)不同(tong)證(zheng)(zheng)治(zhi)(zhi)(zhi)古(gu)方(fang)(fang)(fang)(fang)(fang)(fang)(fang)的(de)(de)(de)(de)(de)(de)(de)(de)用(yong)(yong)藥(yao)(yao)(yao)(yao)(yao)類別(bie)、總味(wei)(wei)數(shu)(shu)(shu)、單味(wei)(wei)藥(yao)(yao)(yao)(yao)(yao)使用(yong)(yong)頻(pin)(pin)(pin)(pin)數(shu)(shu)(shu)及(ji)藥(yao)(yao)(yao)(yao)(yao)對(dui) (組(zu)) 出(chu)(chu)(chu)現頻(pin)(pin)(pin)(pin)數(shu)(shu)(shu)進(jin)行(xing)統(tong)計, 總結(jie)出(chu)(chu)(chu)風(feng)(feng)(feng)寒(han)濕(shi)(shi)痹(bi)證(zheng)(zheng)、痰濕(shi)(shi)阻痹(bi)證(zheng)(zheng)、寒(han)濕(shi)(shi)阻滯證(zheng)(zheng)、正虛不足證(zheng)(zheng)的(de)(de)(de)(de)(de)(de)(de)(de)用(yong)(yong)藥(yao)(yao)(yao)(yao)(yao)特點, 得出(chu)(chu)(chu)解(jie)表藥(yao)(yao)(yao)(yao)(yao)、祛風(feng)(feng)(feng)濕(shi)(shi)藥(yao)(yao)(yao)(yao)(yao)、活(huo)血(xue)化(hua)瘀(yu)藥(yao)(yao)(yao)(yao)(yao)、補虛藥(yao)(yao)(yao)(yao)(yao)是(shi)治(zhi)(zhi)(zhi)療(liao)頸(jing)(jing)項肩臂痛古(gu)方(fang)(fang)(fang)(fang)(fang)(fang)(fang)組(zu)成(cheng)的(de)(de)(de)(de)(de)(de)(de)(de)主(zhu)(zhu)(zhu)要藥(yao)(yao)(yao)(yao)(yao)物(wu)(wu)(wu)(wu)。古(gu)為(wei)(wei)今用(yong)(yong), 該(gai)研(yan)(yan)究對(dui)于(yu)現代(dai)醫(yi)家在治(zhi)(zhi)(zhi)療(liao)該(gai)病(bing)(bing)中(zhong)(zhong)(zhong)(zhong)有(you)(you)(you)很好(hao)的(de)(de)(de)(de)(de)(de)(de)(de)借鑒(jian)和(he)參(can)考意義。齊兵獻(xian)等(deng)[10]檢(jian)(jian)索CNKI (1980-2009年) 相(xiang)關(guan)(guan)文獻(xian)中(zhong)(zhong)(zhong)(zhong)治(zhi)(zhi)(zhi)療(liao)神(shen)(shen)經(jing)(jing)(jing)(jing)根(gen)(gen)(gen)型(xing)頸(jing)(jing)椎(zhui)(zhui)病(bing)(bing)的(de)(de)(de)(de)(de)(de)(de)(de)方(fang)(fang)(fang)(fang)(fang)(fang)(fang)劑建立(li)數(shu)(shu)(shu)據庫(ku), 采用(yong)(yong)SPSS11.5統(tong)計軟件(jian)這些治(zhi)(zhi)(zhi)方(fang)(fang)(fang)(fang)(fang)(fang)(fang)常用(yong)(yong)藥(yao)(yao)(yao)(yao)(yao)物(wu)(wu)(wu)(wu)使用(yong)(yong)頻(pin)(pin)(pin)(pin)次(ci)頻(pin)(pin)(pin)(pin)率(lv)、性味(wei)(wei)頻(pin)(pin)(pin)(pin)率(lv)、歸(gui)經(jing)(jing)(jing)(jing)頻(pin)(pin)(pin)(pin)率(lv)分(fen)析(xi)(xi)比較, 治(zhi)(zhi)(zhi)療(liao)神(shen)(shen)經(jing)(jing)(jing)(jing)根(gen)(gen)(gen)型(xing)頸(jing)(jing)椎(zhui)(zhui)病(bing)(bing)的(de)(de)(de)(de)(de)(de)(de)(de)中(zhong)(zhong)(zhong)(zhong)藥(yao)(yao)(yao)(yao)(yao)共(gong)(gong)計99味(wei)(wei), 使用(yong)(yong)頻(pin)(pin)(pin)(pin)次(ci)479味(wei)(wei)次(ci);所用(yong)(yong)藥(yao)(yao)(yao)(yao)(yao)物(wu)(wu)(wu)(wu)種(zhong)類依次(ci)以(yi)(yi)補益(yi)藥(yao)(yao)(yao)(yao)(yao)、活(huo)血(xue)化(hua)瘀(yu)藥(yao)(yao)(yao)(yao)(yao)、祛風(feng)(feng)(feng)濕(shi)(shi)藥(yao)(yao)(yao)(yao)(yao)運用(yong)(yong)最(zui)多, 其(qi)中(zhong)(zhong)(zhong)(zhong)藥(yao)(yao)(yao)(yao)(yao)味(wei)(wei)以(yi)(yi)辛、苦為(wei)(wei)主(zhu)(zhu)(zhu), 藥(yao)(yao)(yao)(yao)(yao)性以(yi)(yi)溫、寒(han)為(wei)(wei)主(zhu)(zhu)(zhu), 歸(gui)經(jing)(jing)(jing)(jing)以(yi)(yi)肝(gan)、脾(pi)、心(xin)為(wei)(wei)主(zhu)(zhu)(zhu), 而本病(bing)(bing)以(yi)(yi)肝(gan)腎虧虛, 氣(qi)(qi)(qi)血(xue)瘀(yu)滯為(wei)(wei)主(zhu)(zhu)(zhu), 臨床以(yi)(yi)補益(yi)藥(yao)(yao)(yao)(yao)(yao)、活(huo)血(xue)化(hua)瘀(yu)藥(yao)(yao)(yao)(yao)(yao)、祛風(feng)(feng)(feng)濕(shi)(shi)藥(yao)(yao)(yao)(yao)(yao)等(deng)中(zhong)(zhong)(zhong)(zhong)藥(yao)(yao)(yao)(yao)(yao)運用(yong)(yong)最(zui)多。這對(dui)于(yu)醫(yi)家治(zhi)(zhi)(zhi)療(liao)該(gai)病(bing)(bing)選用(yong)(yong)藥(yao)(yao)(yao)(yao)(yao)物(wu)(wu)(wu)(wu)的(de)(de)(de)(de)(de)(de)(de)(de)性味(wei)(wei)、歸(gui)經(jing)(jing)(jing)(jing)等(deng)具有(you)(you)(you)指導(dao)(dao)意義。陳元川等(deng)[11]檢(jian)(jian)索2004年1月至2013年3月發表的(de)(de)(de)(de)(de)(de)(de)(de)以(yi)(yi)單純口服中(zhong)(zhong)(zhong)(zhong)藥(yao)(yao)(yao)(yao)(yao)治(zhi)(zhi)(zhi)療(liao)神(shen)(shen)經(jing)(jing)(jing)(jing)根(gen)(gen)(gen)型(xing)頸(jing)(jing)椎(zhui)(zhui)病(bing)(bing)的(de)(de)(de)(de)(de)(de)(de)(de)有(you)(you)(you)關(guan)(guan)文獻(xian), 對(dui)其(qi)中(zhong)(zhong)(zhong)(zhong)的(de)(de)(de)(de)(de)(de)(de)(de)方(fang)(fang)(fang)(fang)(fang)(fang)(fang)劑和(he)藥(yao)(yao)(yao)(yao)(yao)物(wu)(wu)(wu)(wu)進(jin)行(xing)統(tong)計、歸(gui)類、分(fen)析(xi)(xi), 最(zui)終納入32首方(fang)(fang)(fang)(fang)(fang)(fang)(fang)劑, 涉及(ji)111味(wei)(wei)中(zhong)(zhong)(zhong)(zhong)藥(yao)(yao)(yao)(yao)(yao), 補氣(qi)(qi)(qi)藥(yao)(yao)(yao)(yao)(yao)、發散風(feng)(feng)(feng)寒(han)藥(yao)(yao)(yao)(yao)(yao)、活(huo)血(xue)止痛藥(yao)(yao)(yao)(yao)(yao)、補血(xue)藥(yao)(yao)(yao)(yao)(yao)等(deng)使用(yong)(yong)頻(pin)(pin)(pin)(pin)次(ci)較高(gao)(gao)(gao);葛(ge)根(gen)(gen)(gen)、白芍、黃芪、當歸(gui)、桂(gui)枝(zhi)等(deng)藥(yao)(yao)(yao)(yao)(yao)物(wu)(wu)(wu)(wu)使用(yong)(yong)頻(pin)(pin)(pin)(pin)次(ci)較高(gao)(gao)(gao), 證(zheng)(zheng)實與(yu)古(gu)方(fang)(fang)(fang)(fang)(fang)(fang)(fang)桂(gui)枝(zhi)加葛(ge)根(gen)(gen)(gen)湯主(zhu)(zhu)(zhu)藥(yao)(yao)(yao)(yao)(yao)相(xiang)同(tong), 且該(gai)方(fang)(fang)(fang)(fang)(fang)(fang)(fang)扶(fu)陽解(jie)表的(de)(de)(de)(de)(de)(de)(de)(de)治(zhi)(zhi)(zhi)法(fa)(fa)(fa)與(yu)該(gai)研(yan)(yan)究得出(chu)(chu)(chu)的(de)(de)(de)(de)(de)(de)(de)(de)扶(fu)正祛邪(xie)的(de)(de)(de)(de)(de)(de)(de)(de)結(jie)果相(xiang)吻合(he), 同(tong)時(shi)也(ye)(ye)證(zheng)(zheng)實石氏傷(shang)科(ke)強(qiang)調治(zhi)(zhi)(zhi)傷(shang)科(ke)病(bing)(bing)當“以(yi)(yi)氣(qi)(qi)(qi)為(wei)(wei)主(zhu)(zhu)(zhu), 以(yi)(yi)血(xue)為(wei)(wei)先”等(deng)正確性。所以(yi)(yi)大數(shu)(shu)(shu)據背(bei)后的(de)(de)(de)(de)(de)(de)(de)(de)規(gui)律和(he)關(guan)(guan)系(xi)在很多方(fang)(fang)(fang)(fang)(fang)(fang)(fang)面(mian)古(gu)今是(shi)一致的(de)(de)(de)(de)(de)(de)(de)(de), 同(tong)時(shi)數(shu)(shu)(shu)據依據的(de)(de)(de)(de)(de)(de)(de)(de)支(zhi)持也(ye)(ye)為(wei)(wei)現代(dai)神(shen)(shen)經(jing)(jing)(jing)(jing)根(gen)(gen)(gen)型(xing)頸(jing)(jing)椎(zhui)(zhui)病(bing)(bing)治(zhi)(zhi)(zhi)療(liao)提供有(you)(you)(you)力的(de)(de)(de)(de)(de)(de)(de)(de)保障(zhang)。謝輝等(deng)[12]收(shou)集2009至2014年10月3日的(de)(de)(de)(de)(de)(de)(de)(de)166張治(zhi)(zhi)(zhi)療(liao)神(shen)(shen)經(jing)(jing)(jing)(jing)根(gen)(gen)(gen)型(xing)頸(jing)(jing)椎(zhui)(zhui)病(bing)(bing)的(de)(de)(de)(de)(de)(de)(de)(de)治(zhi)(zhi)(zhi)方(fang)(fang)(fang)(fang)(fang)(fang)(fang)建立(li)數(shu)(shu)(shu)據庫(ku), 采用(yong)(yong)關(guan)(guan)聯(lian)(lian)規(gui)則(ze)算法(fa)(fa)(fa)、復雜系(xi)統(tong)熵(shang)聚類等(deng)無(wu)監(jian)督數(shu)(shu)(shu)據挖(wa)掘(jue)方(fang)(fang)(fang)(fang)(fang)(fang)(fang)法(fa)(fa)(fa), 利用(yong)(yong)中(zhong)(zhong)(zhong)(zhong)醫(yi)傳(chuan)承輔助平臺 (TCMISS) 軟件(jian)分(fen)析(xi)(xi)處(chu)方(fang)(fang)(fang)(fang)(fang)(fang)(fang)中(zhong)(zhong)(zhong)(zhong)各種(zhong)藥(yao)(yao)(yao)(yao)(yao)物(wu)(wu)(wu)(wu)的(de)(de)(de)(de)(de)(de)(de)(de)使用(yong)(yong)頻(pin)(pin)(pin)(pin)次(ci)、藥(yao)(yao)(yao)(yao)(yao)物(wu)(wu)(wu)(wu)之間的(de)(de)(de)(de)(de)(de)(de)(de)關(guan)(guan)聯(lian)(lian)規(gui)則(ze)、核心(xin)藥(yao)(yao)(yao)(yao)(yao)物(wu)(wu)(wu)(wu)組(zu)合(he)和(he)新(xin)處(chu)方(fang)(fang)(fang)(fang)(fang)(fang)(fang), 從(cong)中(zhong)(zhong)(zhong)(zhong)挖(wa)掘(jue)出(chu)(chu)(chu)治(zhi)(zhi)(zhi)療(liao)該(gai)病(bing)(bing)中(zhong)(zhong)(zhong)(zhong)醫(yi)中(zhong)(zhong)(zhong)(zhong)的(de)(de)(de)(de)(de)(de)(de)(de)常用(yong)(yong)藥(yao)(yao)(yao)(yao)(yao)物(wu)(wu)(wu)(wu)、藥(yao)(yao)(yao)(yao)(yao)對(dui), 闡(chan)明了治(zhi)(zhi)(zhi)療(liao)該(gai)病(bing)(bing)以(yi)(yi)解(jie)肌散寒(han)藥(yao)(yao)(yao)(yao)(yao)、補氣(qi)(qi)(qi)活(huo)血(xue)藥(yao)(yao)(yao)(yao)(yao)、祛風(feng)(feng)(feng)勝濕(shi)(shi)藥(yao)(yao)(yao)(yao)(yao)和(he)溫經(jing)(jing)(jing)(jing)通絡(luo)藥(yao)(yao)(yao)(yao)(yao)為(wei)(wei)主(zhu)(zhu)(zhu), 治(zhi)(zhi)(zhi)法(fa)(fa)(fa)主(zhu)(zhu)(zhu)要包(bao)括(kuo)解(jie)肌舒筋、益(yi)氣(qi)(qi)(qi)活(huo)血(xue)和(he)補益(yi)肝(gan)腎, 這一方(fang)(fang)(fang)(fang)(fang)(fang)(fang)面(mian)很清晰明了地(di)展示了藥(yao)(yao)(yao)(yao)(yao)物(wu)(wu)(wu)(wu)使用(yong)(yong)頻(pin)(pin)(pin)(pin)率(lv)、藥(yao)(yao)(yao)(yao)(yao)物(wu)(wu)(wu)(wu)之間的(de)(de)(de)(de)(de)(de)(de)(de)聯(lian)(lian)系(xi), 證(zheng)(zheng)實其(qi)與(yu)很多古(gu)代(dai)經(jing)(jing)(jing)(jing)典中(zhong)(zhong)(zhong)(zhong)治(zhi)(zhi)(zhi)療(liao)神(shen)(shen)經(jing)(jing)(jing)(jing)根(gen)(gen)(gen)型(xing)頸(jing)(jing)椎(zhui)(zhui)病(bing)(bing)的(de)(de)(de)(de)(de)(de)(de)(de)治(zhi)(zhi)(zhi)則(ze)、治(zhi)(zhi)(zhi)法(fa)(fa)(fa)及(ji)用(yong)(yong)藥(yao)(yao)(yao)(yao)(yao)規(gui)律是(shi)吻合(he)的(de)(de)(de)(de)(de)(de)(de)(de), 是(shi)臨床用(yong)(yong)藥(yao)(yao)(yao)(yao)(yao)的(de)(de)(de)(de)(de)(de)(de)(de)積累和(he)升華, 可(ke)有(you)(you)(you)效地(di)指導(dao)(dao)臨床并提高(gao)(gao)(gao)療(liao)效;另(ling)一方(fang)(fang)(fang)(fang)(fang)(fang)(fang)面(mian)也(ye)(ye)為(wei)(wei)中(zhong)(zhong)(zhong)(zhong)藥(yao)(yao)(yao)(yao)(yao)新(xin)藥(yao)(yao)(yao)(yao)(yao)的(de)(de)(de)(de)(de)(de)(de)(de)創(chuang)制提供處(chu)方(fang)(fang)(fang)(fang)(fang)(fang)(fang)來(lai)源, 指導(dao)(dao)新(xin)藥(yao)(yao)(yao)(yao)(yao)研(yan)(yan)發[13]。
4 小結
數(shu)據(ju)挖掘技(ji)術(shu)(shu)(shu)作為一種新(xin)型的(de)(de)(de)(de)研(yan)(yan)究(jiu)(jiu)技(ji)術(shu)(shu)(shu), 在(zai)神(shen)經(jing)根型頸(jing)椎病的(de)(de)(de)(de)治(zhi)方(fang)(fang)研(yan)(yan)究(jiu)(jiu)中(zhong)(zhong)的(de)(de)(de)(de)運用(yong)(yong)相對(dui)于其(qi)(qi)他領域是(shi)偏少的(de)(de)(de)(de), 并且基(ji)本上是(shi)研(yan)(yan)究(jiu)(jiu)文(wen)獻資(zi)料上出現(xian)(xian)的(de)(de)(de)(de)治(zhi)方(fang)(fang), 在(zai)對(dui)名(ming)老(lao)中(zhong)(zhong)醫(yi)個人治(zhi)療經(jing)驗及用(yong)(yong)藥規律的(de)(de)(de)(de)總結是(shi)缺乏(fa)的(de)(de)(de)(de), 因此研(yan)(yan)究(jiu)(jiu)范圍廣而缺乏(fa)針(zhen)對(dui)性, 同時使用(yong)(yong)該(gai)(gai)技(ji)術(shu)(shu)(shu)的(de)(de)(de)(de)相關軟(ruan)件種類(lei)往往是(shi)單一的(de)(de)(de)(de)。現(xian)(xian)在(zai)研(yan)(yan)究(jiu)(jiu)者(zhe)在(zai)研(yan)(yan)究(jiu)(jiu)中(zhong)(zhong)醫(yi)方(fang)(fang)劑時往往采用(yong)(yong)傳統的(de)(de)(de)(de)研(yan)(yan)究(jiu)(jiu)方(fang)(fang)法, 這(zhe)就導(dao)致(zhi)在(zai)大(da)(da)數(shu)據(ju)的(de)(de)(de)(de)研(yan)(yan)究(jiu)(jiu)中(zhong)(zhong)耗時、耗力甚則無能為力, 同樣也難以(yi)精準(zhun)地提取大(da)(da)數(shu)據(ju)背后的(de)(de)(de)(de)隱藏的(de)(de)(de)(de)潛在(zai)關系和規則及缺乏(fa)對(dui)未(wei)(wei)知情(qing)況的(de)(de)(de)(de)預(yu)測。產(chan)(chan)生這(zhe)樣的(de)(de)(de)(de)現(xian)(xian)狀, 一方(fang)(fang)面是(shi)很(hen)多研(yan)(yan)究(jiu)(jiu)者(zhe)尚(shang)未(wei)(wei)清楚該(gai)(gai)技(ji)術(shu)(shu)(shu)在(zai)方(fang)(fang)劑研(yan)(yan)究(jiu)(jiu)中(zhong)(zhong)的(de)(de)(de)(de)優勢所(suo)在(zai), 思(si)維模式尚(shang)未(wei)(wei)更(geng)新(xin);另一方(fang)(fang)面是(shi)很(hen)多研(yan)(yan)究(jiu)(jiu)者(zhe)尚(shang)未(wei)(wei)清楚該(gai)(gai)技(ji)術(shu)(shu)(shu)的(de)(de)(de)(de)操作技(ji)能及軟(ruan)件種類(lei)及其(qi)(qi)應用(yong)(yong)范圍。故(gu)以(yi)后應向更(geng)多研(yan)(yan)究(jiu)(jiu)者(zhe)普(pu)及該(gai)(gai)技(ji)術(shu)(shu)(shu)的(de)(de)(de)(de)軟(ruan)件種類(lei)、其(qi)(qi)中(zhong)(zhong)的(de)(de)(de)(de)優勢及操作技(ji)能, 讓該(gai)(gai)技(ji)術(shu)(shu)(shu)在(zai)臨床中(zhong)(zhong)使用(yong)(yong)更(geng)廣, 產(chan)(chan)生更(geng)大(da)(da)的(de)(de)(de)(de)效益(yi)。
參考文獻
[1]舒正渝.淺(qian)談數(shu)據挖掘(jue)技術及應用[J].中國西部科技, 2010, 9 (5) :38-39.
[2]曹毅, 季聰華.臨床科(ke)研設計與(yu)分析(xi)[M].杭州(zhou):浙江科(ke)學技術出版社, 2015:189.
[3]王靜, 崔蒙.數據挖(wa)掘技術在(zai)中(zhong)醫(yi)方劑(ji)學研究中(zhong)的應用(yong)[J].中(zhong)國中(zhong)醫(yi)藥信息(xi)雜志, 2008, 15 (3) :103-104.
[4]陳丈偉.數據倉(cang)庫與(yu)數據挖掘(jue)[M].北京:清華大(da)學出版社, 2006:5.
[5]楊玉(yu)珠(zhu).數據挖掘技(ji)術綜述與應用[J].河南科技(ji), 2014, 10 (19) :21.
[6]余侃(kan)侃(kan).數據挖掘技(ji)術(shu)在方(fang)(fang)劑配伍(wu)中的研(yan)(yan)究(jiu)現(xian)狀及研(yan)(yan)究(jiu)方(fang)(fang)法[J].中國醫藥(yao)指(zhi)南, 2008, 6 (24) :310-312.
[7]趙睿曦.方證(zheng)數(shu)據(ju)挖掘分析(xi)張氏骨(gu)傷對(dui)腰椎間盤(pan)突(tu)出癥(zheng)的(de)辨(bian)證(zheng)用藥(yao)規(gui)律[J].陜西中醫藥(yao)大學(xue)學(xue)報(bao), 2016, 39 (6) :44-46.
[8]李曙明(ming), 尹戰(zhan)海, 王瑩.神經根型頸(jing)椎(zhui)病的影(ying)像學特點和分型[J].中國矯形外科雜志(zhi), 2013, 21 (1) :7-11.
[9]劉向(xiang)前, 陳民, 黃廣平等.頸項肩臂(bei)痛內治古方常用藥物(wu)的統計分(fen)析[J].中華(hua)中醫藥學刊, 2012, 30 (9) :42-44.
[10]齊兵獻(xian), 樊(fan)成虎, 李兆和.神經根(gen)型(xing)頸(jing)椎病中醫用藥(yao)規律的文獻(xian)研(yan)究[J].河南中醫, 2012, 32 (4) :518-519.
[11]陳(chen)元川, 王翔, 龐堅, 等.單純口服(fu)中(zhong)藥治療(liao)神經根(gen)型頸椎(zhui)病(bing)用藥分析[J].上海中(zhong)醫藥雜(za)志, 2014, 48 (6) :78-80.
[12]謝輝, 劉軍, 潘建(jian)科(ke), 等.基于(yu)數據(ju)挖掘方法的神(shen)經(jing)根型頸椎病用藥(yao)規律研究(jiu)[J].世界中西醫結(jie)合雜志, 2015, 10 (6) :849-852.
[13]唐仕歡, 楊洪(hong)軍.中醫組方用藥規(gui)律研究進展述評[J].中國(guo)實驗(yan)方劑學(xue)雜志, 2013 (5) :359-363.
數據挖掘論文二:
題目:大數據挖掘在智游應用中的探究
摘要:大(da)(da)數據(ju)和智(zhi)游(you)(you)都是當下的(de)熱點, 沒有大(da)(da)數據(ju)的(de)智(zhi)游(you)(you)無(wu)從談“智(zhi)慧(hui)”, 數據(ju)挖掘(jue)是大(da)(da)數據(ju)應(ying)(ying)用(yong)于智(zhi)游(you)(you)的(de)核(he)心, 文(wen)章(zhang)探究了在智(zhi)游(you)(you)應(ying)(ying)用(yong)中, 目前大(da)(da)數據(ju)挖掘(jue)存在的(de)幾(ji)個問題(ti)。
關鍵詞:大數據; 智游; 數據挖掘;
1引言
隨著人(ren)民(min)生(sheng)活水(shui)平的進(jin)一步提高(gao), 旅游(you)(you)消費的需(xu)求進(jin)一步上升, 在云計算、互聯網(wang)、物聯網(wang)以及移動智能終端等信息(xi)通訊技術的飛速發展下, 智游(you)(you)應運而生(sheng)。大數據作為(wei)當下的熱點已經成(cheng)了智游(you)(you)發展的有(you)力支撐(cheng), 沒(mei)有(you)大數據提供(gong)的有(you)利(li)信息(xi), 智游(you)(you)無法變(bian)得“智慧(hui)”。
2大數據與智游
旅游(you)(you)(you)(you)業(ye)是信(xin)(xin)息(xi)(xi)密、綜合性強(qiang)、信(xin)(xin)息(xi)(xi)依存度(du)高(gao)的(de)(de)(de)(de)產(chan)業(ye)[1], 這讓其與(yu)大(da)數據(ju)(ju)自然產(chan)生了交匯。2010年, 江蘇省鎮江市首先提出“智(zhi)游(you)(you)(you)(you)”的(de)(de)(de)(de)概念(nian), 雖然至今國內外對于智(zhi)游(you)(you)(you)(you)還沒有(you)(you)一個統一的(de)(de)(de)(de)學(xue)術定(ding)義(yi), 但在(zai)與(yu)大(da)數據(ju)(ju)相關(guan)的(de)(de)(de)(de)描述(shu)中, 有(you)(you)學(xue)者從(cong)大(da)數據(ju)(ju)挖(wa)掘(jue)在(zai)智(zhi)游(you)(you)(you)(you)中的(de)(de)(de)(de)作用(yong)出發(fa), 把智(zhi)游(you)(you)(you)(you)描述(shu)為(wei)(wei):通過充分收集和管理所有(you)(you)類型和來源的(de)(de)(de)(de)旅游(you)(you)(you)(you)數據(ju)(ju), 并(bing)深入(ru)挖(wa)掘(jue)這些數據(ju)(ju)的(de)(de)(de)(de)潛在(zai)重(zhong)(zhong)要價值信(xin)(xin)息(xi)(xi), 然后利(li)用(yong)這些信(xin)(xin)息(xi)(xi)為(wei)(wei)相關(guan)部門或對象提供服務[2]。這一定(ding)義(yi)充分肯定(ding)了在(zai)發(fa)展智(zhi)游(you)(you)(you)(you)中, 大(da)數據(ju)(ju)挖(wa)掘(jue)所起(qi)的(de)(de)(de)(de)至關(guan)重(zhong)(zhong)要的(de)(de)(de)(de)作用(yong), 指出了在(zai)智(zhi)游(you)(you)(you)(you)的(de)(de)(de)(de)過程中, 數據(ju)(ju)的(de)(de)(de)(de)收集、儲存、管理都是為(wei)(wei)數據(ju)(ju)挖(wa)掘(jue)服務, 智(zhi)游(you)(you)(you)(you)最終所需要的(de)(de)(de)(de)是利(li)用(yong)挖(wa)掘(jue)所得的(de)(de)(de)(de)有(you)(you)用(yong)信(xin)(xin)息(xi)(xi)。
3大數據挖掘在智游中存在的問題
2011年, 我國(guo)提出(chu)用十年時(shi)間基本實現智(zhi)游(you)(you)的(de)目(mu)標[3], 過去幾年, 國(guo)家旅游(you)(you)局的(de)相(xiang)關動作均(jun)為了實現這一(yi)目(mu)標。但是, 在借助大數(shu)據(ju)推動智(zhi)游(you)(you)的(de)可(ke)持續性發(fa)(fa)展中, 大數(shu)據(ju)所(suo)產生(sheng)的(de)價(jia)值卻亟待提高, 原因(yin)之一(yi)就是在收集、儲(chu)存了大量數(shu)據(ju)后, 對它們深(shen)入挖掘(jue)不(bu)夠, 沒有發(fa)(fa)掘(jue)出(chu)數(shu)據(ju)更多的(de)價(jia)值。
3.1 信息化建設
智游的(de)發展離不(bu)開移動(dong)網絡、物聯網、云平(ping)(ping)(ping)臺(tai)。隨著大(da)數(shu)(shu)(shu)(shu)據的(de)不(bu)斷發展, 國內(nei)許多景(jing)區已經實(shi)現Wi-Fi覆蓋, 部分景(jing)區也已實(shi)現人與人、人與物、人與景(jing)點(dian)之(zhi)間的(de)實(shi)時互動(dong), 多省(sheng)市已建有旅游產(chan)業監(jian)測平(ping)(ping)(ping)臺(tai)或(huo)旅游大(da)數(shu)(shu)(shu)(shu)據中心以(yi)及數(shu)(shu)(shu)(shu)據可(ke)(ke)視化平(ping)(ping)(ping)臺(tai), 從中進行數(shu)(shu)(shu)(shu)據統計、行為分析、監(jian)控預警、服(fu)務質量(liang)監(jian)督(du)等(deng)。通過這些平(ping)(ping)(ping)臺(tai), 已基本能(neng)掌握(wo)跟游客和景(jing)點(dian)相關的(de)數(shu)(shu)(shu)(shu)據, 可(ke)(ke)以(yi)實(shi)現更好(hao)旅游監(jian)控、產(chan)業宏觀監(jian)控, 對該地的(de)旅游管理和推廣都能(neng)發揮重要作用。
但從智慧化的(de)發展來(lai)看(kan), 我國的(de)信(xin)息(xi)化建設還需加強(qiang)。雖然通(tong)訊網(wang)絡已基本能保證, 但是(shi)大部(bu)分景區還無法(fa)實(shi)現對景區全面、透徹(che)、及時的(de)感知, 更為困(kun)難的(de)是(shi)對平(ping)臺(tai)(tai)的(de)建設。在數(shu)(shu)據共(gong)享平(ping)臺(tai)(tai)的(de)建設上(shang), 除了必(bi)備的(de)硬件設施, 大數(shu)(shu)據實(shi)驗(yan)(yan)平(ping)臺(tai)(tai)還涉及大量部(bu)門(men), 如政府管理(li)部(bu)門(men)、氣象部(bu)門(men)、交(jiao)通(tong)、電子商(shang)務、旅行社、旅游網(wang)站等。如此多(duo)的(de)部(bu)門(men)相關聯, 要想(xiang)建立一個完整(zheng)全面的(de)大數(shu)(shu)據實(shi)驗(yan)(yan)平(ping)臺(tai)(tai), 難度(du)可(ke)想(xiang)而(er)知。
3.2 大數據挖掘方法
大(da)(da)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)時(shi)(shi)代缺的(de)(de)(de)(de)(de)(de)不(bu)(bu)是(shi)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju), 而是(shi)方法(fa)(fa)(fa)。大(da)(da)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)在(zai)旅游(you)(you)(you)行(xing)(xing)(xing)業的(de)(de)(de)(de)(de)(de)應用(yong)前景(jing)非常(chang)廣闊, 但(dan)是(shi)面對(dui)(dui)(dui)大(da)(da)量(liang)的(de)(de)(de)(de)(de)(de)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju), 不(bu)(bu)懂(dong)如(ru)何(he)收(shou)(shou)集(ji)有用(yong)的(de)(de)(de)(de)(de)(de)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)、不(bu)(bu)懂(dong)如(ru)何(he)對(dui)(dui)(dui)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)進行(xing)(xing)(xing)挖掘(jue)(jue)(jue)(jue)和利(li)用(yong), 那么“大(da)(da)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)”猶如(ru)礦(kuang)山(shan)之中的(de)(de)(de)(de)(de)(de)廢石。旅游(you)(you)(you)行(xing)(xing)(xing)業所(suo)涉及的(de)(de)(de)(de)(de)(de)結構(gou)(gou)化與非結構(gou)(gou)化數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju), 通(tong)(tong)過云(yun)計(ji)算技術, 對(dui)(dui)(dui)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)的(de)(de)(de)(de)(de)(de)收(shou)(shou)集(ji)、存儲(chu)都較(jiao)為容(rong)易, 但(dan)對(dui)(dui)(dui)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)的(de)(de)(de)(de)(de)(de)挖掘(jue)(jue)(jue)(jue)分(fen)(fen)(fen)析(xi)(xi)(xi)則(ze)還(huan)在(zai)不(bu)(bu)斷探索(suo)中。大(da)(da)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)的(de)(de)(de)(de)(de)(de)挖掘(jue)(jue)(jue)(jue)常(chang)用(yong)的(de)(de)(de)(de)(de)(de)方法(fa)(fa)(fa)有關(guan)聯分(fen)(fen)(fen)析(xi)(xi)(xi), 相似度分(fen)(fen)(fen)析(xi)(xi)(xi), 距離分(fen)(fen)(fen)析(xi)(xi)(xi), 聚類分(fen)(fen)(fen)析(xi)(xi)(xi)等等, 這些方法(fa)(fa)(fa)從不(bu)(bu)同(tong)的(de)(de)(de)(de)(de)(de)角(jiao)度對(dui)(dui)(dui)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)進行(xing)(xing)(xing)挖掘(jue)(jue)(jue)(jue)。其(qi)中, 相關(guan)性分(fen)(fen)(fen)析(xi)(xi)(xi)方法(fa)(fa)(fa)通(tong)(tong)過關(guan)聯多(duo)個(ge)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)來源, 挖掘(jue)(jue)(jue)(jue)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)價值。但(dan)針對(dui)(dui)(dui)旅游(you)(you)(you)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju), 采用(yong)這些方法(fa)(fa)(fa)挖掘(jue)(jue)(jue)(jue)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)的(de)(de)(de)(de)(de)(de)價值信息(xi), 難度也(ye)很(hen)(hen)大(da)(da), 因(yin)為旅游(you)(you)(you)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)中冗余數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)很(hen)(hen)多(duo), 數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)存在(zai)形(xing)式很(hen)(hen)復雜(za)。在(zai)旅游(you)(you)(you)非結構(gou)(gou)化數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)中, 一張圖片、一個(ge)天氣變(bian)化、一次輿情(qing)評價等都將(jiang)會對(dui)(dui)(dui)游(you)(you)(you)客的(de)(de)(de)(de)(de)(de)旅行(xing)(xing)(xing)計(ji)劃(hua)帶(dai)來影響。對(dui)(dui)(dui)這些數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)完(wan)全挖掘(jue)(jue)(jue)(jue)分(fen)(fen)(fen)析(xi)(xi)(xi), 對(dui)(dui)(dui)游(you)(you)(you)客“行(xing)(xing)(xing)前、行(xing)(xing)(xing)中、行(xing)(xing)(xing)后”大(da)(da)數(shu)(shu)(shu)(shu)(shu)(shu)據(ju)(ju)(ju)(ju)的(de)(de)(de)(de)(de)(de)實時(shi)(shi)性挖掘(jue)(jue)(jue)(jue)都是(shi)很(hen)(hen)大(da)(da)的(de)(de)(de)(de)(de)(de)挑戰。
3.3 數據安全
2017年, 數(shu)(shu)據(ju)(ju)安全(quan)事件屢(lv)見不(bu)(bu)(bu)鮮, 伴(ban)著(zhu)大(da)數(shu)(shu)據(ju)(ju)而來(lai)的(de)數(shu)(shu)據(ju)(ju)安全(quan)問題(ti)日(ri)益(yi)凸顯出來(lai)。在(zai)大(da)數(shu)(shu)據(ju)(ju)時(shi)代, 無處(chu)不(bu)(bu)(bu)在(zai)的(de)數(shu)(shu)據(ju)(ju)收集(ji)技術使(shi)我們的(de)個(ge)人信(xin)息在(zai)所關聯的(de)數(shu)(shu)據(ju)(ju)中心留下(xia)痕跡, 如何保證這(zhe)些信(xin)息被合法合理使(shi)用, 讓數(shu)(shu)據(ju)(ju)“可用不(bu)(bu)(bu)可見”[4], 這(zhe)是亟(ji)待解決的(de)問題(ti)。同時(shi), 在(zai)大(da)數(shu)(shu)據(ju)(ju)資源(yuan)的(de)開放性和(he)(he)共享(xiang)性下(xia), 個(ge)人隱(yin)私(si)和(he)(he)公民權益(yi)受到嚴重(zhong)威脅。這(zhe)一矛盾的(de)存在(zai)使(shi)數(shu)(shu)據(ju)(ju)共享(xiang)程度(du)與(yu)數(shu)(shu)據(ju)(ju)挖(wa)掘程度(du)成反(fan)比。此外, 經(jing)過大(da)數(shu)(shu)據(ju)(ju)技術的(de)分(fen)析、挖(wa)掘, 個(ge)人隱(yin)私(si)更易(yi)被發現(xian)和(he)(he)暴露, 從而可能引(yin)發一系列(lie)社會問題(ti)。
大數(shu)(shu)(shu)據(ju)背景下的(de)旅(lv)游(you)(you)數(shu)(shu)(shu)據(ju)當然也避(bi)免不了數(shu)(shu)(shu)據(ju)的(de)安全(quan)問題。如(ru)果(guo)游(you)(you)客(ke)“吃、住、行、游(you)(you)、娛(yu)、購”的(de)數(shu)(shu)(shu)據(ju)被放入數(shu)(shu)(shu)據(ju)庫(ku), 被完(wan)全(quan)共享、挖掘、分(fen)析, 那游(you)(you)客(ke)的(de)人身財產(chan)安全(quan)將會受到嚴重影(ying)響, 最(zui)終降低旅(lv)游(you)(you)體(ti)驗。所以(yi), 數(shu)(shu)(shu)據(ju)的(de)安全(quan)管理是進行大數(shu)(shu)(shu)據(ju)挖掘的(de)前提。
3.4 大數據人才
大(da)數據(ju)(ju)背景下的智(zhi)(zhi)游離不開(kai)人(ren)才的創新活動及技術支(zhi)持(chi), 然而與專業相銜接的大(da)數據(ju)(ju)人(ren)才培養未(wei)能及時跟上(shang)行業需求, 加之創新型人(ren)才的外流, 以及數據(ju)(ju)統計未(wei)來3~5年大(da)數據(ju)(ju)行業將面臨全(quan)球性的人(ren)才荒, 國內智(zhi)(zhi)游的構(gou)建還缺乏(fa)大(da)量人(ren)才。
4解決思路
在(zai)信息化(hua)建(jian)(jian)設(she)(she)上, 加(jia)(jia)(jia)大(da)(da)政府投入, 加(jia)(jia)(jia)強(qiang)(qiang)基礎設(she)(she)施建(jian)(jian)設(she)(she), 整合結(jie)構(gou)化(hua)數(shu)(shu)(shu)(shu)據(ju), 抓取非(fei)結(jie)構(gou)化(hua)數(shu)(shu)(shu)(shu)據(ju), 打通各數(shu)(shu)(shu)(shu)據(ju)壁壘, 建(jian)(jian)設(she)(she)旅游大(da)(da)數(shu)(shu)(shu)(shu)據(ju)實驗平(ping)臺;在(zai)挖(wa)(wa)掘方法(fa)上, 對旅游大(da)(da)數(shu)(shu)(shu)(shu)據(ju)實時性數(shu)(shu)(shu)(shu)據(ju)的(de)挖(wa)(wa)掘應該被放在(zai)重要位置;在(zai)數(shu)(shu)(shu)(shu)據(ju)安全上, 從加(jia)(jia)(jia)強(qiang)(qiang)大(da)(da)數(shu)(shu)(shu)(shu)據(ju)安全立法(fa)、監管執法(fa)及強(qiang)(qiang)化(hua)技(ji)術手段建(jian)(jian)設(she)(she)等幾個方面(mian)著(zhu)手, 提升大(da)(da)數(shu)(shu)(shu)(shu)據(ju)環(huan)境(jing)下數(shu)(shu)(shu)(shu)據(ju)安全保護(hu)水平(ping)。加(jia)(jia)(jia)強(qiang)(qiang)人才的(de)培(pei)養(yang)與引進(jin), 加(jia)(jia)(jia)強(qiang)(qiang)產學研合作, 培(pei)養(yang)智游大(da)(da)數(shu)(shu)(shu)(shu)據(ju)人才。
參考文獻
[1]翁凱.大數據(ju)在(zai)智游中的應(ying)用研(yan)究[J].信息技術, 2015, 24:86-87.
[2]梁昌勇, 馬銀(yin)超, 路彩虹.大數(shu)據挖掘(jue), 智游的核心[J].開發研究(jiu), 2015, 5 (180) :134-139.
[3]張建(jian)濤, 王洋, 劉力剛(gang).大(da)數據背景下(xia)智游應用模型體系構建(jian)[J].企(qi)業經(jing)濟, 2017, 5 (441) :116-123.
[4]王竹欣, 陳湉.保障(zhang)大數(shu)據, 從哪里入手(shou)?[N].人(ren)民(min)郵電究, 2017-11-30.
數據挖掘論文三:
題目:檔案信息管理系統中的計算機數據挖掘技術探討
摘要(yao):伴隨著計(ji)(ji)算機技術(shu)(shu)的(de)(de)不斷進步和發展, 數(shu)(shu)據(ju)挖(wa)掘技術(shu)(shu)成為數(shu)(shu)據(ju)處(chu)理工作中的(de)(de)重點(dian)技術(shu)(shu), 能借助(zhu)相關算法搜(sou)索相關信息(xi), 在(zai)(zai)節(jie)省人力資本的(de)(de)同時(shi), 提高數(shu)(shu)據(ju)檢索的(de)(de)實際效(xiao)率, 基于此, 被(bei)廣泛應(ying)用在(zai)(zai)數(shu)(shu)據(ju)密(mi)集(ji)型行(xing)業中。筆(bi)者簡要(yao)分(fen)析了計(ji)(ji)算機數(shu)(shu)據(ju)挖(wa)掘技術(shu)(shu), 并(bing)集(ji)中闡釋了檔案信息(xi)管理系統(tong)計(ji)(ji)算機數(shu)(shu)據(ju)倉(cang)庫的(de)(de)建立(li)和技術(shu)(shu)實現過程(cheng), 以供參(can)考。
關鍵詞:檔案信息管理系統; 計算機; 數據挖掘技術; 1 數據挖掘技術概述
數據(ju)(ju)(ju)挖掘技(ji)(ji)術(shu)就(jiu)是(shi)指(zhi)在(zai)大量隨機數據(ju)(ju)(ju)中提(ti)(ti)取隱(yin)含信息, 并且(qie)將(jiang)其整(zheng)合后應用在(zai)知識處(chu)理體系的(de)(de)技(ji)(ji)術(shu)過程。若是(shi)從技(ji)(ji)術(shu)層面判定數據(ju)(ju)(ju)挖掘技(ji)(ji)術(shu), 則需(xu)要將(jiang)其劃分在(zai)商(shang)業(ye)數據(ju)(ju)(ju)處(chu)理技(ji)(ji)術(shu)中, 整(zheng)合商(shang)業(ye)數據(ju)(ju)(ju)提(ti)(ti)取和轉(zhuan)化機制(zhi), 并且(qie)建構更加系統化的(de)(de)分析模型(xing)和處(chu)理機制(zhi), 從根本上優(you)化商(shang)業(ye)決(jue)策。借助(zhu)數據(ju)(ju)(ju)挖掘技(ji)(ji)術(shu)能建構完整(zheng)的(de)(de)數據(ju)(ju)(ju)倉庫, 滿足集成性(xing)(xing)、時(shi)變(bian)性(xing)(xing)以(yi)及(ji)非易失性(xing)(xing)等需(xu)求, 整(zheng)和數據(ju)(ju)(ju)處(chu)理和冗(rong)余參數, 確保技(ji)(ji)術(shu)框架結構的(de)(de)完整(zheng)性(xing)(xing)。
目前, 數據(ju)挖(wa)掘技術常(chang)用(yong)的(de)工具(ju), 如SAS企(qi)業的(de)Enterprise Miner、IBM企(qi)業的(de)Intellient Miner以及(ji)SPSS企(qi)業的(de)Clementine等(deng)應(ying)用(yong)都十分廣(guang)泛。企(qi)業在實際工作過程中, 往(wang)往(wang)會(hui)利(li)用(yong)數據(ju)源和數據(ju)預處(chu)理(li)工具(ju)進行數據(ju)定型(xing)和更新管理(li), 并且(qie)應(ying)用(yong)聚類分析(xi)模塊、決(jue)策樹分析(xi)模塊以及(ji)關聯分析(xi)算法等(deng), 借助數據(ju)挖(wa)掘技術對相關數據(ju)進行處(chu)理(li)。
2 檔案信息管理系統計算機數據倉庫的建立
2.1 客戶需求單元
為(wei)了充分(fen)發揮檔(dang)(dang)案(an)(an)(an)信息(xi)管理(li)(li)系統的(de)(de)(de)優勢(shi), 要(yao)結合客戶(hu)的(de)(de)(de)實際需(xu)求建(jian)立完(wan)(wan)整(zheng)的(de)(de)(de)處(chu)理(li)(li)框架體(ti)系。在數據(ju)(ju)(ju)庫體(ti)系建(jian)立中, 要(yao)適應(ying)迭代式處(chu)理(li)(li)特征, 并(bing)且(qie)從用戶(hu)需(xu)求出發整(zheng)合數據(ju)(ju)(ju)模型, 保證(zheng)其(qi)建(jian)立過程能按(an)照整(zheng)體(ti)規劃(hua)有(you)序進行, 且(qie)能按(an)照目標和分(fen)析框架參(can)數完(wan)(wan)成(cheng)操作(zuo)。首先, 要(yao)確立基礎性的(de)(de)(de)數據(ju)(ju)(ju)倉庫對(dui)象, 由于(yu)是檔(dang)(dang)案(an)(an)(an)信息(xi)管理(li)(li), 因此(ci), 要(yao)集中劃(hua)分(fen)檔(dang)(dang)案(an)(an)(an)數據(ju)(ju)(ju)分(fen)析的(de)(de)(de)主題, 并(bing)且(qie)有(you)效錄入檔(dang)(dang)案(an)(an)(an)信息(xi), 確保滿足檔(dang)(dang)案(an)(an)(an)的(de)(de)(de)數據(ju)(ju)(ju)分(fen)析需(xu)求。其(qi)次(ci), 要(yao)對(dui)日常工(gong)作(zuo)中的(de)(de)(de)用戶(hu)數據(ju)(ju)(ju)進行集中的(de)(de)(de)挖掘處(chu)理(li)(li), 從根本上提高數據(ju)(ju)(ju)倉庫分(fen)析的(de)(de)(de)完(wan)(wan)整(zheng)性。
(1) 確定數據倉庫(ku)的(de)基(ji)礎性用戶, 其中, 主(zhu)要包括(kuo)檔案工作(zuo)人(ren)員和使用人(ren)員, 結合不(bu)同人(ren)員的(de)工作(zuo)需(xu)求建立相應的(de)數據倉庫(ku)。
(2) 檔(dang)(dang)案工作要利用(yong)(yong)數據(ju)分析(xi)和檔(dang)(dang)案用(yong)(yong)戶特征分析(xi)進行分類描述。
(3) 確(que)定檔(dang)案的基礎性(xing)分類(lei)主(zhu)題, 一般而言, 要(yao)將(jiang)文書(shu)檔(dang)案歸檔(dang)情況、卷數等基礎性(xing)信息(xi)作為分類(lei)依據。
2.2 數據庫設計單元
在設計過(guo)程中, 要針對不同維度建立相(xiang)應的參數體系和組成結構, 并且有效整(zheng)合(he)組成事實表的主鍵項目, 建立框架(jia)結構。
第一(yi), 建立(li)事(shi)實表(biao)。事(shi)實表(biao)是數(shu)(shu)據模(mo)型的(de)(de)核心單(dan)(dan)元, 主(zhu)(zhu)要是記錄(lu)相關業務和統計數(shu)(shu)據的(de)(de)表(biao), 能(neng)整合數(shu)(shu)據倉庫中的(de)(de)信息單(dan)(dan)元, 并且提(ti)升(sheng)多維空間(jian)處(chu)理(li)效果, 確(que)保數(shu)(shu)據儲存過程切實有效。 (1) 檔(dang)(dang)(dang)(dang)(dang)(dang)(dang)(dang)案(an)管理(li)中文(wen)(wen)(wen)(wen)書(shu)檔(dang)(dang)(dang)(dang)(dang)(dang)(dang)(dang)案(an)目錄(lu)卷(juan)數(shu)(shu)事(shi)實表(biao):事(shi)實表(biao)主(zhu)(zhu)鍵(jian)(jian), 字(zi)(zi)(zi)段(duan)(duan)(duan)類(lei)型Int, 字(zi)(zi)(zi)段(duan)(duan)(duan)為(wei)(wei)Id;文(wen)(wen)(wen)(wen)書(shu)歸檔(dang)(dang)(dang)(dang)(dang)(dang)(dang)(dang)年份, 字(zi)(zi)(zi)段(duan)(duan)(duan)類(lei)型Int, 字(zi)(zi)(zi)段(duan)(duan)(duan)為(wei)(wei)Gdyear_key;文(wen)(wen)(wen)(wen)書(shu)歸檔(dang)(dang)(dang)(dang)(dang)(dang)(dang)(dang)類(lei)型, 字(zi)(zi)(zi)段(duan)(duan)(duan)類(lei)型Int, 字(zi)(zi)(zi)段(duan)(duan)(duan)為(wei)(wei)Ajtm_key;文(wen)(wen)(wen)(wen)書(shu)歸檔(dang)(dang)(dang)(dang)(dang)(dang)(dang)(dang)單(dan)(dan)位(wei)(wei), 字(zi)(zi)(zi)段(duan)(duan)(duan)類(lei)型Int, 字(zi)(zi)(zi)段(duan)(duan)(duan)為(wei)(wei)Gddw_key;文(wen)(wen)(wen)(wen)書(shu)檔(dang)(dang)(dang)(dang)(dang)(dang)(dang)(dang)案(an)生成年份, 字(zi)(zi)(zi)段(duan)(duan)(duan)類(lei)型Int, 字(zi)(zi)(zi)段(duan)(duan)(duan)為(wei)(wei)Ajscsj_key, 以(yi)及文(wen)(wen)(wen)(wen)書(shu)檔(dang)(dang)(dang)(dang)(dang)(dang)(dang)(dang)案(an)包括(kuo)的(de)(de)文(wen)(wen)(wen)(wen)件數(shu)(shu)目。 (2) 檔(dang)(dang)(dang)(dang)(dang)(dang)(dang)(dang)案(an)管理(li)中文(wen)(wen)(wen)(wen)書(shu)檔(dang)(dang)(dang)(dang)(dang)(dang)(dang)(dang)案(an)卷(juan)數(shu)(shu)事(shi)實表(biao):事(shi)實表(biao)主(zhu)(zhu)鍵(jian)(jian), 字(zi)(zi)(zi)段(duan)(duan)(duan)類(lei)型Int, 字(zi)(zi)(zi)段(duan)(duan)(duan)為(wei)(wei)Id;文(wen)(wen)(wen)(wen)書(shu)歸檔(dang)(dang)(dang)(dang)(dang)(dang)(dang)(dang)利(li)用(yong)(yong)日(ri)期, 字(zi)(zi)(zi)段(duan)(duan)(duan)類(lei)型Int, 字(zi)(zi)(zi)段(duan)(duan)(duan)為(wei)(wei)Date_key;文(wen)(wen)(wen)(wen)書(shu)歸檔(dang)(dang)(dang)(dang)(dang)(dang)(dang)(dang)利(li)用(yong)(yong)單(dan)(dan)位(wei)(wei), 字(zi)(zi)(zi)段(duan)(duan)(duan)類(lei)型Int, 字(zi)(zi)(zi)段(duan)(duan)(duan)為(wei)(wei)Dw_key;文(wen)(wen)(wen)(wen)書(shu)歸檔(dang)(dang)(dang)(dang)(dang)(dang)(dang)(dang)利(li)用(yong)(yong)類(lei)別, 字(zi)(zi)(zi)段(duan)(duan)(duan)類(lei)型Int, 字(zi)(zi)(zi)段(duan)(duan)(duan)為(wei)(wei)Dalb_key;文(wen)(wen)(wen)(wen)書(shu)歸檔(dang)(dang)(dang)(dang)(dang)(dang)(dang)(dang)利(li)用(yong)(yong)年份, 字(zi)(zi)(zi)段(duan)(duan)(duan)類(lei)型Int, 字(zi)(zi)(zi)段(duan)(duan)(duan)為(wei)(wei)Dayear_key等[1]。
第二, 建(jian)(jian)(jian)立維(wei)度(du)表(biao), 在實際(ji)數(shu)據(ju)(ju)(ju)倉庫(ku)建(jian)(jian)(jian)立和(he)運(yun)維(wei)工作(zuo)中, 提高(gao)數(shu)據(ju)(ju)(ju)管(guan)理效果(guo)和(he)水(shui)平, 確保建(jian)(jian)(jian)立循環和(he)反(fan)饋的(de)系(xi)統(tong)框架體系(xi), 并(bing)且(qie)處理增(zeng)長過程和(he)完(wan)善過程, 有效實現(xian)數(shu)據(ju)(ju)(ju)庫(ku)模型設計(ji)以及相關維(wei)護操(cao)作(zuo)。首(shou)先(xian), 要(yao)對模式(shi)(shi)的(de)基礎(chu)性維(wei)度(du)進行分析并(bing)且(qie)制作(zuo)相應(ying)的(de)表(biao), 主要(yao)包(bao)括檔案年度(du)維(wei)表(biao)、利用方式(shi)(shi)維(wei)表(biao)等。其次, 要(yao)建(jian)(jian)(jian)構數(shu)據(ju)(ju)(ju)庫(ku)星型模型體系(xi)。最后, 要(yao)集中判(pan)定(ding)數(shu)據(ju)(ju)(ju)庫(ku)工具, 保證數(shu)據(ju)(ju)(ju)庫(ku)平臺在客戶管(guan)理工作(zuo)方面(mian)具備一定(ding)的(de)優勢(shi), 集中制訂(ding)商(shang)務智能解(jie)決方案, 保證集成環境的(de)穩定(ding)性和(he)數(shu)據(ju)(ju)(ju)倉庫(ku)建(jian)(jian)(jian)模的(de)效果(guo), 真正提高(gao)數(shu)據(ju)(ju)(ju)抽取以及轉換工作(zuo)的(de)實際(ji)水(shui)平。需要(yao)注意的(de)是, 在全面(mian)整(zheng)合和(he)分析處理數(shu)據(ju)(ju)(ju)的(de)過程中, 要(yao)分離文書檔案中的(de)數(shu)據(ju)(ju)(ju), 相關操(cao)作(zuo)如下:
from dag gd temp//刪除(chu)臨時表中的數(shu)據
Ch count=dag 1.importfile (dbo.u wswj) //將文書目(mu)錄中(zhong)數據(ju)導出到(dao)數據(ju)窗口
Dag 1.() //將(jiang)數(shu)據窗口中的數(shu)據保存到(dao)臨時表(biao)
相關技術人員要(yao)對數(shu)據進(jin)行(xing)有效(xiao)處(chu)(chu)理(li), 以(yi)保(bao)證相關數(shu)據合并操作(zuo)、連接操作(zuo)以(yi)及條件性拆分(fen)操作(zuo)等都能按照數(shu)據預處(chu)(chu)理(li)管理(li)要(yao)求合理(li)化進(jin)行(xing), 從根本上維護(hu)數(shu)據處(chu)(chu)理(li)效(xiao)果。
2.3 多維數據模型(xing)建立單元
在檔(dang)案(an)多(duo)維數(shu)(shu)據(ju)(ju)(ju)模型建(jian)立的(de)過(guo)程中, 相關技術人員要判定(ding)聯機分析處理項(xiang)目和數(shu)(shu)據(ju)(ju)(ju)挖掘方案(an), 整合信息系統(tong)中的(de)數(shu)(shu)據(ju)(ju)(ju)源、數(shu)(shu)據(ju)(ju)(ju)視圖(tu)、維度(du)參數(shu)(shu)以及屬(shu)性參數(shu)(shu)等(deng), 保證具體單元能(neng)發揮其實際作用, 并且真正發揮檔(dang)案(an)維表的(de)穩定(ding)性、安全性優勢。
第一, 檔(dang)案(an)事實表中的數(shu)(shu)(shu)據(ju)(ju)(ju)穩定, 事實表是加(jia)載和處理檔(dang)案(an)數(shu)(shu)(shu)據(ju)(ju)(ju)的基本(ben)(ben)模塊, 按照檔(dang)案(an)目錄數(shu)(shu)(shu)據(ju)(ju)(ju)表和檔(dang)案(an)利用情況(kuang)表分(fen)析和判(pan)定其類別和歸檔(dang)時間(jian), 從而提高(gao)數(shu)(shu)(shu)據(ju)(ju)(ju)獨立分(fen)析水平。一方(fang)面(mian), 能(neng)追加(jia)有效的數(shu)(shu)(shu)據(ju)(ju)(ju), 保證數(shu)(shu)(shu)據(ju)(ju)(ju)倉庫信息的基本(ben)(ben)質量(liang), 也(ye)能(neng)追加(jia)時間(jian)判(pan)定標準(zhun), 能(neng)在實際(ji)操作(zuo)中減少掃描整個表浪(lang)費的時間(jian), 從根本(ben)(ben)上提高(gao)實際(ji)效率(lv)。另(ling)一方(fang)面(mian), 能(neng)刪除(chu)數(shu)(shu)(shu)據(ju)(ju)(ju), 實現數(shu)(shu)(shu)據(ju)(ju)(ju)更新(xin), 檢索相(xiang)關關鍵詞即可。并(bing)且也(ye)能(neng)同時修改數(shu)(shu)(shu)據(ju)(ju)(ju), 維護檔(dang)案(an)撤出和檔(dang)案(an)追加(jia)的動態化(hua)處理效果。
第二, 檔案(an)維表(biao)(biao)(biao)(biao)的(de)安(an)全性。在維表(biao)(biao)(biao)(biao)管理(li)工作(zuo)中, 檔案(an)參(can)數(shu)和數(shu)據(ju)的(de)安(an)全穩定性十分關鍵, 由(you)于(yu)(yu)其不(bu)會(hui)隨著(zhu)時間的(de)推移出(chu)現(xian)變化(hua), 因此, 要對(dui)(dui)其進行(xing)合理(li)的(de)處理(li)和協調。維表(biao)(biao)(biao)(biao)本身的(de)存儲空間較小, 盡管結構發生變化(hua)的(de)概率(lv)不(bu)大(da), 但(dan)仍(reng)會(hui)對(dui)(dui)代表(biao)(biao)(biao)(biao)的(de)對(dui)(dui)象產(chan)生影響, 這(zhe)就(jiu)會(hui)使得數(shu)據(ju)出(chu)現(xian)動(dong)態(tai)的(de)變化(hua)。對(dui)(dui)于(yu)(yu)這(zhe)種(zhong)改(gai)變, 需要借助新維生成的(de)方式進行(xing)處理(li), 從而保(bao)證不(bu)同(tong)維表(biao)(biao)(biao)(biao)能(neng)有效連接, 整合正(zheng)確數(shu)據(ju)的(de)同(tong)時, 也(ye)能(neng)對(dui)(dui)事實(shi)表(biao)(biao)(biao)(biao)外(wai)鍵進行(xing)分析[2]。
3 檔案信息管理系統計算機數據倉庫的實現
3.1 描述需求
隨著互聯網技術和數據(ju)庫技術不斷進步(bu), 要提(ti)高檔(dang)案(an)數字化水(shui)(shui)平以(yi)及(ji)完善信息化整合(he)機制, 加快數據(ju)庫管控體(ti)(ti)系的更(geng)新, 確保設備存儲以(yi)及(ji)網絡環境(jing)一體(ti)(ti)化水(shui)(shui)平能滿足需求(qiu), 尤(you)其是(shi)在(zai)(zai)檔(dang)案(an)資源重組和預測項目(mu)(mu)中, 只(zhi)有從根本上落實數據(ju)挖掘體(ti)(ti)系, 才能為后續信息檔(dang)案(an)管理項目(mu)(mu)升級奠定堅(jian)實基(ji)礎(chu)。另(ling)外(wai), 在(zai)(zai)數據(ju)表和文書(shu)等基(ji)礎(chu)性數據(ju)結構模型建立的基(ji)礎(chu)上, 要按照(zhao)規律制定具有個性化的主動性服務機制。
3.2 關聯計算
在(zai)(zai)實際檔案分(fen)析(xi)工作開展過程(cheng)中(zhong)(zhong), 關(guan)(guan)(guan)(guan)聯(lian)算法描(miao)述十分(fen)關(guan)(guan)(guan)(guan)鍵(jian), 能對某些行為特征進(jin)行統籌整合, 從(cong)而制(zhi)定(ding)分(fen)析(xi)決策。在(zai)(zai)進(jin)行關(guan)(guan)(guan)(guan)聯(lian)規(gui)則(ze)強度(du)分(fen)析(xi)時, 要結合支持(chi)度(du)和(he)置(zhi)(zhi)信度(du)等系(xi)統化數據進(jin)行綜(zong)合衡量。例如, 檔案數據庫中(zhong)(zhong)有A和(he)B兩個(ge)基(ji)礎項集(ji)合, 支持(chi)度(du)為P (A∪B) , 則(ze)直(zhi)接表述了A和(he)B在(zai)(zai)同一(yi)時間(jian)出現(xian)的(de)(de)(de)(de)基(ji)礎性概(gai)率(lv)。若是(shi)兩者(zhe)出現(xian)的(de)(de)(de)(de)概(gai)率(lv)并不大(da), 則(ze)證明兩者(zhe)之間(jian)的(de)(de)(de)(de)關(guan)(guan)(guan)(guan)聯(lian)度(du)較低。若是(shi)兩者(zhe)出現(xian)的(de)(de)(de)(de)概(gai)率(lv)較大(da), 則(ze)說(shuo)明兩者(zhe)的(de)(de)(de)(de)關(guan)(guan)(guan)(guan)聯(lian)度(du)較高。另外(wai), 在(zai)(zai)分(fen)析(xi)置(zhi)(zhi)信度(du)時, 利(li)用Confidence (A→B) = (A|B) , 也能有效判定(ding)兩者(zhe)之間(jian)的(de)(de)(de)(de)關(guan)(guan)(guan)(guan)系(xi)。在(zai)(zai)出現(xian)置(zhi)(zhi)信度(du)A的(de)(de)(de)(de)情況下, B的(de)(de)(de)(de)出現(xian)概(gai)率(lv)則(ze)是(shi)整體參數關(guan)(guan)(guan)(guan)系(xi)的(de)(de)(de)(de)關(guan)(guan)(guan)(guan)鍵(jian), 若是(shi)置(zhi)(zhi)信度(du)的(de)(de)(de)(de)數值達到100%, 則(ze)直(zhi)接證明A和(he)B能同一(yi)時間(jian)出現(xian)。
3.3 神經網絡算法
除了要對(dui)檔案的(de)實(shi)際內(nei)容進(jin)行(xing)(xing)數(shu)(shu)據(ju)分(fen)析和(he)數(shu)(shu)據(ju)庫建構(gou), 也要對(dui)其利用情(qing)況進(jin)行(xing)(xing)判定(ding)(ding), 目(mu)前較為(wei)常見(jian)的(de)利用率(lv)分(fen)析算法就是(shi)神經網(wang)絡(luo)算法, 其借助(zhu)數(shu)(shu)據(ju)分(fen)類(lei)(lei)系(xi)統判定(ding)(ding)和(he)分(fen)析數(shu)(shu)據(ju)對(dui)象。值(zhi)得注意(yi)的(de)是(shi), 在分(fen)類(lei)(lei)技術(shu)結(jie)構(gou)中, 要結(jie)合訓練數(shu)(shu)據(ju)集判定(ding)(ding)分(fen)類(lei)(lei)模(mo)型數(shu)(shu)據(ju)挖掘結(jie)構(gou)。神經網(wang)絡(luo)算法類(lei)(lei)似于(yu)人(ren)腦系(xi)統的(de)運行(xing)(xing)結(jie)構(gou), 能建立完整(zheng)的(de)信息處理單元, 并且能夠(gou)整(zheng)合非線性(xing)交換結(jie)構(gou), 確保能憑(ping)借歷(li)史數(shu)(shu)據(ju)對(dui)計算模(mo)型和(he)分(fen)類(lei)(lei)體系(xi)展開深度分(fen)析[3]。
3.4 實現多元化應用
在(zai)檔(dang)(dang)案(an)(an)(an)管(guan)(guan)理(li)(li)(li)(li)工作中(zhong)(zhong)(zhong)應(ying)(ying)用(yong)計(ji)(ji)算機數(shu)(shu)(shu)(shu)據挖(wa)掘技術(shu)(shu)(shu), 能(neng)(neng)對檔(dang)(dang)案(an)(an)(an)分(fen)(fen)類(lei)管(guan)(guan)理(li)(li)(li)(li)予以(yi)分(fen)(fen)析(xi), 保證(zheng)信(xin)息(xi)需求(qiu)分(fen)(fen)類(lei)總(zong)結(jie)工作的(de)(de)(de)完整(zheng)程度(du)。尤其是(shi)檔(dang)(dang)案(an)(an)(an)使用(yong)者(zhe)(zhe)在(zai)對檔(dang)(dang)案(an)(an)(an)具體特征進行差異化(hua)分(fen)(fen)析(xi)的(de)(de)(de)過程中(zhong)(zhong)(zhong), 能(neng)(neng)結(jie)合不同的(de)(de)(de)元素對具體問題展(zhan)開(kai)深度(du)調研。一方面(mian), 計(ji)(ji)算機數(shu)(shu)(shu)(shu)據挖(wa)掘技術(shu)(shu)(shu)借助決策樹算法(fa)處(chu)理(li)(li)(li)(li)規則化(hua)的(de)(de)(de)檔(dang)(dang)案(an)(an)(an)分(fen)(fen)析(xi)機制。在(zai)差異化(hua)訓練(lian)體系(xi)(xi)中(zhong)(zhong)(zhong), 要對數(shu)(shu)(shu)(shu)據集(ji)合中(zhong)(zhong)(zhong)的(de)(de)(de)數(shu)(shu)(shu)(shu)據進行系(xi)(xi)統(tong)化(hua)分(fen)(fen)析(xi)以(yi)及處(chu)理(li)(li)(li)(li), 確(que)保構(gou)(gou)建(jian)要求(qiu)能(neng)(neng)適應(ying)(ying)數(shu)(shu)(shu)(shu)據挖(wa)掘的(de)(de)(de)基本(ben)結(jie)構(gou)(gou)[4]。例如, 檔(dang)(dang)案(an)(an)(an)管(guan)(guan)理(li)(li)(li)(li)人(ren)員借助數(shu)(shu)(shu)(shu)據挖(wa)掘技術(shu)(shu)(shu)能(neng)(neng)整(zheng)合檔(dang)(dang)案(an)(an)(an)使用(yong)人(ren)員長期瀏覽與關注(zhu)的(de)(de)(de)信(xin)息(xi), 并且能(neng)(neng)集(ji)中(zhong)(zhong)(zhong)收(shou)集(ji)和(he)匯總(zong)間隔時間、信(xin)息(xi)查詢停留時間等, 從而建(jian)構(gou)(gou)完整(zheng)的(de)(de)(de)數(shu)(shu)(shu)(shu)據分(fen)(fen)析(xi)機制, 有效(xiao)向(xiang)其推送(song)或者(zhe)(zhe)是(shi)提供便捷化(hua)查詢服務, 保證(zheng)檔(dang)(dang)案(an)(an)(an)管(guan)(guan)理(li)(li)(li)(li)數(shu)(shu)(shu)(shu)字化(hua)水平的(de)(de)(de)提高。另一方面(mian), 在(zai)檔(dang)(dang)案(an)(an)(an)收(shou)集(ji)管(guan)(guan)理(li)(li)(li)(li)工作中(zhong)(zhong)(zhong)應(ying)(ying)用(yong)數(shu)(shu)(shu)(shu)據挖(wa)掘技術(shu)(shu)(shu), 主要是(shi)對數(shu)(shu)(shu)(shu)據信(xin)息(xi)進行分(fen)(fen)析(xi), 結(jie)合基本(ben)結(jie)果建(jian)立(li)概念模(mo)型(xing), 保證(zheng)模(mo)型(xing)以(yi)及測(ce)試樣本(ben)之(zhi)間的(de)(de)(de)比較參數(shu)(shu)(shu)(shu)符(fu)合標準, 從而真正建(jian)立(li)更加系(xi)(xi)統(tong)化(hua)的(de)(de)(de)分(fen)(fen)類(lei)框架體系(xi)(xi)。
4 結語
總而言之(zhi), 在檔(dang)(dang)案管(guan)理工作中應用數(shu)(shu)據挖掘技(ji)術, 能在準確判定(ding)用戶需(xu)求的同時, 維護數(shu)(shu)據處理效果, 并(bing)且(qie)減少檔(dang)(dang)案數(shu)(shu)字化的成本, 為后續工作的進一步優化奠定(ding)堅(jian)實(shi)基礎。并(bing)且(qie), 數(shu)(shu)據庫(ku)的建立, 也(ye)能節省經費和設備維護成本, 真正實(shi)現數(shu)(shu)字化全面發展的目標, 促進檔(dang)(dang)案信息管(guan)理工作的長效進步。
參考文獻
[1]曾(ceng)雪峰.計(ji)算(suan)機數據挖掘技術(shu)開發及其在(zai)檔案信息管(guan)理中(zhong)的運用研究[J].科技創新(xin)與應用, 2016 (9) :285.
[2]王曉(xiao)燕.數(shu)據(ju)挖掘技術在檔(dang)案信息管理中的應用[J].蘭臺世界(jie), 2014 (23) :25-26.
[3]韓吉義.基于數據(ju)挖掘技術(shu)的高校圖書(shu)館檔(dang)案信息管理平臺的構筑[J].山西檔(dang)案, 2015 (6) :61-63.
[4]哈(ha)立原.基于數據(ju)挖掘技術的高校圖書館(guan)檔案信息管理平臺構建(jian)[J].山西檔案, 2016 (5) :105-107.
數據挖掘論文四: 題目:機器學習算法在數據挖掘中的應用
摘要:隨著科學技術的(de)快速(su)發展, 各種新鮮(xian)的(de)事物和理念得到了廣泛的(de)應(ying)用。其(qi)中機器(qi)學習(xi)算(suan)法就(jiu)是一則典型(xing)案例——作(zuo)為一種新型(xing)的(de)算(suan)法, 其(qi)廣泛應(ying)用于(yu)各行各業之(zhi)中。本篇論文旨(zhi)在探討機器(qi)學習(xi)算(suan)法在數據(ju)(ju)挖掘中的(de)具(ju)體應(ying)用, 我們利用龐大的(de)移動終端數據(ju)(ju)網絡, 加強了基于(yu)GSM網絡的(de)戶外終端定位(wei)(wei), 從(cong)而提(ti)出了3個(ge)階(jie)段(duan)的(de)定位(wei)(wei)算(suan)法, 有效提(ti)高(gao)了定位(wei)(wei)的(de)精準度和速(su)度。
關鍵詞:學習算法; GSM網絡; 定位; 數據;
移(yi)(yi)動(dong)(dong)終端定(ding)(ding)(ding)(ding)位(wei)(wei)技(ji)術(shu)(shu)由(you)來(lai)已久(jiu), 其主(zhu)要(yao)是(shi)利(li)(li)用(yong)各種(zhong)科學(xue)技(ji)術(shu)(shu)手段定(ding)(ding)(ding)(ding)位(wei)(wei)移(yi)(yi)動(dong)(dong)物體的(de)(de)(de)(de)(de)(de)精(jing)準(zhun)(zhun)(zhun)位(wei)(wei)置以及高度(du)(du)。目前(qian), 移(yi)(yi)動(dong)(dong)終端定(ding)(ding)(ding)(ding)位(wei)(wei)技(ji)術(shu)(shu)主(zhu)要(yao)應用(yong)于(yu)軍事定(ding)(ding)(ding)(ding)位(wei)(wei)、緊(jin)急救(jiu)援、網(wang)(wang)絡優化(hua)、地圖導航等多(duo)個(ge)現(xian)代(dai)化(hua)的(de)(de)(de)(de)(de)(de)領域, 由(you)于(yu)移(yi)(yi)動(dong)(dong)終端定(ding)(ding)(ding)(ding)位(wei)(wei)技(ji)術(shu)(shu)可以提供(gong)精(jing)準(zhun)(zhun)(zhun)的(de)(de)(de)(de)(de)(de)位(wei)(wei)置服(fu)務信(xin)息, 所以其在市場上(shang)還(huan)是(shi)有較大的(de)(de)(de)(de)(de)(de)需(xu)(xu)求(qiu)的(de)(de)(de)(de)(de)(de), 這也(ye)為(wei)移(yi)(yi)動(dong)(dong)終端定(ding)(ding)(ding)(ding)位(wei)(wei)技(ji)術(shu)(shu)的(de)(de)(de)(de)(de)(de)優化(hua)和(he)發展(zhan), 提供(gong)了(le)(le)(le)(le)推動(dong)(dong)力。隨著通信(xin)網(wang)(wang)絡普及, 移(yi)(yi)動(dong)(dong)終端定(ding)(ding)(ding)(ding)位(wei)(wei)技(ji)術(shu)(shu)的(de)(de)(de)(de)(de)(de)發展(zhan)也(ye)得(de)(de)(de)到(dao)(dao)了(le)(le)(le)(le)一些幫(bang)助, 使得(de)(de)(de)其定(ding)(ding)(ding)(ding)位(wei)(wei)的(de)(de)(de)(de)(de)(de)精(jing)準(zhun)(zhun)(zhun)度(du)(du)和(he)速(su)度(du)(du)都(dou)得(de)(de)(de)到(dao)(dao)了(le)(le)(le)(le)全(quan)面(mian)的(de)(de)(de)(de)(de)(de)優化(hua)和(he)提升(sheng)。同時(shi), 傳統(tong)(tong)的(de)(de)(de)(de)(de)(de)定(ding)(ding)(ding)(ding)位(wei)(wei)方法(fa)(fa)(fa)結(jie)(jie)合先進的(de)(de)(de)(de)(de)(de)算(suan)(suan)法(fa)(fa)(fa)來(lai)進行(xing)精(jing)準(zhun)(zhun)(zhun)定(ding)(ding)(ding)(ding)位(wei)(wei), 目前(qian)依舊還(huan)是(shi)有較大的(de)(de)(de)(de)(de)(de)進步空間(jian)。在工(gong)作中我選(xuan)取機(ji)器(qi)學(xue)習(xi)算(suan)(suan)法(fa)(fa)(fa)結(jie)(jie)合數據挖掘技(ji)術(shu)(shu)對(dui)傳統(tong)(tong)定(ding)(ding)(ding)(ding)位(wei)(wei)技(ji)術(shu)(shu)加以改進, 取得(de)(de)(de)了(le)(le)(le)(le)不錯的(de)(de)(de)(de)(de)(de)效果, 但也(ye)遇(yu)到(dao)(dao)了(le)(le)(le)(le)許多(duo)問題, 例如:使用(yong)機(ji)器(qi)學(xue)習(xi)算(suan)(suan)法(fa)(fa)(fa)來(lai)進行(xing)精(jing)準(zhun)(zhun)(zhun)定(ding)(ding)(ding)(ding)位(wei)(wei)暫(zan)時(shi)無(wu)法(fa)(fa)(fa)滿(man)足更大的(de)(de)(de)(de)(de)(de)區域要(yao)求(qiu), 還(huan)有想要(yao)利(li)(li)用(yong)較低(di)的(de)(de)(de)(de)(de)(de)設備成本, 實現(xian)得(de)(de)(de)到(dao)(dao)更多(duo)的(de)(de)(de)(de)(de)(de)精(jing)準(zhun)(zhun)(zhun)定(ding)(ding)(ding)(ding)位(wei)(wei)的(de)(de)(de)(de)(de)(de)要(yao)求(qiu)比較困難。所以本文對(dui)機(ji)器(qi)學(xue)習(xi)算(suan)(suan)法(fa)(fa)(fa)進行(xing)了(le)(le)(le)(le)深入的(de)(de)(de)(de)(de)(de)研(yan)究(jiu), 希望能夠幫(bang)助其更快速(su)的(de)(de)(de)(de)(de)(de)定(ding)(ding)(ding)(ding)位(wei)(wei)、更精(jing)準(zhun)(zhun)(zhun)的(de)(de)(de)(de)(de)(de)定(ding)(ding)(ding)(ding)位(wei)(wei), 滿(man)足市場的(de)(de)(de)(de)(de)(de)需(xu)(xu)要(yao)。
1 數據挖掘概述
數(shu)據(ju)(ju)(ju)挖(wa)掘(jue)又名數(shu)據(ju)(ju)(ju)探勘、信息挖(wa)掘(jue)。它是數(shu)據(ju)(ju)(ju)庫(ku)知識篩選中(zhong)非常重要的(de)(de)(de)一步。數(shu)據(ju)(ju)(ju)挖(wa)掘(jue)其實指(zhi)的(de)(de)(de)就是在大量(liang)的(de)(de)(de)數(shu)據(ju)(ju)(ju)中(zhong)通過(guo)算(suan)法(fa)找到有用(yong)信息的(de)(de)(de)行(xing)為。一般情況下, 數(shu)據(ju)(ju)(ju)挖(wa)掘(jue)都會和(he)計(ji)算(suan)機科學(xue)緊密聯系在一起(qi), 通過(guo)統計(ji)集合、在線(xian)剖析、檢索篩選、機器(qi)學(xue)習、參數(shu)識別(bie)等多種方法(fa)來實現最初的(de)(de)(de)目標。統計(ji)算(suan)法(fa)和(he)機器(qi)學(xue)習算(suan)法(fa)是數(shu)據(ju)(ju)(ju)挖(wa)掘(jue)算(suan)法(fa)里(li)面應用(yong)得比(bi)較廣泛(fan)的(de)(de)(de)兩類。統計(ji)算(suan)法(fa)依賴于(yu)概率分析, 然后進行(xing)相關性判斷, 由(you)此(ci)來執(zhi)行(xing)運算(suan)。
而機器學(xue)(xue)習(xi)(xi)算(suan)法(fa)主(zhu)要(yao)(yao)依靠人工(gong)智能科技, 通(tong)過(guo)大(da)量的樣本收集、學(xue)(xue)習(xi)(xi)和訓練, 可以自(zi)動匹配運(yun)算(suan)所需的相(xiang)關參數(shu)及(ji)模式。它綜(zong)合了數(shu)學(xue)(xue)、物理(li)學(xue)(xue)、自(zi)動化和計(ji)算(suan)機科學(xue)(xue)等多種(zhong)學(xue)(xue)習(xi)(xi)理(li)論, 雖(sui)然(ran)(ran)能夠應用的領域和目(mu)標各不相(xiang)同(tong), 但是(shi)這些(xie)算(suan)法(fa)都可以被獨立使用運(yun)算(suan), 當然(ran)(ran)也可以相(xiang)互幫助, 綜(zong)合應用, 可以說是(shi)一種(zhong)可以“因(yin)(yin)時而變(bian)”、“因(yin)(yin)事而變(bian)”的算(suan)法(fa)。在機器學(xue)(xue)習(xi)(xi)算(suan)法(fa)的領域, 人工(gong)神經網絡是(shi)比較重要(yao)(yao)和常(chang)見的一種(zhong)。因(yin)(yin)為它的優秀(xiu)的數(shu)據(ju)處理(li)和演練、學(xue)(xue)習(xi)(xi)的能力較強。
而(er)且對于(yu)問題數據(ju)還可(ke)以進行精準的(de)(de)(de)(de)(de)(de)識別與處理(li)分析, 所以應用的(de)(de)(de)(de)(de)(de)頻(pin)次更多(duo)。人工(gong)(gong)(gong)神經(jing)網絡依賴(lai)于(yu)多(duo)種(zhong)多(duo)樣的(de)(de)(de)(de)(de)(de)建模(mo)模(mo)型來進行工(gong)(gong)(gong)作, 由(you)此來滿足不同的(de)(de)(de)(de)(de)(de)數據(ju)需求。綜合來看, 人工(gong)(gong)(gong)神經(jing)網絡的(de)(de)(de)(de)(de)(de)建模(mo), 它(ta)的(de)(de)(de)(de)(de)(de)精準度比(bi)較(jiao)(jiao)高, 綜合表述能(neng)力優秀, 而(er)且在(zai)應用的(de)(de)(de)(de)(de)(de)過程(cheng)中, 不需要依賴(lai)專家的(de)(de)(de)(de)(de)(de)輔助(zhu)力量, 雖然仍有缺陷, 比(bi)如在(zai)訓練數據(ju)的(de)(de)(de)(de)(de)(de)時候(hou)耗時較(jiao)(jiao)多(duo), 知識的(de)(de)(de)(de)(de)(de)理(li)解能(neng)力還沒(mei)有達到智能(neng)化的(de)(de)(de)(de)(de)(de)標準, 但(dan)是(shi), 相對于(yu)其(qi)他(ta)方式而(er)言(yan), 人工(gong)(gong)(gong)神經(jing)網絡的(de)(de)(de)(de)(de)(de)優勢(shi)依舊是(shi)比(bi)較(jiao)(jiao)突出的(de)(de)(de)(de)(de)(de)。
2 以機器學習算法為基礎的GSM網絡定位
2.1 定位問題的建模
建(jian)模的(de)(de)(de)過程主要是以(yi)支持向量機定(ding)位(wei)方式作為基礎, 把定(ding)位(wei)的(de)(de)(de)位(wei)置(zhi)(zhi)柵(zha)(zha)格化, 面積較小的(de)(de)(de)柵(zha)(zha)格位(wei)置(zhi)(zhi)就是獨立(li)的(de)(de)(de)一種(zhong)類別, 在定(ding)位(wei)的(de)(de)(de)位(wei)置(zhi)(zhi)內, 我們收集(ji)數目龐大的(de)(de)(de)終(zhong)(zhong)端(duan)測量數據, 然(ran)后利(li)用(yong)計算(suan)機對測量報告進行(xing)分析處(chu)理, 測量柵(zha)(zha)格的(de)(de)(de)距(ju)離度量和精(jing)準度, 然(ran)后對移動(dong)終(zhong)(zhong)端(duan)柵(zha)(zha)格進行(xing)預估(gu)判斷, 最終(zhong)(zhong)利(li)用(yong)機器學習進行(xing)分析求解。
2.2 采集數據和預處理
本(ben)次研究(jiu), 我們采用的(de)(de)模型對(dui)象是我國(guo)某一個(ge)周(zhou)邊長達(da)10千(qian)米(mi)的(de)(de)二線城市。在該城市區域內, 我們測(ce)量(liang)了四個(ge)不同時(shi)間(jian)段(duan)內的(de)(de)數(shu)據(ju)(ju)(ju), 為(wei)了保證機器學(xue)習(xi)算(suan)法定位的(de)(de)精(jing)準(zhun)性(xing)和有效(xiao)性(xing), 我們把其(qi)中的(de)(de)三批數(shu)據(ju)(ju)(ju)作為(wei)訓練數(shu)據(ju)(ju)(ju), 最(zui)(zui)后一組數(shu)據(ju)(ju)(ju)作為(wei)定位數(shu)據(ju)(ju)(ju), 然后把定位數(shu)據(ju)(ju)(ju)周(zhou)邊十米(mi)內的(de)(de)前三組訓練數(shu)據(ju)(ju)(ju)的(de)(de)相關信(xin)息進行清除。一旦確定某一待定位數(shu)據(ju)(ju)(ju), 就要(yao)在不同的(de)(de)時(shi)間(jian)內進行測(ce)量(liang), 按照測(ce)量(liang)出的(de)(de)數(shu)據(ju)(ju)(ju)信(xin)息的(de)(de)經(jing)緯度和平均值(zhi), 再進行換(huan)算(suan), 最(zui)(zui)終, 得到真(zhen)實的(de)(de)數(shu)據(ju)(ju)(ju)量(liang), 提升定位的(de)(de)速度以及有效(xiao)程度。
2.3 以基站的經緯度為基礎的初步定位
用機(ji)(ji)器學習算(suan)法(fa)來(lai)進行移動終(zhong)端(duan)定(ding)(ding)位(wei)(wei), 其復(fu)雜性也(ye)是比較大的(de)(de), 一旦區(qu)域面(mian)積(ji)增加(jia)(jia), 那(nei)么模型(xing)和分類也(ye)相應增加(jia)(jia), 而(er)且更加(jia)(jia)復(fu)雜, 所以(yi), 利用機(ji)(ji)器學習算(suan)法(fa)來(lai)進行移動終(zhong)端(duan)定(ding)(ding)位(wei)(wei)的(de)(de)過程, 會隨著定(ding)(ding)位(wei)(wei)區(qu)域面(mian)積(ji)的(de)(de)增大, 而(er)耗費(fei)更多的(de)(de)時間。利用基站的(de)(de)經緯度(du)作(zuo)為(wei)基礎來(lai)進行早期的(de)(de)定(ding)(ding)位(wei)(wei), 則(ze)需要(yao)(yao)以(yi)下幾(ji)個(ge)步驟:要(yao)(yao)將邊(bian)(bian)長為(wei)十千(qian)米(mi)的(de)(de)正方(fang)形分割成一千(qian)米(mi)的(de)(de)小柵(zha)格(ge), 如果(guo)想要(yao)(yao)定(ding)(ding)位(wei)(wei)數據(ju)集內(nei)的(de)(de)相關信息, 就(jiu)要(yao)(yao)選擇對邊(bian)(bian)長是一千(qian)米(mi)的(de)(de)小柵(zha)格(ge)進行計算(suan), 而(er)如果(guo)是想要(yao)(yao)獲得(de)邊(bian)(bian)長一千(qian)米(mi)的(de)(de)大柵(zha)格(ge), 就(jiu)要(yao)(yao)對邊(bian)(bian)長是一千(qian)米(mi)的(de)(de)柵(zha)格(ge)精心計算(suan)。
2.4 以向量機為基礎的二次定位
在完成初步(bu)定(ding)(ding)(ding)位(wei)(wei)工作(zuo)后, 要確定(ding)(ding)(ding)一個(ge)邊長為兩千米(mi)(mi)的(de)(de)正方形, 由(you)于(yu)第一級(ji)支(zhi)持向(xiang)(xiang)量(liang)(liang)機定(ding)(ding)(ding)位(wei)(wei)的(de)(de)區域是(shi)(shi)四(si)百米(mi)(mi), 定(ding)(ding)(ding)位(wei)(wei)輸出的(de)(de)是(shi)(shi)以一百米(mi)(mi)柵(zha)格作(zuo)為中(zhong)心點的(de)(de)經緯度數(shu)據(ju)信息, 相(xiang)對于(yu)一級(ji)向(xiang)(xiang)量(liang)(liang)機的(de)(de)定(ding)(ding)(ding)位(wei)(wei)而言(yan), 二(er)級(ji)向(xiang)(xiang)量(liang)(liang)機在定(ding)(ding)(ding)位(wei)(wei)計算的(de)(de)時(shi)候難度是(shi)(shi)較低的(de)(de), 更加簡便。后期(qi)的(de)(de)預算主要依賴決策(ce)函數(shu)計算和樣本向(xiang)(xiang)量(liang)(liang)機計算。隨著柵(zha)格的(de)(de)變小, 定(ding)(ding)(ding)位(wei)(wei)的(de)(de)精(jing)準(zhun)度將越來越高, 而由(you)于(yu)增加分(fen)類的(de)(de)問(wen)題數(shu)量(liang)(liang)是(shi)(shi)上升的(de)(de), 所以, 定(ding)(ding)(ding)位(wei)(wei)的(de)(de)復雜度也是(shi)(shi)相(xiang)對增加的(de)(de)。
2.5 以K-近鄰法為基礎的三次定位
第一(yi)步(bu)要(yao)做的(de)就(jiu)是(shi)選(xuan)定(ding)(ding)(ding)需要(yao)定(ding)(ding)(ding)位(wei)(wei)(wei)的(de)區域(yu)面(mian)積(ji), 在二次(ci)輸出之后, 確定(ding)(ding)(ding)其經緯度, 然(ran)后依(yi)賴經緯度來(lai)確定(ding)(ding)(ding)邊長面(mian)積(ji), 這(zhe)些都是(shi)進行(xing)區域(yu)定(ding)(ding)(ding)位(wei)(wei)(wei)的(de)基礎(chu)性(xing)(xing)工(gong)作, 緊接(jie)著就(jiu)是(shi)定(ding)(ding)(ding)位(wei)(wei)(wei)模型的(de)訓練。以K-近鄰法為基礎(chu)的(de)三次(ci)定(ding)(ding)(ding)位(wei)(wei)(wei)需要(yao)的(de)是(shi)綜合(he)(he)訓練信息數據(ju), 對于(yu)這(zhe)些信息數據(ju), 要(yao)以大小為選(xuan)擇(ze)依(yi)據(ju)進行(xing)篩選(xuan)和(he)合(he)(he)并(bing), 這(zhe)樣就(jiu)能夠減少計算的(de)重復性(xing)(xing)。當然(ran)了(le), 選(xuan)擇(ze)的(de)區域(yu)面(mian)積(ji)越(yue)(yue)大, 其定(ding)(ding)(ding)位(wei)(wei)(wei)的(de)速度和(he)精準(zhun)性(xing)(xing)也就(jiu)越(yue)(yue)低(di)。
3 結語
近年來, 隨著我國科學(xue)(xue)(xue)技術的(de)不斷(duan)發展(zhan)和進步, 數據挖掘技術愈(yu)加(jia)(jia)重要(yao)。根(gen)據上面(mian)的(de)研究, 我們證(zheng)明了(le), 在數據挖掘的(de)過程中, 應用(yong)機器(qi)學(xue)(xue)(xue)習(xi)算法具有舉(ju)足輕重的(de)作(zuo)(zuo)用(yong)。作(zuo)(zuo)為(wei)一門多領域(yu)互相(xiang)交叉(cha)的(de)知識學(xue)(xue)(xue)科, 它能夠幫助我們提升定(ding)位的(de)精準度以(yi)及定(ding)位速度, 可以(yi)被(bei)廣泛(fan)的(de)應用(yong)于(yu)各(ge)行(xing)(xing)各(ge)業(ye)。所以(yi), 對(dui)于(yu)機器(qi)學(xue)(xue)(xue)習(xi)算法, 相(xiang)關人員要(yao)加(jia)(jia)以(yi)重視(shi), 不斷(duan)的(de)進行(xing)(xing)改(gai)良(liang)以(yi)及改(gai)善, 切實的(de)發揮其有利的(de)方面(mian), 將其廣泛(fan)應用(yong)于(yu)智能定(ding)位的(de)各(ge)個領域(yu), 幫助我們解決關于(yu)戶外移動終端(duan)的(de)定(ding)位的(de)問題。
參考文獻
[1]陳(chen)小燕, CHENXiaoyan.機器學習算(suan)法在數據(ju)挖(wa)掘中的應(ying)用(yong)[J].現代電子技術, 2015, v.38;No.451 (20) :11-14.
[2]李運.機(ji)器學習(xi)算(suan)法(fa)在數據挖掘中的(de)應(ying)用[D].北京郵電大(da)學, 2014.
[3]莫雪峰.機器(qi)學習(xi)算法(fa)在數(shu)據(ju)挖(wa)掘中(zhong)的應用[J].科教文匯, 2016 (07) :175-178.
數據挖掘論文五: 題目:軟件工程數據挖掘研究進展
摘要:數(shu)(shu)(shu)據(ju)挖(wa)掘(jue)是(shi)指在大數(shu)(shu)(shu)據(ju)中開發(fa)出有(you)價值信息(xi)數(shu)(shu)(shu)據(ju)的(de)(de)(de)(de)過(guo)程(cheng)。計算機技術的(de)(de)(de)(de)不斷進步, 通(tong)過(guo)人工的(de)(de)(de)(de)方(fang)式進行(xing)軟件的(de)(de)(de)(de)開發(fa)與(yu)維護難度較大。而數(shu)(shu)(shu)據(ju)挖(wa)掘(jue)能(neng)夠(gou)(gou)有(you)效(xiao)的(de)(de)(de)(de)提升軟件開發(fa)的(de)(de)(de)(de)效(xiao)率, 并能(neng)夠(gou)(gou)在大量的(de)(de)(de)(de)數(shu)(shu)(shu)據(ju)中獲得有(you)效(xiao)的(de)(de)(de)(de)數(shu)(shu)(shu)據(ju)。文章主(zhu)要探究軟件工程(cheng)中數(shu)(shu)(shu)據(ju)挖(wa)掘(jue)技術的(de)(de)(de)(de)任務和(he)(he)存在的(de)(de)(de)(de)問題, 并重點論(lun)述軟件開發(fa)過(guo)程(cheng)中出現的(de)(de)(de)(de)問題和(he)(he)相關的(de)(de)(de)(de)解決措施。
關鍵詞:軟件工程; 數據挖掘; 解決措施;
在(zai)軟件開發過程(cheng)中(zhong), 為了能夠獲得更加準確的數(shu)(shu)(shu)據(ju)資(zi)源(yuan), 軟件的研發人員就(jiu)需要搜集和整理(li)數(shu)(shu)(shu)據(ju)。但(dan)是(shi)在(zai)大(da)數(shu)(shu)(shu)據(ju)時(shi)代, 人工(gong)獲取數(shu)(shu)(shu)據(ju)信息的難度(du)極(ji)大(da)。當前, 軟件工(gong)程(cheng)中(zhong)運用(yong)最(zui)多的就(jiu)是(shi)數(shu)(shu)(shu)據(ju)挖(wa)(wa)掘技(ji)術。軟件挖(wa)(wa)掘技(ji)術是(shi)傳統數(shu)(shu)(shu)據(ju)挖(wa)(wa)掘技(ji)術在(zai)軟件工(gong)程(cheng)方(fang)向的其(qi)中(zhong)一部分(fen)。但(dan)是(shi)它具有自身的特征, 體(ti)現在(zai)以下三個方(fang)面:
(1) 在軟件工(gong)程中(zhong), 對有效數(shu)據的挖掘和處(chu)理;
(2) 挖(wa)掘數據算法(fa)的選(xuan)擇(ze)問題;
(3) 軟(ruan)件(jian)的(de)開發者該如何選擇數據。
1 在軟件工程中數據挖掘的主要任務
在數(shu)據(ju)挖(wa)(wa)(wa)掘(jue)(jue)(jue)技(ji)術中, 軟(ruan)件工程數(shu)據(ju)挖(wa)(wa)(wa)掘(jue)(jue)(jue)是(shi)其中之(zhi)一, 其挖(wa)(wa)(wa)掘(jue)(jue)(jue)的(de)(de)過程與(yu)傳(chuan)統數(shu)據(ju)的(de)(de)挖(wa)(wa)(wa)掘(jue)(jue)(jue)無異。通常(chang)包括三個階段:第(di)一階段, 數(shu)據(ju)的(de)(de)預處(chu)理(li);第(di)二階段, 數(shu)據(ju)的(de)(de)挖(wa)(wa)(wa)掘(jue)(jue)(jue);第(di)三階段, 對結果的(de)(de)評估。第(di)一階段的(de)(de)主要任務有對數(shu)據(ju)的(de)(de)分類、對異常(chang)數(shu)據(ju)的(de)(de)檢測以(yi)(yi)及(ji)整(zheng)理(li)和(he)提取復雜信息等。雖然軟(ruan)件工程的(de)(de)數(shu)據(ju)挖(wa)(wa)(wa)掘(jue)(jue)(jue)和(he)傳(chuan)統的(de)(de)數(shu)據(ju)挖(wa)(wa)(wa)掘(jue)(jue)(jue)存在相似(si)性(xing), 但是(shi)也存在一定的(de)(de)差異, 其主要體現在以(yi)(yi)下三個方(fang)面:
1.1 軟件工程的數據更加復雜
軟件(jian)(jian)工(gong)程(cheng)數(shu)(shu)據主要(yao)包(bao)括兩(liang)種(zhong)(zhong), 一種(zhong)(zhong)是軟件(jian)(jian)報告, 另(ling)外一種(zhong)(zhong)是軟件(jian)(jian)的(de)版本信(xin)息。當然還包(bao)括一些軟件(jian)(jian)代碼和注釋在內(nei)的(de)非結構化(hua)數(shu)(shu)據信(xin)息。這兩(liang)種(zhong)(zhong)軟件(jian)(jian)工(gong)程(cheng)數(shu)(shu)據的(de)算(suan)法(fa)是不同的(de), 但是兩(liang)者之(zhi)間又有一定的(de)聯系, 這也是軟件(jian)(jian)工(gong)程(cheng)數(shu)(shu)據挖掘復雜性的(de)重要(yao)原因。
1.2 數據分析結果的表現更加特殊
傳統(tong)的(de)(de)數(shu)(shu)據(ju)(ju)挖掘(jue)結(jie)果(guo)可以通過很多種結(jie)果(guo)展示出來(lai), 最常見的(de)(de)有報表和(he)文字的(de)(de)方(fang)式(shi)(shi)。但是對于軟(ruan)件工(gong)程(cheng)的(de)(de)數(shu)(shu)據(ju)(ju)挖掘(jue)來(lai)講, 它(ta)最主要的(de)(de)職能是給(gei)軟(ruan)件的(de)(de)研發人(ren)員(yuan)提供更加精準的(de)(de)案(an)例, 軟(ruan)件漏洞的(de)(de)實際定位(wei)以及設計構造(zao)方(fang)面的(de)(de)信(xin)息, 同(tong)時也包括數(shu)(shu)據(ju)(ju)挖掘(jue)的(de)(de)統(tong)計結(jie)果(guo)。所以這就要求軟(ruan)件工(gong)程(cheng)的(de)(de)數(shu)(shu)據(ju)(ju)挖掘(jue)需要更加先進的(de)(de)結(jie)果(guo)提交方(fang)式(shi)(shi)和(he)途(tu)徑(jing)。
1.3 對數據挖掘結果難以達成一致的評價
我國傳統的(de)數(shu)(shu)(shu)據(ju)挖(wa)掘(jue)已經初步形成統一(yi)的(de)評(ping)價標準(zhun)(zhun), 而(er)且評(ping)價體(ti)系相對(dui)成熟(shu)。但是軟件工程的(de)數(shu)(shu)(shu)據(ju)挖(wa)掘(jue)過程中, 研發人員需要更多復雜而(er)又具體(ti)的(de)數(shu)(shu)(shu)據(ju)信息, 所以數(shu)(shu)(shu)據(ju)的(de)表示(shi)方法也相對(dui)多樣化, 數(shu)(shu)(shu)據(ju)之(zhi)間難(nan)(nan)以進行對(dui)比, 所以也就(jiu)難(nan)(nan)以達(da)成一(yi)致的(de)評(ping)價標準(zhun)(zhun)和結果(guo)(guo)。不(bu)難(nan)(nan)看出, 軟件工程數(shu)(shu)(shu)據(ju)挖(wa)掘(jue)的(de)關(guan)鍵在于對(dui)挖(wa)掘(jue)數(shu)(shu)(shu)據(ju)的(de)預處理(li)和對(dui)數(shu)(shu)(shu)據(ju)結果(guo)(guo)的(de)表示(shi)方法。
2 軟件工程研發階段出現的問題和解決措施
軟(ruan)件在(zai)研發階段主(zhu)要的(de)任務是對軟(ruan)件運行程(cheng)序的(de)編(bian)(bian)寫(xie)。以下是軟(ruan)件在(zai)編(bian)(bian)碼和(he)結果(guo)的(de)提交過程(cheng)中出現(xian)的(de)問題和(he)相應(ying)的(de)解決措(cuo)施。
2.1 對軟件代碼的編寫過程
該過程需要(yao)(yao)軟(ruan)件的研發(fa)人員能夠(gou)對自己(ji)需要(yao)(yao)編(bian)寫的代(dai)碼(ma)結構與功能有充分(fen)的了(le)解和(he)認識。并能夠(gou)依據自身掌握(wo)的信息(xi), 在(zai)數(shu)據庫中搜集到可(ke)以(yi)使用的數(shu)據信息(xi)。通常情況下(xia), 編(bian)程需要(yao)(yao)的數(shu)據信息(xi)可(ke)以(yi)分(fen)為(wei)三個方面:
(1) 軟件的研(yan)發(fa)人員能夠在已經存在的代碼中搜集可以重(zhong)新使(shi)用的代碼;
(2) 軟件的研發(fa)人員可(ke)以搜尋可(ke)以重(zhong)用的靜態(tai)規則, 比(bi)如繼承關系等(deng)。
(3) 軟件的(de)開發人員搜尋可以重用(yong)的(de)動態規則。
包括軟(ruan)件的(de)接口調用順序等(deng)。在尋找以上信息的(de)過程中, 通常是(shi)利(li)用軟(ruan)件的(de)幫(bang)助文檔、尋求外界幫(bang)助和搜集代碼(ma)的(de)方式實現, 但是(shi)以上方式在搜集信息過程中往往會(hui)遇到較多的(de)問(wen)題, 比如:幫(bang)助文檔的(de)準(zhun)確(que)性較低, 同時不(bu)夠完整, 可利(li)用的(de)重用信息不(bu)多等(deng)。
2.2 對軟件代碼的重用
在(zai)對(dui)軟(ruan)(ruan)件(jian)代(dai)(dai)(dai)(dai)碼(ma)(ma)(ma)重用(yong)過(guo)(guo)程(cheng)中(zhong), 最(zui)關鍵的(de)(de)(de)(de)問題是軟(ruan)(ruan)件(jian)的(de)(de)(de)(de)研發人員必須掌握需(xu)要的(de)(de)(de)(de)類(lei)或(huo)方法, 并能夠通過(guo)(guo)與之有聯系的(de)(de)(de)(de)代(dai)(dai)(dai)(dai)碼(ma)(ma)(ma)實現代(dai)(dai)(dai)(dai)碼(ma)(ma)(ma)的(de)(de)(de)(de)重用(yong)。但是這(zhe)種方式(shi)哦足跡信息將會耗費(fei)工作人員大量的(de)(de)(de)(de)精(jing)力(li)。而通過(guo)(guo)關鍵詞在(zai)代(dai)(dai)(dai)(dai)碼(ma)(ma)(ma)庫中(zhong)搜集可(ke)重用(yong)的(de)(de)(de)(de)軟(ruan)(ruan)件(jian)代(dai)(dai)(dai)(dai)碼(ma)(ma)(ma), 同時(shi)按照(zhao)代(dai)(dai)(dai)(dai)碼(ma)(ma)(ma)的(de)(de)(de)(de)相關度對(dui)搜集到的(de)(de)(de)(de)代(dai)(dai)(dai)(dai)碼(ma)(ma)(ma)進行(xing)排序, 該過(guo)(guo)程(cheng)使用(yong)的(de)(de)(de)(de)原理就(jiu)是可(ke)重用(yong)的(de)(de)(de)(de)代(dai)(dai)(dai)(dai)碼(ma)(ma)(ma)必然模式(shi)基(ji)本類(lei)似, 最(zui)終所展現出來的(de)(de)(de)(de)搜索(suo)結果是以上下(xia)文結構的(de)(de)(de)(de)方式(shi)展現的(de)(de)(de)(de)。比如:類(lei)與類(lei)之間的(de)(de)(de)(de)聯系。其實現的(de)(de)(de)(de)具(ju)體流程(cheng)如下(xia):
(1) 軟件的開發人(ren)員創建同時具備例程和上下文架構的代(dai)碼庫;
(2) 軟(ruan)件的(de)研發(fa)人員能夠向代(dai)碼庫提(ti)供(gong)類的(de)相關(guan)信息, 然后(hou)對反饋的(de)結果進行評估, 創建新(xin)型的(de)代(dai)碼庫。
(3) 未來的研(yan)發人員(yuan)在搜集過程中能夠按照評估(gu)結果的高(gao)低排(pai)序(xu), 便于查詢, 極大地縮減工(gong)作(zuo)人員(yuan)的任務量, 提升其工(gong)作(zuo)效(xiao)率。
2.3 對動態規則的重用
軟件(jian)工(gong)程領(ling)域內對動態規(gui)則(ze)(ze)重(zhong)用的(de)研(yan)究已經(jing)相對成(cheng)熟, 通過在(zai)編譯器內安裝特定插件(jian)的(de)方式檢驗代(dai)碼是否為動態規(gui)則(ze)(ze)最適用的(de), 并能(neng)夠將不適合(he)的(de)規(gui)則(ze)(ze)反饋給軟件(jian)的(de)研(yan)發人員(yuan)。其(qi)操作流程為:
(1) 軟件的研(yan)發人員能夠規(gui)定動(dong)態規(gui)則(ze)的順(shun)序, 主要表現在:使用某一(yi)函(han)數是不能夠調用其他的函(han)數。
(2) 實現對相(xiang)關數據(ju)的保(bao)存(cun), 可以通過隊列(lie)等(deng)簡單(dan)的數據(ju)結構完成(cheng)。在利用編譯拓展中(zhong)檢測(ce)其中(zhong)的順序。
(3) 能夠將(jiang)錯誤的(de)信息(xi)反(fan)饋(kui)給軟件(jian)的(de)研(yan)發(fa)人員(yuan)。
3 結束語
在(zai)軟(ruan)(ruan)件(jian)(jian)工程(cheng)的(de)(de)(de)(de)(de)(de)數(shu)據(ju)挖(wa)(wa)(wa)掘(jue)(jue)(jue)過程(cheng)中(zhong), 數(shu)據(ju)挖(wa)(wa)(wa)掘(jue)(jue)(jue)的(de)(de)(de)(de)(de)(de)概(gai)念才逐步被定義(yi), 但是(shi)所需要挖(wa)(wa)(wa)掘(jue)(jue)(jue)的(de)(de)(de)(de)(de)(de)數(shu)據(ju)是(shi)已(yi)經存(cun)在(zai)的(de)(de)(de)(de)(de)(de)。數(shu)據(ju)挖(wa)(wa)(wa)掘(jue)(jue)(jue)技術(shu)在(zai)軟(ruan)(ruan)件(jian)(jian)工程(cheng)中(zhong)的(de)(de)(de)(de)(de)(de)運(yun)用(yong)能夠降低研(yan)發(fa)人員的(de)(de)(de)(de)(de)(de)工作量, 同時軟(ruan)(ruan)件(jian)(jian)工程(cheng)與(yu)數(shu)據(ju)挖(wa)(wa)(wa)掘(jue)(jue)(jue)的(de)(de)(de)(de)(de)(de)結合(he)是(shi)計算(suan)機技術(shu)必(bi)然的(de)(de)(de)(de)(de)(de)發(fa)展方(fang)向。從數(shu)據(ju)挖(wa)(wa)(wa)掘(jue)(jue)(jue)的(de)(de)(de)(de)(de)(de)過程(cheng)來講, 在(zai)其整(zheng)個實施過程(cheng)和周期中(zhong)都包括軟(ruan)(ruan)件(jian)(jian)工程(cheng)。而對(dui)數(shu)據(ju)挖(wa)(wa)(wa)掘(jue)(jue)(jue)的(de)(de)(de)(de)(de)(de)技術(shu)手段來講, 它在(zai)軟(ruan)(ruan)件(jian)(jian)工程(cheng)中(zhong)的(de)(de)(de)(de)(de)(de)運(yun)用(yong)更(geng)加普遍。在(zai)對(dui)數(shu)據(ju)挖(wa)(wa)(wa)掘(jue)(jue)(jue)技術(shu)的(de)(de)(de)(de)(de)(de)研(yan)究(jiu)過程(cheng)中(zhong)可以發(fa)現, 該技術(shu)雖(sui)然已(yi)經獲(huo)得一(yi)定的(de)(de)(de)(de)(de)(de)效(xiao)果, 但是(shi)還有更(geng)多(duo)未(wei)被挖(wa)(wa)(wa)掘(jue)(jue)(jue)的(de)(de)(de)(de)(de)(de)空間, 還需要進一(yi)步的(de)(de)(de)(de)(de)(de)研(yan)究(jiu)和發(fa)現。
參考文獻
[1]王藝(yi)蓉.試析面向軟件(jian)工程(cheng)數據(ju)挖(wa)掘的開發測試技術[J].電子技術與(yu)軟件(jian)工程(cheng), 2017 (18) :64.
[2]吳彥博.軟件工程中(zhong)數(shu)據挖掘技術的運用探索[J].數(shu)字通信(xin)世界(jie), 2017 (09) :187.
[3]周(zhou)雨辰.數(shu)據挖掘技術在軟件工程中的應用研究[J].電腦迷(mi), 2017 (08) :27-28.
[4]劉(liu)桂林.分析軟件(jian)工程中(zhong)數據挖掘技(ji)術的應用方式[J].中(zhong)國新通信, 2017, 19 (13) :119.
【數據挖掘論文論文】相關(guan)文章:
數據挖掘論文07-16
數據挖掘論文精品[15篇]07-29
[實用]數據挖掘論文15篇07-29
旅游管理下數據挖掘運用論文11-18
數據挖掘論文錦集15篇07-29
基于數據挖掘的高校教務系統設計論文09-02
旅游管理下數據挖掘運用論文6篇11-18
大數據挖掘在智游應用中的探究論文01-13
旅游管理下數據挖掘運用論文(6篇)11-18
電力營銷系統中數據挖掘技術優秀論文09-24