前言:想要寫(xiě)出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇數(shù)據(jù)挖掘技術(shù)論文范文,相信會(huì)為您的寫(xiě)作帶來(lái)幫助,發(fā)現(xiàn)更多的寫(xiě)作思路和靈感。
[關(guān)鍵詞]數(shù)據(jù)挖掘客戶關(guān)系管理應(yīng)用步驟
根據(jù)波特的影響企業(yè)的利益相關(guān)者理論,企業(yè)有五個(gè)利益相關(guān)者,分別是客戶、競(jìng)爭(zhēng)對(duì)手、供應(yīng)商、分銷商和政府等其他利益相關(guān)者。其中,最重要的利益相關(guān)者就是客戶。現(xiàn)代企業(yè)的競(jìng)爭(zhēng)優(yōu)勢(shì)不僅體現(xiàn)在產(chǎn)品上,還體現(xiàn)在市場(chǎng)上,誰(shuí)能獲得更大的市場(chǎng)份額,誰(shuí)就能在競(jìng)爭(zhēng)中占據(jù)優(yōu)勢(shì)和主動(dòng)。而對(duì)市場(chǎng)份額的爭(zhēng)奪實(shí)質(zhì)上是對(duì)客戶的爭(zhēng)奪,因此,企業(yè)必須完成從“產(chǎn)品”導(dǎo)向向“客戶”導(dǎo)向的轉(zhuǎn)變,對(duì)企業(yè)與客戶發(fā)生的各種關(guān)系進(jìn)行管理。進(jìn)行有效的客戶關(guān)系管理,就要通過(guò)有效的途徑,從儲(chǔ)存大量客戶信息的數(shù)據(jù)倉(cāng)庫(kù)中經(jīng)過(guò)深層分析,獲得有利于商業(yè)運(yùn)作,提高企業(yè)市場(chǎng)競(jìng)爭(zhēng)力的有效信息。而實(shí)現(xiàn)這些有效性的關(guān)鍵技術(shù)支持就是數(shù)據(jù)挖掘,即從海量數(shù)據(jù)中挖掘出更有價(jià)值的潛在信息。正是有了數(shù)據(jù)挖掘技術(shù)的支持,才使得客戶關(guān)系管理的理念和目標(biāo)得以實(shí)現(xiàn),滿足現(xiàn)代電子商務(wù)時(shí)代的需求和挑戰(zhàn)。
一、客戶關(guān)系管理(CRM)
CRM是一種旨在改善企業(yè)與客戶之間關(guān)系的新型管理方法。它是企業(yè)通過(guò)富有意義的交流和溝通,理解并影響客戶行為,最終實(shí)現(xiàn)提高客戶獲取、客戶保留、客戶忠誠(chéng)和客戶創(chuàng)利的目的。它包括的主要內(nèi)容有客戶識(shí)別、客戶關(guān)系的建立、客戶保持、客戶流失控制和客戶挽留。通過(guò)客戶關(guān)系管理能夠提高企業(yè)銷售收入,改善企業(yè)的服務(wù),提高客戶滿意度,同時(shí)能提高員工的生產(chǎn)能力。
二、數(shù)據(jù)挖掘(DM)
數(shù)據(jù)挖掘(DataMining,簡(jiǎn)稱DM),簡(jiǎn)單的講就是從大量數(shù)據(jù)中挖掘或抽取出知識(shí)。數(shù)據(jù)挖掘概念的定義描述有若干版本。一個(gè)通用的定義是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中提取人們感興趣的知識(shí),這些知識(shí)是隱諱的、事先未知的、潛在有用的信息。
常用的數(shù)據(jù)挖掘方法有:(1)關(guān)聯(lián)分析。即從給定的數(shù)據(jù)集中發(fā)現(xiàn)頻繁出現(xiàn)的項(xiàng)集模式知識(shí)。例如,某商場(chǎng)通過(guò)關(guān)聯(lián)分析,可以找出若干個(gè)客戶在本商場(chǎng)購(gòu)買商品時(shí),哪些商品被購(gòu)置率較高,進(jìn)而可以發(fā)現(xiàn)數(shù)據(jù)庫(kù)中不同商品的聯(lián)系,進(jìn)而反映客戶的購(gòu)買習(xí)慣。(2)序列模式分析。它與關(guān)聯(lián)分析相似,其目的也是為了控制挖掘出的數(shù)據(jù)間的聯(lián)系。但序列模式分析的側(cè)重點(diǎn)在于分析數(shù)據(jù)間的前后(因果)關(guān)系。例如,可以通過(guò)分析客戶在購(gòu)買A商品后,必定(或大部分情況下)隨著購(gòu)買B商品,來(lái)發(fā)現(xiàn)客戶潛在的購(gòu)買模式。(3)分類分析。是找出一組能夠描述數(shù)據(jù)集合典型特征的模型,以便能夠分類識(shí)別未知數(shù)據(jù)的歸屬或類別。例如,銀行可以根據(jù)客戶的債務(wù)水平、收入水平和工作情況,可對(duì)給定用戶進(jìn)行信用風(fēng)險(xiǎn)分析。(4)聚類分析。是從給定的數(shù)據(jù)集中搜索數(shù)據(jù)對(duì)象之間所存在的有價(jià)值聯(lián)系。在商業(yè)上,聚類可以通過(guò)顧客數(shù)據(jù)將顧客信息分組,并對(duì)顧客的購(gòu)買模式進(jìn)行描述,找出他們的特征,制定針對(duì)性的營(yíng)銷方案。(5)孤立點(diǎn)分析。孤立點(diǎn)是數(shù)據(jù)庫(kù)中與數(shù)據(jù)的一般模式不一致的數(shù)據(jù)對(duì)象,它可能是收集數(shù)據(jù)的設(shè)備出現(xiàn)故障、人為輸入時(shí)的輸入錯(cuò)誤等。孤立點(diǎn)分析就是專門挖掘這些特殊信息的方法。例如,銀行可以利用孤立點(diǎn)分析發(fā)現(xiàn)信用卡詐騙,電信部門可以利用孤立點(diǎn)分析發(fā)現(xiàn)電話盜用等。
三、數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用
1.進(jìn)行客戶分類
客戶分類是將大量的客戶分成不同的類別,在每一類別里的客戶具有相似的屬性,而不同類別里的客戶的屬性不同。數(shù)據(jù)挖掘可以幫助企業(yè)進(jìn)行客戶分類,針對(duì)不同類別的客戶,提供個(gè)性化的服務(wù)來(lái)提高客戶的滿意度,提高現(xiàn)有客戶的價(jià)值。細(xì)致而可行的客戶分類對(duì)企業(yè)的經(jīng)營(yíng)策略有很大益處。例如,保險(xiǎn)公司在長(zhǎng)期的保險(xiǎn)服務(wù)中,積累了很多的數(shù)據(jù)信息,包括對(duì)客戶的服務(wù)歷史、對(duì)客戶的銷售歷史和收入,以及客戶的人口統(tǒng)計(jì)學(xué)資料和生活方式等。保險(xiǎn)公司必須將這些眾多的信息資源綜合起來(lái),以便在數(shù)據(jù)庫(kù)里建立起一個(gè)完整的客戶背景。在客戶背景信息中,大批客戶可能在保險(xiǎn)種類、保險(xiǎn)年份和保險(xiǎn)金額上具有極高的相似性,因而形成了具有共性的客戶群體。經(jīng)過(guò)數(shù)據(jù)挖掘的聚類分析,可以發(fā)現(xiàn)他們的共性,掌握他們的保險(xiǎn)理念,提供有針對(duì)性的服務(wù),提高保險(xiǎn)公司的綜合服務(wù)水平,并可以降低業(yè)務(wù)服務(wù)成本,取得更高的收益。
2.進(jìn)行客戶識(shí)別和保留
(1)在CRM中,首先應(yīng)識(shí)別潛在客戶,然后將他們轉(zhuǎn)化為客戶
這時(shí)可以采用DM中的分類方法。首先是通過(guò)對(duì)數(shù)據(jù)庫(kù)中各數(shù)據(jù)進(jìn)行分析,從而建立一個(gè)描述已知數(shù)據(jù)集類別或概念的模型,然后對(duì)每一個(gè)測(cè)試樣本,用其已知的類別與學(xué)習(xí)所獲模型的預(yù)測(cè)類別做比較,如果一個(gè)學(xué)習(xí)所獲模型的準(zhǔn)確率經(jīng)測(cè)試被認(rèn)可,就可以用這個(gè)模型對(duì)未來(lái)對(duì)象進(jìn)行分類。例如,圖書(shū)發(fā)行公司利用顧客郵件地址數(shù)據(jù)庫(kù),給潛在顧客發(fā)送用于促銷的新書(shū)宣傳冊(cè)。該數(shù)據(jù)庫(kù)內(nèi)容有客戶情況的描述,包括年齡、收入、職業(yè)、閱讀偏好、訂購(gòu)習(xí)慣、購(gòu)書(shū)資金、計(jì)劃等屬性的描述,顧客被分類為“是”或“否”會(huì)成為購(gòu)買書(shū)籍的顧客。當(dāng)新顧客的信息被輸入到數(shù)據(jù)庫(kù)中時(shí),就對(duì)該新顧客的購(gòu)買傾向進(jìn)行分類,以決定是否給該顧客發(fā)送相應(yīng)書(shū)籍的宣傳手冊(cè)。
(2)在客戶保留中的應(yīng)用
客戶識(shí)別是獲取新客戶的過(guò)程,而客戶保留則是留住老顧客、防止客戶流失的過(guò)程。對(duì)企業(yè)來(lái)說(shuō),獲取一個(gè)新顧客的成本要比保留一個(gè)老顧客的成本高。在保留客戶的過(guò)程中,非常重要的一個(gè)工作就是要找出顧客流失的原因。例如,某專科學(xué)校的招生人數(shù)在逐漸減少,那么就要找出減少的原因,經(jīng)過(guò)廣泛的搜集信息,發(fā)現(xiàn)原因在于本學(xué)校對(duì)技能培訓(xùn)不夠重視,學(xué)生只能學(xué)到書(shū)本知識(shí),沒(méi)有實(shí)際的技能,在就業(yè)市場(chǎng)上找工作很難。針對(duì)這種情況,學(xué)校應(yīng)果斷的抽取資金,購(gòu)買先進(jìn)的、有針對(duì)性的實(shí)驗(yàn)實(shí)訓(xùn)設(shè)備,同時(shí)修改教學(xué)計(jì)劃,加大實(shí)驗(yàn)實(shí)訓(xùn)課時(shí)和考核力度,培訓(xùn)相關(guān)專業(yè)的教師。
(3)對(duì)客戶忠誠(chéng)度進(jìn)行分析
客戶的忠誠(chéng)意味著客戶不斷地購(gòu)買公司的產(chǎn)品或服務(wù)。數(shù)據(jù)挖掘在客戶忠誠(chéng)度分析中主要是對(duì)客戶持久性、牢固性和穩(wěn)定性進(jìn)行分析。比如大型超市通過(guò)會(huì)員的消費(fèi)信息,如最近一次消費(fèi)、消費(fèi)頻率、消費(fèi)金額三個(gè)指標(biāo)對(duì)數(shù)據(jù)進(jìn)行分析,可以預(yù)測(cè)出顧客忠誠(chéng)度的變化,據(jù)此對(duì)價(jià)格、商品的種類以及銷售策略加以調(diào)整和更新,以便留住老顧客,吸引新顧客。
(4)對(duì)客戶盈利能力分析和預(yù)測(cè)
對(duì)于一個(gè)企業(yè)而言,如果不知道客戶的價(jià)值,就很難做出合適的市場(chǎng)策略。不同的客戶對(duì)于企業(yè)而言,其價(jià)值是不同的。研究表明,一個(gè)企業(yè)的80%的利潤(rùn)是由只占客戶總數(shù)的20%的客戶創(chuàng)造的,這部分客戶就是有價(jià)值的優(yōu)質(zhì)客戶。為了弄清誰(shuí)才是有價(jià)值的客戶,就需要按照客戶的創(chuàng)利能力來(lái)劃分客戶,進(jìn)而改進(jìn)客戶關(guān)系管理。數(shù)據(jù)挖掘技術(shù)可以用來(lái)分析和預(yù)測(cè)不同市場(chǎng)活動(dòng)情況下客戶盈利能力的變化,幫助企業(yè)制定合適的市場(chǎng)策略。商業(yè)銀行一般會(huì)利用數(shù)據(jù)挖掘技術(shù)對(duì)客戶的資料進(jìn)行分析,找出對(duì)提高企業(yè)盈利能力最重要的客戶,進(jìn)而進(jìn)行針對(duì)性的服務(wù)和營(yíng)銷。
(5)交叉銷售和增量銷售
交叉銷售是促使客戶購(gòu)買尚未使用的產(chǎn)品和服務(wù)的營(yíng)銷手段,目的是可以拓寬企業(yè)和客戶間的關(guān)系。增量銷售是促使客戶將現(xiàn)有產(chǎn)品和服務(wù)升級(jí)的銷售活動(dòng),目的在于增強(qiáng)企業(yè)和客戶的關(guān)系。這兩種銷售都是建立在雙贏的基礎(chǔ)上的,客戶因得到更多更好符合其需求的服務(wù)而獲益,公司也因銷售增長(zhǎng)而獲益。數(shù)據(jù)挖掘可以采用關(guān)聯(lián)性模型或預(yù)測(cè)性模型來(lái)預(yù)測(cè)什么時(shí)間會(huì)發(fā)生什么事件,判斷哪些客戶對(duì)交叉銷售和增量銷售很有意向,以達(dá)到交叉銷售和增量銷售的目的。例如,保險(xiǎn)公司的交叉營(yíng)銷策略:保險(xiǎn)公司對(duì)已經(jīng)購(gòu)買某險(xiǎn)種的客戶推薦其它保險(xiǎn)產(chǎn)品和服務(wù)。這種策略成功的關(guān)鍵是要確保推銷的保險(xiǎn)險(xiǎn)種是用戶所感興趣的,否則會(huì)造成用戶的反感。
四、客戶關(guān)系管理應(yīng)用數(shù)據(jù)挖掘的步驟
1.需求分析
只有確定需求,才有分析和預(yù)測(cè)的目標(biāo),然后才能提取數(shù)據(jù)、選擇方法,因此,需求分析是數(shù)據(jù)挖掘的基礎(chǔ)條件。數(shù)據(jù)挖掘的實(shí)施過(guò)程也是圍繞著這個(gè)目標(biāo)進(jìn)行的。在確定用戶的需求后,應(yīng)該明確所要解決的問(wèn)題屬于哪種應(yīng)用類型,是屬于關(guān)聯(lián)分析、分類、聚類及預(yù)測(cè),還是其他應(yīng)用。應(yīng)對(duì)現(xiàn)有資源如已有的歷史數(shù)據(jù)進(jìn)行評(píng)估,確定是否能夠通過(guò)數(shù)據(jù)挖掘技術(shù)來(lái)解決用戶的需求,然后將進(jìn)一步確定數(shù)據(jù)挖掘的目標(biāo)和制定數(shù)據(jù)挖掘的計(jì)劃。
2.建立數(shù)據(jù)庫(kù)
這是數(shù)據(jù)挖掘中非常重要也非常復(fù)雜的一步。首先,要進(jìn)行數(shù)據(jù)收集和集成,其次,要對(duì)數(shù)據(jù)進(jìn)行描述和整合。數(shù)據(jù)主要有四個(gè)方面的來(lái)源:客戶信息、客戶行為、生產(chǎn)系統(tǒng)和其他相關(guān)數(shù)據(jù)。這些數(shù)據(jù)通過(guò)抽取、轉(zhuǎn)換和裝載,形成數(shù)據(jù)倉(cāng)庫(kù),并通過(guò)OLAP和報(bào)表,將客戶的整體行為結(jié)果分析等數(shù)據(jù)傳遞給數(shù)據(jù)庫(kù)用戶。
3.選擇合適的數(shù)據(jù)挖掘工具
如果從上一步的分析中發(fā)現(xiàn),所要解決的問(wèn)題能用數(shù)據(jù)挖掘比較好地完成,那么需要做的第三步就是選擇合適的數(shù)據(jù)挖掘技術(shù)與方法。將所要解決的問(wèn)題轉(zhuǎn)化成一系列數(shù)據(jù)挖掘的任務(wù)。數(shù)據(jù)挖掘主要有五種任務(wù):分類,估值預(yù)測(cè),關(guān)聯(lián)規(guī)則,聚集,描述。前三種屬于直接的數(shù)據(jù)挖掘。在直接數(shù)據(jù)挖掘中,目標(biāo)是應(yīng)用可得到的數(shù)據(jù)建立模型,用其它可得到的數(shù)據(jù)來(lái)描述感興趣的變量。后兩種屬于間接數(shù)據(jù)挖掘。在間接數(shù)據(jù)挖掘中,沒(méi)有單一的目標(biāo)變量,目標(biāo)是在所有變量中發(fā)現(xiàn)某些聯(lián)系。
4.建立模型
建立模型是選擇合適的方法和算法對(duì)數(shù)據(jù)進(jìn)行分析,得到一個(gè)數(shù)據(jù)挖掘模型的過(guò)程。一個(gè)好的模型沒(méi)必要與已有數(shù)據(jù)完全相符,但模型對(duì)未來(lái)的數(shù)據(jù)應(yīng)有較好的預(yù)測(cè)。需要仔細(xì)考察不同的模型以判斷哪個(gè)模型對(duì)所需解決的問(wèn)題最有用。如決策樹(shù)模型、聚類模型都是分類模型,它們將一個(gè)事件或?qū)ο髿w類。回歸是通過(guò)具有已知值的變量來(lái)預(yù)測(cè)其它變量的值。時(shí)間序列是用變量過(guò)去的值來(lái)預(yù)測(cè)未來(lái)的值。這一步是數(shù)據(jù)挖掘的核心環(huán)節(jié)。建立模型是一個(gè)反復(fù)進(jìn)行的過(guò)程,它需要不斷地改進(jìn)或更換算法以尋找對(duì)目標(biāo)分析作用最明顯的模型,最后得到一個(gè)最合理、最適用的模型。
5.模型評(píng)估
為了驗(yàn)證模型的有效性、可信性和可用性,從而選擇最優(yōu)的模型,需要對(duì)模型進(jìn)行評(píng)估。我們可以將數(shù)據(jù)中的一部分用于模型評(píng)估,來(lái)測(cè)試模型的準(zhǔn)確性,模型是否容易被理解模型的運(yùn)行速度、輸入結(jié)果的速度、實(shí)現(xiàn)代價(jià)、復(fù)雜度等。模型的建立和檢驗(yàn)是一個(gè)反復(fù)的過(guò)程,通過(guò)這個(gè)階段階段的工作,能使數(shù)據(jù)以用戶能理解的方式出現(xiàn),直至找到最優(yōu)或較優(yōu)的模型。
6.部署和應(yīng)用
將數(shù)據(jù)挖掘的知識(shí)歸檔和報(bào)告給需要的群體,根據(jù)數(shù)據(jù)挖掘發(fā)現(xiàn)的知識(shí)采取必要的行動(dòng),以及消除與先前知識(shí)可能存在的沖突,并將挖掘的知識(shí)應(yīng)用于應(yīng)用系統(tǒng)。在模型的應(yīng)用過(guò)程中,也需要不斷地對(duì)模型進(jìn)行評(píng)估和檢驗(yàn),并做出適當(dāng)?shù)恼{(diào)整,以使模型適應(yīng)不斷變化的環(huán)境。
參考文獻(xiàn):
[1]羅納德.S.史威福特.客戶關(guān)系管理[M].楊東龍譯.北京:中國(guó)經(jīng)濟(jì)出版社,2002
[2]馬剛:客戶關(guān)系管理[M]大連:東北財(cái)經(jīng)大學(xué)出版社,2008
[3]朱美珍:以數(shù)據(jù)挖掘提升客戶關(guān)系管理[J].高科技產(chǎn)業(yè)技術(shù)與創(chuàng)新管理,2006,(27)
[4]顧桂芳何世友:數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用研究[J].企業(yè)管理,2007,(7)
要了解web數(shù)據(jù)挖掘技術(shù),首先就必須要了解數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘是指從大量不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、有用的信息和知識(shí)的過(guò)程。它的表現(xiàn)形式為概念(Concepts)、規(guī)則(Rules)、模式(Patterns)等形式。數(shù)據(jù)挖掘技術(shù)是人們長(zhǎng)期對(duì)數(shù)據(jù)庫(kù)技術(shù)進(jìn)行研究和開(kāi)發(fā)的結(jié)果。起初各種商業(yè)數(shù)據(jù)是存儲(chǔ)在計(jì)算機(jī)的數(shù)據(jù)庫(kù)中的,然后發(fā)展到可對(duì)數(shù)據(jù)庫(kù)進(jìn)行查詢和訪問(wèn),進(jìn)而發(fā)展到對(duì)數(shù)據(jù)庫(kù)的即時(shí)遍歷。數(shù)據(jù)挖掘技術(shù)是人們長(zhǎng)期對(duì)數(shù)據(jù)庫(kù)技術(shù)進(jìn)行研究和開(kāi)發(fā)的結(jié)果。起初各種商業(yè)數(shù)據(jù)是存儲(chǔ)在計(jì)算機(jī)的數(shù)據(jù)庫(kù)中的,然后發(fā)展到可對(duì)數(shù)據(jù)庫(kù)進(jìn)行查詢和訪問(wèn),進(jìn)而發(fā)展到對(duì)數(shù)據(jù)庫(kù)的即時(shí)遍歷。Web數(shù)據(jù)挖掘是一種綜合的技術(shù),它主要是使用數(shù)據(jù)挖掘技術(shù)在互聯(lián)網(wǎng)挖掘各種有用的、有趣的、隱藏起來(lái)的信息或者是有用的模式。與傳統(tǒng)的數(shù)據(jù)挖掘相比,web數(shù)據(jù)挖掘所挖掘的信息更加的海量,這些信息具有異構(gòu)和分布廣的特點(diǎn)。對(duì)于服務(wù)器上的日志與用戶信息的挖掘仍然屬于傳統(tǒng)的數(shù)據(jù)挖掘。Web數(shù)據(jù)挖掘由于web的邏輯結(jié)構(gòu)其所挖掘到的模式有可能是關(guān)于web內(nèi)容的,也有可能是關(guān)于web結(jié)構(gòu)的。同時(shí)有些數(shù)據(jù)挖掘技術(shù)也不能直接運(yùn)用到web數(shù)據(jù)挖掘中。Web數(shù)據(jù)挖掘的研究范圍十分廣泛,它的研究主要包括了數(shù)據(jù)庫(kù)技術(shù)、信息獲取技術(shù)、統(tǒng)計(jì)學(xué)、神經(jīng)網(wǎng)絡(luò)等。Web數(shù)據(jù)挖掘根據(jù)所處理的對(duì)象可以分為三類:web文檔的內(nèi)容挖掘、web文檔的結(jié)構(gòu)挖掘、web使用的挖掘。Web文檔的內(nèi)容挖掘指的是從web文檔及對(duì)其的描述內(nèi)容中獲取到有用的信息,即是對(duì)web上大量的各種文檔集合的內(nèi)容進(jìn)行處理,例如摘要、分類、聚類、關(guān)聯(lián)分析等。同時(shí)內(nèi)容挖掘還可以對(duì)各種多媒體信息進(jìn)行挖掘。Web上的內(nèi)容摘要是用簡(jiǎn)潔的語(yǔ)言和方式對(duì)文檔的內(nèi)容進(jìn)行描述和解釋,讓用戶在不用瀏覽全文的情況下就可以對(duì)全文的內(nèi)容和文章寫(xiě)作的目的有一個(gè)總體的了解。文章寫(xiě)作的目的有一個(gè)總體的了解。而web內(nèi)容挖掘的這種方式非常有用,例如應(yīng)用到檢索結(jié)果的顯示中。Web分類則指的是根據(jù)已經(jīng)確定好的類別,為每一個(gè)獲得的web文檔確定一個(gè)大類。聚類則是指的在沒(méi)有確定類別之前,將相似度高的文檔歸為一類。關(guān)聯(lián)分析指的是從文檔集合中找出不同語(yǔ)詞之間的具有的關(guān)系。Web文檔的結(jié)構(gòu)挖掘指的是從互聯(lián)網(wǎng)的整體結(jié)構(gòu)和網(wǎng)頁(yè)之間的相互鏈接以及網(wǎng)頁(yè)本身的結(jié)構(gòu)中獲取有用的信息和知識(shí)。目前為止針對(duì)結(jié)構(gòu)的挖掘主要還是鏈?zhǔn)浇Y(jié)構(gòu)模式。對(duì)于web結(jié)構(gòu)的挖掘主要源于對(duì)引文的分析,引文分析的主要內(nèi)容就是通過(guò)對(duì)網(wǎng)頁(yè)的鏈接數(shù)和被連接數(shù)以及對(duì)象的分析來(lái)建立一個(gè)鏈接結(jié)構(gòu)模式,這種模式可以用來(lái)對(duì)網(wǎng)頁(yè)進(jìn)行歸類,同時(shí)還可以獲取網(wǎng)頁(yè)之間的相似度和關(guān)聯(lián)度等信息。
Web使用的挖掘一般情況下指的是對(duì)web日志的挖掘。其挖掘的對(duì)象是用戶與互聯(lián)網(wǎng)交互過(guò)程中所抽取出來(lái)的各種信息,例如訪問(wèn)記錄、用戶名、用戶注冊(cè)信息以及用戶所進(jìn)行的操作等。在這一方面的研究已經(jīng)比較成熟,同時(shí)也有很多較為成熟的產(chǎn)品例如NETPERCERPION公司的Netpercerptions,Accrue公司的AccrueInsight和AccrueHitList等都是技術(shù)較為成熟的產(chǎn)品。
二、Web數(shù)據(jù)挖掘技術(shù)的工作流程
Web數(shù)據(jù)挖掘技術(shù)的主要工作流程可以分為以下幾個(gè)步驟:第一步,確立目標(biāo)樣本,這一步是用戶選取目標(biāo)文本,以此來(lái)作為提取用戶的特征信息;第二步,提取特征信息,這一步就是根據(jù)第一步得到的目標(biāo)樣本的詞頻分布,從現(xiàn)有的統(tǒng)計(jì)詞典中獲取所要挖掘的目標(biāo)的特征向量,并計(jì)算出其相應(yīng)的權(quán)值;第三步,從網(wǎng)絡(luò)上獲取信息,這一步是利用通過(guò)搜索引擎站點(diǎn)選擇采集站點(diǎn),然后通過(guò)Robot程序采集靜態(tài)的web頁(yè)面,最后再獲取這些被訪問(wèn)站點(diǎn)的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中的動(dòng)態(tài)信息,然后生成www資源庫(kù)索引;第四步,進(jìn)行信息特征匹配,通過(guò)提取源信息的特征向量,去和目標(biāo)樣本的特征向量進(jìn)行匹配,最后將符合閾值條件的信息返回個(gè)用戶。
三、Web數(shù)據(jù)挖掘技術(shù)在高校數(shù)字圖書(shū)館中的應(yīng)用
1、為開(kāi)發(fā)網(wǎng)絡(luò)信息資源提供了工具
數(shù)字圖書(shū)館需要的是一種可以有效的將信息進(jìn)行組織管理,同時(shí)還能夠?qū)π畔⑦M(jìn)行深層的加工管理,提供多層次的、智能化的信息服務(wù)和全方位的知識(shí)服務(wù),提供經(jīng)過(guò)加工、分析綜合等處理的高附加值的信息產(chǎn)品和知識(shí)產(chǎn)品的工具。目前許多高校數(shù)字圖書(shū)館的查詢手段還只局限于一些基本的數(shù)據(jù)操作,對(duì)數(shù)據(jù)只能進(jìn)行初步的加工,不具有從這些數(shù)據(jù)中歸納出所隱含的有用信息的功能,也使得這些信息不為人知,從而得不到更好的使用,這些都是對(duì)網(wǎng)絡(luò)信息資源的一種浪費(fèi)。而通過(guò)web數(shù)據(jù)挖掘技術(shù)科研有效的解決這一問(wèn)題。這種技術(shù)可以用于挖掘文檔的隱含的有用的內(nèi)容,或者可以在其他工具搜索的基礎(chǔ)上進(jìn)一步進(jìn)行處理,得到更為有用和精確的信息。通過(guò)web數(shù)據(jù)挖掘技術(shù)科研對(duì)數(shù)字圖書(shū)關(guān)注中的信息進(jìn)行更加有效地整合。
2、為以用戶為中心的服務(wù)提供幫助
通過(guò)瀏覽器訪問(wèn)數(shù)字圖書(shū)館后,可被記載下來(lái)的數(shù)據(jù)有兩類,一類是用戶信息,另一類是用戶訪問(wèn)記錄。其中用戶信息包括了用戶名,用戶訪問(wèn)IP地址,用戶的職業(yè)、年齡、愛(ài)好等。用戶名師用戶登錄圖書(shū)館時(shí)輸入,用戶訪問(wèn)IP地址通過(guò)程序獲得,其他的信息都是用戶在注冊(cè)時(shí)所填寫(xiě)的,訪問(wèn)記錄則是在用戶登錄時(shí)所記錄的,也是由程序獲得。對(duì)這些用戶信息進(jìn)行分析可以更加有效的了解用戶的需求通過(guò)分析服務(wù)器中用戶請(qǐng)求失敗的數(shù)據(jù),結(jié)合聚集算法,可以發(fā)現(xiàn)信息資源的缺漏,從而指導(dǎo)對(duì)信息資源采集的改進(jìn),讓高校數(shù)字圖書(shū)館的信息資源體系建設(shè)的更加合理。對(duì)數(shù)字圖書(shū)館系統(tǒng)的在線調(diào)查、留言簿、薦書(shū)條等的數(shù)據(jù)進(jìn)行收集整理,并使之轉(zhuǎn)化為標(biāo)準(zhǔn)的結(jié)構(gòu)化數(shù)據(jù)庫(kù),然后在通過(guò)數(shù)據(jù)挖掘,皆可以發(fā)現(xiàn)用戶所感興趣的模式,同時(shí)還可以預(yù)先發(fā)現(xiàn)用戶群體興趣的變遷,調(diào)整館藏方向,提前做好信息資源的采集計(jì)劃。通過(guò)web數(shù)據(jù)挖掘,可以對(duì)用戶的信息需求和行為規(guī)律進(jìn)行總結(jié),從而為優(yōu)化網(wǎng)絡(luò)站點(diǎn)的結(jié)構(gòu)提供參考,還可以適當(dāng)各種資源的配置更加的合理,讓用戶可以用更少的時(shí)間找到自己所需要的資源。例如可以通過(guò)路徑分析模式采掘捕捉確定用戶頻繁瀏覽訪問(wèn)的路徑,調(diào)整站點(diǎn)結(jié)構(gòu),并在適當(dāng)處加上廣告或薦書(shū)條。
3、web數(shù)據(jù)挖掘技術(shù)在圖書(shū)館采訪工作中的應(yīng)用
在圖書(shū)館的工作中有一步十分的重要,這就是采訪工作,采訪工作的做的好壞程度會(huì)直接的對(duì)圖書(shū)館的服務(wù)質(zhì)量產(chǎn)生影響。通常情況圖書(shū)館的工作人員會(huì)根據(jù)圖書(shū)館的性質(zhì)、服務(wù)對(duì)象及其任務(wù)來(lái)決定采訪的內(nèi)容。但是這種采訪局限性很大,很多時(shí)候會(huì)受采訪人員的主觀意識(shí)的影響,同時(shí)這種方式也會(huì)顯得死板不靈活。很多時(shí)候會(huì)出現(xiàn)應(yīng)該購(gòu)進(jìn)的文獻(xiàn)沒(méi)有買,不應(yīng)該買的文獻(xiàn)卻買了很多等與讀者的需求不符的現(xiàn)象。這些現(xiàn)象的產(chǎn)生都是因?yàn)槿狈?duì)讀者需求的了解和分析。要解決這些問(wèn)題就必須對(duì)讀者的需求進(jìn)行全面的了解和分析,而web數(shù)據(jù)挖掘則為解決該問(wèn)題提供了一種較好的方法。通過(guò)對(duì)各種日志文件和采訪時(shí)獲得的數(shù)據(jù)進(jìn)行分析,可以很清楚的得到讀者需要的是什么樣的書(shū)籍、不需要的又是什么樣的書(shū)籍,從而為采購(gòu)提供各種科學(xué)合理的分析報(bào)告和預(yù)測(cè)報(bào)告。根據(jù)對(duì)分析還能幫組圖書(shū)館管理人員確定各種所需書(shū)籍的比例,從而確定哪些文獻(xiàn)應(yīng)該及時(shí)的進(jìn)行補(bǔ)充,哪些文獻(xiàn)應(yīng)該進(jìn)行剔除,對(duì)館藏機(jī)構(gòu)進(jìn)行優(yōu)化,真正的為高校里的師生提供所需要的文獻(xiàn)和資料。
4、使用web數(shù)據(jù)挖掘技術(shù)提供個(gè)性化服務(wù)
傳統(tǒng)的信息檢索工具在友好型、可理解性、交互性方面都存在著很大的缺陷。通常情況下都只是將各種查詢結(jié)果毫無(wú)邏輯的簡(jiǎn)單的進(jìn)行羅列,用戶很難從其中獲取自己需要的信息,通過(guò)數(shù)據(jù)挖掘,可以對(duì)圖書(shū)館網(wǎng)站上的在線調(diào)查、留言簿、讀者調(diào)查表等數(shù)據(jù)進(jìn)行收集整理,對(duì)不需要的冗余信息進(jìn)行剔除。通過(guò)分析可以獲知用戶所喜好的瀏覽模式是哪種,他們常訪問(wèn)的網(wǎng)站的路徑是什么,他們對(duì)圖書(shū)館中的那些資源比較有興趣。然后再根據(jù)用戶的普遍需求與每個(gè)人的個(gè)性需求,建立起相應(yīng)的規(guī)則,從而幫助網(wǎng)站設(shè)計(jì)人員對(duì)網(wǎng)站進(jìn)行設(shè)計(jì)和優(yōu)化,使得這些信息檢索變得更加的個(gè)性化、智能化,并根據(jù)每個(gè)用戶的偏好等特征將檢索到的信息排列處理,使得讀者可以用最快的速度獲得想要檢索的文獻(xiàn)信息。通過(guò)web數(shù)據(jù)挖掘技術(shù)可以對(duì)用戶的特征信息進(jìn)行總結(jié),將那些從沒(méi)有發(fā)出過(guò)信息的潛在用戶進(jìn)行歸類,同時(shí)還可以免費(fèi)的為他們提供各種他們所感興趣的信息和資料,把這些潛在的用戶轉(zhuǎn)變?yōu)檎降挠脩羰褂脀eb數(shù)據(jù)挖掘可以對(duì)用戶的檢索日志進(jìn)行分析,從而得知用戶所感興趣的內(nèi)容、他們的研究方向,并根據(jù)這些內(nèi)容為用戶指定個(gè)性化服務(wù)的內(nèi)容,為用戶提供各種他們所感興趣的各種信息。
計(jì)算機(jī)動(dòng)態(tài)取證技術(shù)是利用計(jì)算機(jī)將取證技術(shù)、防火墻技術(shù)以及入侵檢測(cè)技術(shù)有效的結(jié)合起來(lái),可以在海量的信息數(shù)據(jù)中,對(duì)取證需要的數(shù)據(jù)進(jìn)行提取,這項(xiàng)技術(shù)可以提供實(shí)時(shí)、智能性數(shù)據(jù)分析,可以保證數(shù)據(jù)系統(tǒng)的安全性以及保密性,還可以準(zhǔn)確的找到相關(guān)信息并對(duì)其進(jìn)行保存。計(jì)算機(jī)動(dòng)態(tài)取證可以全面的獲取數(shù)據(jù)信息,而且可以掌握不法分析犯罪的動(dòng)機(jī)以及手法,有利于提高案件偵破的概率。計(jì)算機(jī)動(dòng)態(tài)取證具有較高的安全性,其可以采取有效的措施對(duì)黑客入侵進(jìn)行攔截,對(duì)非法入侵進(jìn)行牽制,從而保證信息數(shù)據(jù)保存的安全性。
2計(jì)算機(jī)動(dòng)態(tài)取證技術(shù)
2.1采集有效數(shù)據(jù)
數(shù)據(jù)采集是動(dòng)態(tài)取證重要的環(huán)節(jié)之一,只有做好數(shù)據(jù)采集工作,才能保證取證的質(zhì)量以及完整性,在當(dāng)前網(wǎng)絡(luò)患者下,為了保證數(shù)據(jù)庫(kù)中數(shù)據(jù)的充足性,需要提高數(shù)據(jù)采集的效率。在網(wǎng)絡(luò)數(shù)據(jù)獲取時(shí),需要注意三點(diǎn)內(nèi)容,首先,要保證數(shù)據(jù)的完整性,在采集的過(guò)程中,不能對(duì)數(shù)據(jù)進(jìn)行修改或者破壞;其次,數(shù)據(jù)采集系統(tǒng)不能受到網(wǎng)絡(luò)流量的影響;最后,數(shù)據(jù)采集獲取的過(guò)程中,要具有較高的透明度,要保證被檢測(cè)的網(wǎng)絡(luò)不會(huì)受到外界因素的影響。
2.2數(shù)據(jù)存儲(chǔ)
動(dòng)態(tài)取證技術(shù)是公安部門應(yīng)用比較多的技術(shù),與NIDS技術(shù)相比,其不但可以對(duì)特殊文字以及詞匯進(jìn)行摘錄,還可以對(duì)數(shù)據(jù)進(jìn)行完整性記錄,通過(guò)對(duì)數(shù)據(jù)模塊的分析,可以追查到相關(guān)內(nèi)容。利用動(dòng)態(tài)取證技術(shù),可以將需要的報(bào)文完整的保存起來(lái),還可以對(duì)網(wǎng)絡(luò)流量進(jìn)行詳細(xì)的記錄,可以確保系統(tǒng)不會(huì)丟失文件,另外,當(dāng)系統(tǒng)遭到黑客的入侵或者破壞后,動(dòng)態(tài)取證技術(shù)還可以進(jìn)行實(shí)時(shí)恢復(fù),所以,這項(xiàng)技術(shù)具有一定防御以及反擊作用。在應(yīng)用動(dòng)態(tài)取證技術(shù)時(shí),需要保證系統(tǒng)存儲(chǔ)空間的容量。
2.3數(shù)據(jù)分析
數(shù)據(jù)分析是動(dòng)態(tài)取證中一項(xiàng)關(guān)鍵的環(huán)節(jié),通過(guò)分析可以辨識(shí)不良入侵,是保證數(shù)據(jù)庫(kù)安全的有效措施。在網(wǎng)絡(luò)還原或者重建的過(guò)程中,利用數(shù)據(jù)分析技術(shù)還可以將損失降到最低。網(wǎng)絡(luò)數(shù)據(jù)分析有兩種方式,一種是基本分析,另一種是深入分析,如果取證問(wèn)題比較簡(jiǎn)單,則利用基本分析方法就可以解決,但是如果取證比較復(fù)雜,并且要求比較高,則必須進(jìn)行深入數(shù)據(jù)分析。深入分析需要對(duì)重組網(wǎng)絡(luò)數(shù)據(jù)以及來(lái)源進(jìn)行分析,還需要對(duì)數(shù)據(jù)間的關(guān)聯(lián)性進(jìn)行分析,通過(guò)數(shù)據(jù)分析還可以還原與模擬網(wǎng)絡(luò)事件現(xiàn)場(chǎng)。動(dòng)態(tài)取證技術(shù)也具有一定缺點(diǎn),在取證的過(guò)程中存在漏報(bào)或者誤報(bào)的情況。
3數(shù)據(jù)挖掘技術(shù)在動(dòng)態(tài)取證系統(tǒng)中的應(yīng)用
基于數(shù)據(jù)挖掘的計(jì)算機(jī)動(dòng)態(tài)取證技術(shù),與傳統(tǒng)的動(dòng)態(tài)取證技術(shù)相比,有著較大的優(yōu)勢(shì),其可以對(duì)海量收集的數(shù)據(jù)進(jìn)行實(shí)時(shí)取證分析,而且準(zhǔn)確性比較高,其具有關(guān)聯(lián)分析的特點(diǎn),可以對(duì)與案件有關(guān)的信息或者電子證據(jù)進(jìn)行快速的查找。這一過(guò)程需要利用數(shù)據(jù)分析模塊,在對(duì)數(shù)據(jù)進(jìn)行分析時(shí),需要對(duì)犯罪證據(jù)進(jìn)行篩選,動(dòng)態(tài)分析最大的優(yōu)點(diǎn)是可以對(duì)實(shí)時(shí)數(shù)據(jù)進(jìn)行獲取,在黑客對(duì)原始數(shù)據(jù)進(jìn)行篡改或者刪除時(shí),這項(xiàng)技術(shù)可以對(duì)這些犯罪過(guò)程詳細(xì)的記錄下來(lái)?;跀?shù)據(jù)挖掘的動(dòng)態(tài)取證技術(shù)具有高效性以及可擴(kuò)展性,利用數(shù)據(jù)挖掘技術(shù),可以對(duì)海量的、不完全或者模糊的數(shù)據(jù)進(jìn)行潛在價(jià)值的分析。基于數(shù)據(jù)挖掘的計(jì)算機(jī)動(dòng)態(tài)取證技術(shù)主要有:
3.1關(guān)聯(lián)分析
關(guān)聯(lián)分析是基于數(shù)據(jù)挖掘的計(jì)算機(jī)動(dòng)態(tài)取證技術(shù)一大特征,利用關(guān)聯(lián)規(guī)則,可以對(duì)相關(guān)數(shù)據(jù)進(jìn)行深層挖掘,通過(guò)關(guān)聯(lián)分析可以掌握犯罪行為的關(guān)聯(lián)性特征,這些特征有些已經(jīng)經(jīng)過(guò)了預(yù)處理,所以,相關(guān)工作這需要做好審查以及審計(jì)工作,要通過(guò)相關(guān)規(guī)則對(duì)用戶犯罪特征以及規(guī)律進(jìn)行總結(jié)。為了保證數(shù)據(jù)動(dòng)態(tài)取證的安全性,需要在系統(tǒng)中設(shè)置加密軟件,還要將入侵信息反饋到檢測(cè)系統(tǒng)中,這樣可以提高數(shù)據(jù)分析的效率,還可以實(shí)現(xiàn)實(shí)時(shí)動(dòng)態(tài)取證。
3.2分類分析
分類分析就是通過(guò)對(duì)分析示例數(shù)據(jù)庫(kù)中的相關(guān)數(shù)據(jù)進(jìn)行分析,準(zhǔn)確描述出每個(gè)類別的特征,建立分析模型,挖掘出分類的規(guī)則,將其它數(shù)據(jù)庫(kù)中的記錄傳送到分類規(guī)則中,在動(dòng)態(tài)取證系統(tǒng)的數(shù)據(jù)采集模塊收集了用戶或程序足夠數(shù)據(jù)后,在取證的數(shù)據(jù)分析階段,應(yīng)用分類的相關(guān)規(guī)則來(lái)判斷用戶或程序是否非法。應(yīng)用分類樣品數(shù)據(jù)來(lái)訓(xùn)練數(shù)據(jù)分析器的學(xué)習(xí),還預(yù)測(cè)一些未知的數(shù)據(jù)是否具有犯罪證據(jù)。
4結(jié)語(yǔ)
關(guān)鍵詞:數(shù)據(jù)挖掘 客戶關(guān)系管理 企業(yè)發(fā)展
企業(yè)管理中客戶關(guān)系的管理必不可少,并且良好的管理有利于企業(yè)發(fā)展,有利于企業(yè)獲取更大的財(cái)富,有利于企業(yè)實(shí)現(xiàn)自己的價(jià)值,所以保障對(duì)企業(yè)客戶關(guān)系的管理。數(shù)據(jù)挖掘技術(shù)就是一個(gè)可以幫助企業(yè)對(duì)客戶關(guān)系進(jìn)行有效的管理的工具。
一、數(shù)據(jù)挖掘和客戶關(guān)系管理含義
數(shù)據(jù)挖掘技術(shù)(Data Mining可以簡(jiǎn)稱為DM),簡(jiǎn)單來(lái)說(shuō),就是一種把隱藏在大型數(shù)據(jù)庫(kù)或者數(shù)據(jù)倉(cāng)庫(kù)中所需要的有用信息提取出來(lái)的新技術(shù),這是一個(gè)對(duì)數(shù)據(jù)庫(kù)進(jìn)行研究的非常有價(jià)值的領(lǐng)域。數(shù)據(jù)挖掘技術(shù)可以幫助用戶從數(shù)據(jù)庫(kù)中準(zhǔn)確的提取出有用的商業(yè)信息,為用戶在進(jìn)行決策時(shí)提供重要的支持。
客戶關(guān)系管理(Customer Relationship Management可以簡(jiǎn)稱為CRM),也有人稱之為“顧客關(guān)系管理”,關(guān)于客戶關(guān)系管理的定義,目前有兩種說(shuō)法:一,最早的Gartner Group定義為一種商業(yè)策略,就是把客戶進(jìn)行分類,并依據(jù)分類情況來(lái)對(duì)企業(yè)的資源進(jìn)行有效的組織,進(jìn)而企業(yè)的業(yè)務(wù)流程實(shí)施以及經(jīng)營(yíng)活動(dòng)都要以客戶為核心來(lái)進(jìn)行,以此來(lái)提高企業(yè)的盈利能力以及客戶滿意度,取得最大利潤(rùn);二、是由CRMguru.com給出的定義,客戶關(guān)系管理就是一個(gè)在企業(yè)的營(yíng)銷、銷售以及服務(wù)的業(yè)務(wù)范圍內(nèi),把企業(yè)現(xiàn)有的客戶以及潛在客戶,還有業(yè)務(wù)伙伴多渠道進(jìn)行管理的過(guò)程,或者說(shuō)技術(shù)。
二、數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用
隨著社會(huì)經(jīng)濟(jì)的不斷發(fā)展,市場(chǎng)競(jìng)爭(zhēng)力也在逐步的增大,商家想要獲得最好的利益,就必須對(duì)市場(chǎng)的變化迅速的做出反應(yīng),能夠引起市場(chǎng)變化的重要因素就是客戶需求的變化,也就是說(shuō),企業(yè)必須集中注意力,觀察客戶需求的每一變化,并把這些資料收集在一起,作為企業(yè)發(fā)展的寶貴資源進(jìn)行管理。在企業(yè)管理客戶信息的過(guò)程中,就需要應(yīng)用到了數(shù)據(jù)挖掘技術(shù)。
數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用過(guò)程中,主要方法有:神經(jīng)網(wǎng)絡(luò)法、遺傳算法、決策樹(shù)法、粗糙決算法以及可視化技術(shù)、K—最近鄰技術(shù)等,每個(gè)公司的客戶關(guān)系不同、需求也不同,所以要用到的方法也不同。
數(shù)據(jù)挖掘技術(shù)主要應(yīng)用于客戶關(guān)系管理中的這幾個(gè)方面:(1)挖掘新客戶,數(shù)據(jù)挖掘技術(shù)可以對(duì)現(xiàn)有的客戶信息和市場(chǎng)環(huán)境進(jìn)行統(tǒng)計(jì)總結(jié)以及歸納,準(zhǔn)確的確定潛在客戶以及市場(chǎng)目標(biāo)。因?yàn)閿?shù)據(jù)挖掘技術(shù)具有統(tǒng)計(jì)、聚類和關(guān)聯(lián)的作用,比如說(shuō),數(shù)據(jù)挖掘技術(shù)在數(shù)據(jù)庫(kù)中發(fā)現(xiàn)了這樣一個(gè)信息“某客戶在購(gòu)買A商品之后,過(guò)了一段時(shí)間又購(gòu)買了B商品,最后還購(gòu)買了C商品”那么數(shù)據(jù)挖掘技術(shù)就會(huì)通過(guò)次序關(guān)聯(lián),把這個(gè)信息形成“A—B—C”的行為模式。(2)可以保持優(yōu)質(zhì)客戶?,F(xiàn)在社會(huì)競(jìng)爭(zhēng)相當(dāng)激烈,企業(yè)客戶更是企業(yè)發(fā)展的重要因素,優(yōu)質(zhì)客戶對(duì)每個(gè)企業(yè)來(lái)說(shuō)就更加的重要。數(shù)據(jù)挖掘技術(shù)可以對(duì)數(shù)據(jù)庫(kù)中的流失客戶信息進(jìn)行分析,并且對(duì)流失客戶的特征進(jìn)行準(zhǔn)確的描述,然后利用關(guān)聯(lián)、近鄰的方式對(duì)整個(gè)數(shù)據(jù)庫(kù)中的消費(fèi)客戶信息進(jìn)行分析,分析出容易流失的客戶,隨后就需要采取相應(yīng)的措施來(lái)減少這些客戶的流失,尤其是那些可能流失的優(yōu)質(zhì)客戶,更要采取有力的措施來(lái)進(jìn)行挽留。(3)可以提升客戶價(jià)值。目前提升現(xiàn)有客戶的價(jià)值的方式有兩個(gè):一是提供特色服務(wù)或者產(chǎn)品;二是銷售新產(chǎn)品或者服務(wù)。想要準(zhǔn)確的提升客戶價(jià)值,就需要數(shù)據(jù)挖掘技術(shù)的幫助了,他可以把之前的客戶信息研究分析,并依據(jù)新產(chǎn)品或者服務(wù)的特征,發(fā)現(xiàn)和客戶的已購(gòu)買產(chǎn)品之間的關(guān)聯(lián),因而準(zhǔn)確的找到具有最大購(gòu)買趨勢(shì)的客戶。
三、加強(qiáng)客戶關(guān)系管理中數(shù)據(jù)挖掘的意義
應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)客戶關(guān)系進(jìn)行管理,可以有效的提高企業(yè)的核心競(jìng)爭(zhēng)力,現(xiàn)代社會(huì)的激烈競(jìng)爭(zhēng),也就是對(duì)客戶的競(jìng)爭(zhēng),數(shù)據(jù)挖掘技術(shù)對(duì)企業(yè)的客戶關(guān)系進(jìn)行詳細(xì)的分析,并為企業(yè)提供有價(jià)值的商業(yè)信息,為企業(yè)的重大決策提供了重要的參考依據(jù),進(jìn)而有力的提高了企業(yè)的核心競(jìng)爭(zhēng)力;可以有力的增強(qiáng)企業(yè)的執(zhí)行力,利用信息技術(shù)對(duì)客戶關(guān)系進(jìn)行管理,降低成本,并簡(jiǎn)化執(zhí)行任務(wù),有效的實(shí)現(xiàn)了資源共享,大力的提高了企業(yè)的自動(dòng)化水平,企業(yè)職工的執(zhí)行能力也進(jìn)一步得到了提高,也就是增強(qiáng)了企業(yè)的執(zhí)行力[3];可以為企業(yè)的下一步戰(zhàn)略發(fā)展提供幫助,數(shù)據(jù)挖掘技術(shù)對(duì)現(xiàn)今的市場(chǎng)環(huán)境進(jìn)行分析,可以預(yù)測(cè)到每個(gè)業(yè)務(wù)的發(fā)展?fàn)顟B(tài),以及每個(gè)業(yè)務(wù)與發(fā)生過(guò)的商業(yè)行為之間的關(guān)系,有了這些信息,可以準(zhǔn)確的制定企業(yè)未來(lái)的發(fā)展戰(zhàn)略,并且可以制定與市場(chǎng)環(huán)境相適應(yīng)的營(yíng)銷策略。
綜上所述,目前數(shù)據(jù)挖掘技術(shù)是企業(yè)進(jìn)行客戶關(guān)系管理的最有效的工具,準(zhǔn)確的掌握了客戶信息,就是準(zhǔn)確的把握了市場(chǎng)需求,可以為企業(yè)制定完全適應(yīng)于市場(chǎng)的發(fā)展方向。數(shù)據(jù)挖掘技術(shù)的關(guān)鍵作用就是找出潛在客戶,保留忠誠(chéng)客戶,并利用企業(yè)有限的資源,對(duì)這些客戶提供最好的服務(wù),促進(jìn)企業(yè)的不斷發(fā)展。
參考文獻(xiàn):
[1]張榮耀.基于數(shù)據(jù)挖掘的客戶關(guān)系管理研究[D].武漢理工大學(xué), 碩士學(xué)位論文,2004,11
文獻(xiàn)標(biāo)識(shí)碼:A
計(jì)算機(jī)領(lǐng)域新技術(shù)應(yīng)用使各行業(yè)生成、收集和存儲(chǔ)了大量數(shù)據(jù)。大量信息數(shù)據(jù)給社會(huì)帶來(lái)方便也帶來(lái)大堆問(wèn)題:信息過(guò)量,難以消化;信息真假難以辨識(shí);信息安全難以保證;信息形式不一致而難以統(tǒng)一處理。一般數(shù)據(jù)庫(kù)系統(tǒng)可高效實(shí)現(xiàn)數(shù)據(jù)錄入、查詢與統(tǒng)計(jì)等功能,卻無(wú)法發(fā)現(xiàn)數(shù)據(jù)存在的關(guān)系和規(guī)則。如何辨析信息和如何不被信息淹沒(méi)已經(jīng)成為現(xiàn)實(shí)問(wèn)題。一、數(shù)據(jù)挖掘直面數(shù)據(jù)豐富而知識(shí)匱乏的挑戰(zhàn)
面對(duì)信息社會(huì)帶來(lái)的“數(shù)據(jù)豐富而知識(shí)匱乏”的現(xiàn)實(shí)挑戰(zhàn),數(shù)據(jù)挖掘(Data Mining,DM)和知識(shí)發(fā)現(xiàn)(Knowledge Discovery,KD)技術(shù)應(yīng)運(yùn)而生,伴隨計(jì)算機(jī)新技術(shù)和新理論的出現(xiàn)而發(fā)展,在電信與銀行,生物及大型超市等領(lǐng)域運(yùn)用效果顯著。數(shù)據(jù)挖掘有時(shí)又稱作數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)(KDD),此術(shù)語(yǔ)出現(xiàn)于1989年,從數(shù)據(jù)集識(shí)別有效與新穎的,潛在有用的,最終可理解的模式過(guò)程。KDD過(guò)程常指多階段處理,包括數(shù)據(jù)準(zhǔn)備與模式搜索,知識(shí)評(píng)價(jià)及反復(fù)修改求精;該過(guò)程要有智能性和自動(dòng)性。有效性指發(fā)現(xiàn)新數(shù)據(jù)仍保持可信度,新穎性要求模式應(yīng)是新的,潛在有用性指發(fā)現(xiàn)的知識(shí)將來(lái)有效用,最終可理解性要求發(fā)現(xiàn)模式能被用戶所理解,幾項(xiàng)綜合在一起稱為數(shù)據(jù)的科學(xué)性豍。
數(shù)據(jù)挖掘的界定。數(shù)據(jù)挖掘是從存放在數(shù)據(jù)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)或其它存儲(chǔ)信息庫(kù)中的海量數(shù)據(jù)挖掘有趣知識(shí)過(guò)程。一般的定義是:數(shù)據(jù)挖掘是從大量、不完全、有噪聲、模糊、隨機(jī)的數(shù)據(jù)中抽取隱含其中,事先不為人所知、潛在、有效、新穎、有用和最終可理解知識(shí)的過(guò)程。研究人工智能學(xué)術(shù)人員和計(jì)算機(jī)技術(shù)專家通常所說(shuō)數(shù)據(jù)挖掘名稱各異但實(shí)質(zhì)一樣。自然世界數(shù)據(jù)以多種多樣形式存放,除最常見(jiàn)數(shù)字與字符等類型,還有許多復(fù)雜數(shù)據(jù)。復(fù)雜類型數(shù)據(jù)挖掘包括:空間數(shù)據(jù)挖掘和多媒體數(shù)據(jù)挖掘,時(shí)序數(shù)據(jù)挖掘和文本數(shù)據(jù)挖掘,Web數(shù)據(jù)挖掘與流數(shù)據(jù)挖掘等。數(shù)據(jù)挖掘與傳統(tǒng)數(shù)學(xué)統(tǒng)計(jì)分析有區(qū)別,數(shù)據(jù)挖掘在沒(méi)有明確假設(shè)前提下自動(dòng)建立方程,可采用不同類型如文本、聲音、圖片等的數(shù)據(jù)挖掘興趣模式;統(tǒng)計(jì)數(shù)據(jù)分析工具側(cè)重被動(dòng)分析,需建立方程或模型來(lái)與假設(shè)吻合,最終面對(duì)數(shù)字化數(shù)據(jù);數(shù)據(jù)挖掘是主動(dòng)發(fā)現(xiàn)型與預(yù)測(cè)型數(shù)據(jù)分析工具,分析重點(diǎn)在于預(yù)測(cè)未來(lái)未知潛在情況并解釋原因。二、軟件工程的產(chǎn)生與數(shù)據(jù)實(shí)用性
軟件工程概念源自軟件危機(jī),20世紀(jì)60年代末的“軟件危機(jī)”這個(gè)詞語(yǔ)頻繁出現(xiàn)計(jì)算機(jī)軟件領(lǐng)域,泛指計(jì)算機(jī)軟件開(kāi)發(fā)和維護(hù)所遇到的系列嚴(yán)重問(wèn)題。在軟件開(kāi)發(fā)和維護(hù)過(guò)程中的軟件危機(jī)表現(xiàn)為軟件需求的增長(zhǎng)得不到滿足,軟件開(kāi)發(fā)成本和進(jìn)度無(wú)法控制,軟件質(zhì)量難保證,軟件維護(hù)程度非常低,軟件成本不斷提高,軟件開(kāi)發(fā)生產(chǎn)率趕不上計(jì)算機(jī)硬件發(fā)展和各種應(yīng)用需求增長(zhǎng)等。軟件危機(jī)產(chǎn)生的宏觀原因是軟件日益深入社會(huì)生活,軟件需求增長(zhǎng)速度超過(guò)軟件生產(chǎn)率提高,具體軟件工程任務(wù)的許多困難來(lái)源于軟件工程所面臨任務(wù)和其他工程之間各種差異以及軟件和其他工業(yè)產(chǎn)品的差異,即特殊性。軟件開(kāi)發(fā)和維護(hù)過(guò)程存在的問(wèn)題,與計(jì)算機(jī)軟件本身特點(diǎn)有關(guān),軟件開(kāi)發(fā)過(guò)程進(jìn)度很難衡量,軟件質(zhì)量難以評(píng)價(jià),管理和控制軟件開(kāi)發(fā)過(guò)程困難等。計(jì)算機(jī)軟件專家認(rèn)真研究解決軟件危機(jī)方法,逐步形成軟件工程概念,開(kāi)辟工程學(xué)新領(lǐng)域即軟件工程學(xué)。軟件工程用工程、科學(xué)和數(shù)學(xué)原理與方法研制與維護(hù)計(jì)算機(jī)軟件有關(guān)技術(shù)及管理的方法。
軟件工程針對(duì)數(shù)據(jù)的處理具有系統(tǒng)的規(guī)范的系列辦法。1993年IEEE(電氣和電子工程師學(xué)會(huì))給軟件工程綜合定義為:將系統(tǒng)化、規(guī)范和可度量的方法應(yīng)用于軟件開(kāi)發(fā)、測(cè)試、運(yùn)行和維護(hù)全過(guò)程,即將工程化應(yīng)用于軟件數(shù)據(jù)等設(shè)計(jì)中。軟件工程包括方法、工具和過(guò)程三個(gè)要素,方法是完成軟件工程項(xiàng)目技術(shù)手段;工具支持軟件開(kāi)發(fā)、管理與文檔生成;過(guò)程支持軟件開(kāi)發(fā)各個(gè)環(huán)節(jié)控制與管理。軟件工程的發(fā)展伴隨計(jì)算機(jī)與數(shù)據(jù)等相關(guān)技術(shù)的發(fā)展而進(jìn)步。三、軟件工程的知識(shí)庫(kù)應(yīng)用數(shù)據(jù)挖掘技術(shù)
蘊(yùn)含數(shù)據(jù)的特殊軟件的生命周期也是一個(gè)極其復(fù)雜演變過(guò)程,各個(gè)階段都會(huì)產(chǎn)生大量軟件數(shù)據(jù)。在設(shè)計(jì)文檔與程序源代碼,交流歷史與Bug報(bào)告,軟件運(yùn)行日志等方面產(chǎn)生的大量數(shù)據(jù),必然存在著對(duì)軟件開(kāi)發(fā)和維護(hù)具有重要價(jià)值的信息。如能充分利用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)這些數(shù)據(jù)隱藏的知識(shí),可提高開(kāi)發(fā)效率并避免錯(cuò)誤,增強(qiáng)軟件系統(tǒng)運(yùn)行穩(wěn)定性和可信性。利用數(shù)據(jù)挖掘技術(shù)處理軟件產(chǎn)生大量數(shù)據(jù)想法在上世紀(jì)70年代就出現(xiàn),但直到最近軟件數(shù)據(jù)挖掘領(lǐng)域才受到越來(lái)越多學(xué)者關(guān)注豏。軟件工程國(guó)際會(huì)議出現(xiàn)關(guān)于軟件數(shù)據(jù)挖掘研究工作組,許多數(shù)據(jù)挖掘會(huì)議與期刊陸續(xù)出現(xiàn)多篇高質(zhì)量與軟件工程相關(guān)學(xué)術(shù)論文,軟件數(shù)據(jù)挖掘已成為越來(lái)越關(guān)注熱點(diǎn)的研究領(lǐng)域。
數(shù)據(jù)報(bào)告 數(shù)據(jù)采集論文 數(shù)據(jù)安全論文 數(shù)據(jù)采集 數(shù)據(jù)挖掘總結(jié) 數(shù)據(jù)安全 數(shù)據(jù)統(tǒng)計(jì)論文 數(shù)據(jù)挖掘 數(shù)據(jù)理論論文 數(shù)據(jù)通信論文 紀(jì)律教育問(wèn)題 新時(shí)代教育價(jià)值觀