99精品久久这里只有精品,三上悠亚免费一区二区在线,91精品福利一区二区,爱a久久片,无国产精品白浆免费视,中文字幕欧美一区,爽妇网国产精品,国产一级做a爱免费观看,午夜一级在线,国产精品偷伦视频免费手机播放

    <del id="eyo20"><dfn id="eyo20"></dfn></del>
  • <small id="eyo20"><abbr id="eyo20"></abbr></small>
      <strike id="eyo20"><samp id="eyo20"></samp></strike>
    • 首頁 > 文章中心 > 正文

      電子商務數(shù)據(jù)挖掘技術

      前言:本站為你精心整理了電子商務數(shù)據(jù)挖掘技術范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。

      電子商務數(shù)據(jù)挖掘技術

      [摘要]本文對電子商務Web頁數(shù)據(jù)挖掘技術做了全面分析,對于個性化電子商務網(wǎng)站中難以發(fā)現(xiàn)用戶興趣行為特征問題,給出了Web頁面關聯(lián)算法。利用數(shù)據(jù)倉庫技術可有效挖掘用戶興趣特征,從而指導電子商務網(wǎng)站資源的組織和分配,為商務型網(wǎng)站的投資者和建立者提供正確的盈利導向。

      [關鍵詞]電子商務數(shù)據(jù)挖掘興趣特征

      數(shù)據(jù)挖掘技術是隨著數(shù)據(jù)庫技術和人工智能技術發(fā)展起來的一種新型的交叉信息技術。無論是B2B、B2C還是B2G電子商務模式,商品的采購者都需要通過Web方式與商品的供應商及其合作者之間建立信息流的交互,面向電子商務的數(shù)據(jù)挖掘的特點就是從Web數(shù)據(jù)庫中,運用關聯(lián)、分類、聚類等技術手段,從中提取出可以指導市場策略的有用數(shù)據(jù)。它基于“消費者過去的行為預示著其今后的消費傾向”的原理,通過收集、分析和處理從網(wǎng)上獲取的有關消費者消費行為的數(shù)據(jù),從潛在的、隱含的、事先不知的狀態(tài),經(jīng)過提取、洗滌、加工變?yōu)闈摿薮蟮膬r值信息,從而實現(xiàn)網(wǎng)絡營銷的目的,確定特定消費群體或個體的消費習慣、愛好、傾向,進而預示出消費者下一步的消費行為,有針對性地提供服務。

      一、電子商務Web數(shù)據(jù)挖掘技術

      1.電子商務Web數(shù)據(jù)挖掘技術的分類

      電子商務Web數(shù)據(jù)挖掘一般可分為三個部分:內(nèi)容挖掘、結構挖掘、用法挖掘。Web內(nèi)容挖掘有兩種策略:直接挖掘文檔內(nèi)容和在其他檢索工具搜索的基礎上進行改進。Web結構挖掘是從WWW上的組織結構和鏈接關系中推導知識。Web用法挖掘的主要目標是從Web的訪問記錄中抽取感興趣的模式。大多數(shù)基于數(shù)據(jù)庫的數(shù)據(jù)挖掘方法均可作用于電子商務Web數(shù)據(jù)挖掘。

      在研究以電子商務網(wǎng)上購物為應用背景的工作時發(fā)現(xiàn)。商家在Web上建立自己的在線商品目錄,顧客(即用戶)通過瀏覽器可以瀏覽商品目錄、實現(xiàn)網(wǎng)上訂購甚至網(wǎng)上支付等。用戶與商家的Web服務器間交互的過程信息(包括用戶的登錄信息、用戶的瀏覽記錄)以及用戶的個人簡要信息等,都能以日志文件或顧客數(shù)據(jù)庫的形式存在,從中找出規(guī)律性,對商家的市場銷售是至關重要的;從大量顧客數(shù)據(jù)及日志數(shù)據(jù)中,應用到計算機并行處理、神經(jīng)元網(wǎng)絡、模型化算法和其他信息處理技術手段,挖掘出有意義的用戶訪問模式及相關的潛在顧客群,從中可得到商家用于向特定消費群體或個體進行定向營銷的決策信息。同時有效地對這些Web日志進行定量分析,揭示其中的關聯(lián)關系、時序關系、頁面類屬關系、客戶類屬關系和頻繁訪問路徑、頻繁訪問頁面等,不但可為優(yōu)化Web站點拓撲結構提供參考,而且還可為企業(yè)更有效地確認目標市場、改進決策獲得更大的競爭優(yōu)勢提供幫助。

      2.電子商務Web數(shù)據(jù)挖掘模型構建和基本流程

      電子商務Web服務器自動收集客戶瀏覽信息并保存在訪問日志、引用日志和日志中。典型的電子商務Web服務器日志文件包括以下信息:IP地址,請求時間,方法(如get),被請求文件的URL,HTTP版本號,返回碼,傳輸字節(jié)數(shù),引用頁的URL和。

      電子商務Web挖掘,首先對日志文件進行預處理,預處理主要由兩部分構成:數(shù)據(jù)清洗(datacleaning)和事務識別(transactionidentification)。包括對Web日志進行清洗、過濾和轉(zhuǎn)換以及無關記錄的剔除,判斷是否有重要的訪問沒有被記錄,并從中抽取感興趣的數(shù)據(jù);并將URL、資源的類型、大小、請求的時間、在資源上停留的時間、請求者的Internet域名、用戶、服務器狀態(tài)作為數(shù)據(jù)cube的維數(shù)變量;再將對模塊、頁面和文件請求次數(shù),來自不同Internet域請求次數(shù)、事件、會話、帶寬、錯誤次數(shù)、不同瀏覽器種類、用戶所在組織作為度量變量建立datacube;而將文件、圖像腳本及多媒體等其他文件轉(zhuǎn)換成可用于Web使用挖掘的數(shù)據(jù)格式,從而可將數(shù)據(jù)挖掘技術用于Web流量分析、典型的事件序列分析和用戶行為模式分析及事務分析。

      定義函數(shù)log={ip,uid,url,time}表示電子商務Web服務器日志。其中,ip,uid,url,time分別標識客戶ip、客戶id、客戶請求的url和瀏覽時間。

      在經(jīng)過數(shù)據(jù)預處理階段后,即可針對電子商務中不同的挖掘目標可以采用不同的數(shù)據(jù)挖掘方法,選擇數(shù)據(jù)挖掘模式,如統(tǒng)計分析、關聯(lián)規(guī)則、時序模式、路徑分析(pathanalysis)及聚類、分類技術。

      進行實際的挖掘操作的要點有:首先決定如何產(chǎn)生假設;選擇合適的工具;發(fā)掘知識的操作;證實發(fā)現(xiàn)的知識。

      二、基于興趣的關聯(lián)算法在電子商務中的Web挖掘應用

      關聯(lián)分析是尋找在同一個事件中出現(xiàn)的不同項的相關性,比如在一次購買活動中所買不同商品的相關性。序列模式與此類似,它尋找的是事件之間時間上的相關性,假設I={i1,i2,…,im}是所有項的集合,相當于商品的所有種類的集合,D是所有事務的集合,也即數(shù)據(jù)庫中記錄的集合,事務T={t1,t2,…,tn},tiI,相當于交易中的商品列表。設X是一個I中項的集合,如果XTk,那么稱交易Tk包含項集X,若X,Y為項集,XI,YI,并且X⌒Y=Φ,則形如X==>Y的表達式稱為關聯(lián)規(guī)則。

      計算方法:

      交易數(shù)據(jù)集中同時包含X和Y的交易數(shù)與所有交易數(shù)之比:

      support(XY)=P(X∪Y)=|{T:XYT,T∈D}|/|D|×100%(其中|D|是交易數(shù)據(jù)集D中的所有交易數(shù)),給定一個交易集D,挖掘關聯(lián)規(guī)則問題就是產(chǎn)生支持度和可信度分別大于用戶給定的最小支持度(minsupp)和最小確信度(minconf)的關聯(lián)規(guī)則。當規(guī)則的確信度和支持度分別大于minsupp、minconf時,我們認為規(guī)則是有效的,稱為強關聯(lián)規(guī)則。當數(shù)據(jù)項集X的支持度大于minsupp時,稱X為高頻數(shù)據(jù)項集。

      關聯(lián)規(guī)則發(fā)現(xiàn)任務的本質(zhì)是要在數(shù)據(jù)庫中發(fā)現(xiàn)強關聯(lián)規(guī)則。在電子商務中關聯(lián)規(guī)則的發(fā)現(xiàn)也就是要找到客戶對網(wǎng)站上各種文件之間訪問的相互聯(lián)系。例如,用關聯(lián)規(guī)則發(fā)現(xiàn)技術,我們可以找到以下的相關性:40%的客戶訪問頁面/company/product1

      時,也訪問了/company/product2。30%的客戶在訪問/company/special時,在/company/product1進行了在線定購。利用這些相關性,可以更好的組織站點,實施有效的市場策略。

      三、數(shù)據(jù)挖掘技術的工具

      隨著電子商務和數(shù)據(jù)庫技術的發(fā)展,越來越多的公司、廠家開始開發(fā)數(shù)據(jù)挖掘工具。如Oracle公司通過從ThinkingMachine公司獲得Darwin產(chǎn)品來增強其數(shù)據(jù)挖掘功能;IBM公司的IntelligentMiner提供了基于DB2的數(shù)據(jù)挖掘能力,提供了支持C++類和方法的API(應用程序接口);SAS公司推出的SAS/EM(EnterpriseMiner)數(shù)據(jù)挖掘軟件可以對Oracle、Informix、Sybase、DB2的數(shù)據(jù)集進行操作。Accrue公司更是推出了一個綜合性Web數(shù)據(jù)挖掘工具,能夠?qū)W(wǎng)站的運行狀況進行深入、細致和準確的分析。

      四、小結

      電子商務Web數(shù)據(jù)挖掘很好地解決了從數(shù)據(jù)到知識轉(zhuǎn)化的問題,為我國的商務網(wǎng)站個性化定制提供了技術的可行性,并為網(wǎng)站實現(xiàn)經(jīng)濟效益提供了一條發(fā)展的新路。

      欧美丝袜激情办公室在线观看| 国产欧美日韩精品专区| 真人无码作爱免费视频禁hnn| 永久无码在线观看| 国产av区亚洲av毛片| 高清日韩av在线免费观看| 国产伦人人人人人人性| 麻豆精产国品| 国产一区二区三区亚洲天堂| 亚洲黄色av一区二区三区| 先锋五月婷婷丁香草草| 欧美多毛肥胖老妇做爰| 白白视频在线免费观看| 国产亚洲精品一区在线| 18禁黄污吃奶免费看网站| 亚洲综合色丁香婷婷六月图片| 丝袜 亚洲 另类 欧美| 国产黑丝美女办公室激情啪啪 | 久久久久久久久中文字幕| 国产精品久久av色婷婷网站| 久久人人爽爽爽人久久久| 18禁男女爽爽爽午夜网站免费| 国产人妖一区二区在线| 国产乱码精品一区二区三区久久| 国产盗摄xxxx视频xxxx| 中文字幕无码人妻丝袜| 人妻露脸国语对白字幕| 国产精品久久精品第一页| 久久精品国产自清天天线| 麻豆成年视频在线观看| 亚洲精品第一页在线观看| 2021久久精品国产99国产精品 | 亚洲视频99| 亚洲天堂av在线免费播放 | 久久久久亚洲av片无码| 久久久国产精品ⅤA麻豆| 免费啪啪av人妻一区二区| 中文字幕无码乱人伦| 把插八插露脸对白内射| 黑人一区二区三区在线| 蜜桃传媒一区二区亚洲av婷婷|