久久精品99久久|国产剧情网站91|天天色天天干超碰|婷婷五天月一av|亚州特黄一级片|亚欧超清无码在线|欧美乱码一区二区|男女拍拍免费视频|加勒比亚无码人妻|婷婷五月自拍偷拍

電子商務畢業(yè)論文

Web數(shù)據(jù)挖掘技術在電子商務中的應用論文

時間:2022-10-09 08:18:31 電子商務畢業(yè)論文 我要投稿
  • 相關推薦

Web數(shù)據(jù)挖掘技術在電子商務中的應用論文

  電子商務的迅猛發(fā)展產生了海量的Web數(shù)據(jù),從電子商務的大數(shù)據(jù)中發(fā)現(xiàn)潛在的、有用的知識和信息,是電子商務健康發(fā)展的需要。在電子商務中應用Web數(shù)據(jù)挖掘技術,可實現(xiàn)從電子商務的Web文檔和Web活動中抽取出隱藏的有用模式。本文通過介紹Web數(shù)據(jù)挖掘技術,分析其在電子商務中的挖掘流程,對其在電子商務中的具體應用進行了探討。

Web數(shù)據(jù)挖掘技術在電子商務中的應用論文

  0 引言

  我國電子商務交易量增長迅猛,電子商務平臺和網站越來越多,數(shù)據(jù)呈現(xiàn)爆炸式增長。面對海量的Web數(shù)據(jù),對企業(yè)而言,構建良好的客戶管理關系,吸引新客戶留住老客戶,發(fā)現(xiàn)顧客潛在的購買興趣等都成為了企業(yè)要關注的問題。

  對用戶而言,如何從爆炸式的大數(shù)據(jù)中發(fā)現(xiàn)與自己相關的信息存在一定的難度。數(shù)據(jù)挖掘技術是一種從大量的、不完全的、有噪聲的、隨機的、模糊的數(shù)據(jù)中提取隱含在其中的人們事先不知道的,但又具有潛在價值的信息和知識的技術[1-2]。在電子商務中應用數(shù)據(jù)挖掘技術,從已有的信息數(shù)據(jù)中挖掘出潛在的有用的信息,已成為人們關注和研究的熱點。

  1 Web數(shù)據(jù)挖掘

  Web數(shù)據(jù)挖掘是將傳統(tǒng)的數(shù)據(jù)挖掘思想和技術應用于Web環(huán)境中,從Web文檔集和Web活動中抽取出感興趣、潛在的、有用的模式和知識的過程。Web數(shù)據(jù)挖掘根據(jù)Web信息不同可以分為Web內容挖掘、Web結構挖掘和Web使用挖掘三個方面。

  Web內容挖掘是從文檔內容或其描述中直接抽取有用信息的過程,通過對文本內容的檢索,獲取和提煉知識和信息。

  用于Web內容挖掘的數(shù)據(jù)既有無結構的自由文本,也有網民留言、帖子、中文微博等半結構化的信息和來自于數(shù)據(jù)庫的結構數(shù)據(jù)。所以Web內容挖掘需要從Web頁面及后臺數(shù)據(jù)庫中開展挖掘任務,從大量元數(shù)據(jù)、文本、視頻、音頻等網絡數(shù)據(jù)集中找到特定的信息[2]。

  Web結構挖掘是從Web組織結構和鏈接中推導知識,對頁面進行分類、聚類,提高檢索效率和找出權威頁面,目的是發(fā)現(xiàn)頁面的內部結構和文檔間的結構,利用這些結構蘊含的信息幫助發(fā)現(xiàn)有用的知識和模式。

  超鏈接是Web頁面的基本元素,經?梢岳贸溄訉eb結構進行挖掘。進行Web結構挖掘的常用算法有計算頁面權威的PageRank算法、基于網頁分析的HITS算法等。

  Web使用挖掘是從服務器端記錄的用戶訪問日志或用戶的瀏覽信息中獲取數(shù)據(jù),通過分析這些數(shù)據(jù)抽取出隱藏在這些數(shù)據(jù)后面的用戶模式,進行預測性分析。通過Web使用挖掘,可以發(fā)現(xiàn)隱藏的與用戶訪問行為相關的規(guī)律,如頻繁訪問路徑、相似用戶群和相似的Web頁面等[3]。

  2 面向電子商務的Web數(shù)據(jù)挖掘

  2.1 Web數(shù)據(jù)挖掘過程

  在電子商務環(huán)境下,Web數(shù)據(jù)挖掘過程要經歷以下幾步,它是不斷反復修正的過程,直至得到準確的知識,如圖1所示。

  ⑴ 確定挖掘任務,建立挖掘模型。構建模型的任務主要是將數(shù)據(jù)進行規(guī)格化處理,使用不同的算法、調整參數(shù)來優(yōu)化挖掘任務,數(shù)據(jù)挖掘技術本身就是一個不斷反復、不斷迭代的過程,通過多次的循環(huán)構造才能得出更好的評估模型[2]。

 、 數(shù)據(jù)源:電子商務網站每天都會產生海量的交易數(shù)據(jù)和用戶訪問記錄,收集的數(shù)據(jù)數(shù)量和質量都會影響到挖掘的結果。由于Web的結構大體為客戶端→代理服務器→Web服務[4],所以Web的數(shù)據(jù)源主要有Web服務器上的Web日志文件、從代理服務器端收集信息及其從Web頁面中提取數(shù)據(jù)等。

  ⑶ 數(shù)據(jù)預處理:數(shù)據(jù)預處理的目的是提高挖掘效率,提供有效的挖掘數(shù)據(jù),使得結果更合理。Web文檔的數(shù)據(jù)很多都是半結構或非結構化的,很難對采集的Web數(shù)據(jù)直接進行處理。采集的Web數(shù)據(jù)需根據(jù)挖掘主題選擇相關的數(shù)據(jù)項,經過初步的篩選,縮小數(shù)據(jù)處理范圍。另外,Web數(shù)據(jù)具有不完全性、冗余性和模糊性等特性,通過補全不完全項、去除冗余項、處理模糊項等,去掉無用、不合理的數(shù)據(jù),最后生成標準的數(shù)據(jù)集。

  ⑷ 模式發(fā)現(xiàn):根據(jù)挖掘需求選擇合適的Web挖掘算法和工具,實現(xiàn)從數(shù)據(jù)集發(fā)現(xiàn)潛在的、有用的知識和模型。常用的Web挖掘算法有:路徑分析用來發(fā)現(xiàn)Web站點中最經常被訪問的路徑;關聯(lián)規(guī)則用于關聯(lián)知識的發(fā)現(xiàn),了解網頁之間的關系;序列模式可以挖掘出交易集之間有時間序列關系的模式;運用分類和聚類算法對數(shù)據(jù)進行分組等Web挖掘。

  ⑸ 模式分析:對于發(fā)現(xiàn)的模式進行驗證、解釋、說明,獲取對決策支持有用的信息。根據(jù)模式分析的反饋,如果沒有得到合適的結果,重復上述步驟,重新挖掘知識,直至得到滿意的結果。

 、 結果可視化:Web數(shù)據(jù)挖掘的意義不是獲取龐大的數(shù)據(jù)信息,而是要將獲取的知識或者模型采取用戶可理解的方式展現(xiàn)給用戶,這意味著要將分析結果可視化。數(shù)據(jù)可視化主要是借助于圖形化手段,依據(jù)數(shù)據(jù)本身及其內在的模式和關系,清晰有效地傳達與溝通信息。

  2.2 Web數(shù)據(jù)挖掘在電子商務中的應用

  將Web數(shù)據(jù)挖掘技術應用在電子商務中,從技術角度,可以提供優(yōu)化網站結構和頁面的策略;從商家角度,可以增加交叉銷售量,盡可能將瀏覽者變?yōu)橄M者;從用戶角度,為用戶提供了個性化服務。以下是Web數(shù)據(jù)挖掘在電子商務中的具體應用。

 、 改進站點的訪問效率。通過對Web結構和Web日志的分析,對Web頁面之間的組織關系、引用關系和超鏈接關系的分析,可以挖掘用戶網頁瀏覽行為模式、頁面瀏覽情況等,對頁面的重要性進行評估,有助于商家重新調整頁面結構和頁面布局,改進Web站點設計,提升訪問效率,吸引更多用戶。

  ⑵ 提供個性化服務。電子商務的快速發(fā)展,為用戶提供了更多的選擇,同時,面對電商網站眾多的商品和越來越復雜的網站結構,如何能快速查找到自己感興趣的商品是一個費時費力的問題。個性化服務是電子商務網站爭取更多用戶、防止用戶流失以及實現(xiàn)市場目標的重要手段。協(xié)同過濾算法是目前使用最多、應用最成熟的一種推薦技術[5]。在電子商務中,運用協(xié)同過濾等推薦算法,構建基于Web電子商務的個性化推薦系統(tǒng),可以制定不同的個性化營銷策略。

 、 商品推薦服務。運用聚類、分類、關聯(lián)規(guī)則等數(shù)據(jù)挖掘技術,可以從用戶的訪問數(shù)據(jù)中發(fā)現(xiàn)商品之間的聯(lián)系,挖掘用戶感興趣的商品。比如通過用戶購買商品A,推導出商品B也是用戶感興趣的商品。通過基于Web電子商務的智能推薦系統(tǒng),客戶可以在較短時間內購買到滿意的商品,同時增加商家的交叉銷售量。

 、 識別電子商務潛在客戶。通過對Web已有的老客戶數(shù)據(jù)的公共屬性、類別關鍵屬性及其屬性間的相互關系進行分析,建立分類模型。對于一個新的用戶,根據(jù)已建立的分類模型,對新用戶進行正確的分類,根據(jù)類別判斷用戶是否潛在客戶。

 、 理解客戶意圖。通過分析用戶的瀏覽路徑等多個數(shù)據(jù)源,運用路徑游歷模式等發(fā)現(xiàn)算法,發(fā)現(xiàn)被頻繁訪問的路徑,從而發(fā)現(xiàn)用戶的真實訪問意圖。

  3 結束語

  Web挖掘能夠在海量的大數(shù)據(jù)中尋找出潛在的有用的信息和知識,Web挖掘技術在電子商務中的應用越來越廣泛,制作基于Web挖掘的個性化推薦系統(tǒng)、智能化的電子商務系統(tǒng)已經成為電商網站的發(fā)展趨勢。但同時電子商務數(shù)據(jù)存在異構性、規(guī)模大、復雜性等特點,使得傳統(tǒng)的Web挖掘技術遇到挑戰(zhàn),下一步需要深入研究針對電子商務數(shù)據(jù)的Web挖掘算法。

【Web數(shù)據(jù)挖掘技術在電子商務中的應用論文】相關文章:

淺談數(shù)據(jù)挖掘在電子商務中的應用經濟論文10-10

復雜網絡數(shù)據(jù)挖掘論文11-15

分析電子商務中的數(shù)據(jù)安全論文04-26

PKI在電子商務中的應用論文10-13

微課在電子商務教學中的應用論文10-12

信息技術在小學教育中的應用的論文10-10

小學體育教學中教育技術的應用論文10-12

多媒體技術在初中數(shù)學中的應用論文10-11

大數(shù)據(jù)在旅游管理的應用論文10-12

Hadoop物聯(lián)網數(shù)據(jù)挖掘的算法分析論文10-10