<strike id="nmuq9"></strike>

    <rp id="nmuq9"></rp>
    <th id="nmuq9"><big id="nmuq9"></big></th>
    1. <object id="nmuq9"></object>
      <progress id="nmuq9"></progress>
    2. <th id="nmuq9"></th>

      注冊 | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
      讀書(shū)網(wǎng)-DuShu.com
      當前位置: 首頁(yè)出版圖書(shū)教育/教材/教輔教材研究生/本科/專(zhuān)科教材大數據采集與預處理技術(shù)(HDFS+HBase+Hive+Python 微課視頻版)

      大數據采集與預處理技術(shù)(HDFS+HBase+Hive+Python 微課視頻版)

      大數據采集與預處理技術(shù)(HDFS+HBase+Hive+Python 微課視頻版)

      定 價(jià):¥59.90

      作 者: 唐世偉,田楓,蓋璇,李學(xué)貴
      出版社: 清華大學(xué)出版社
      叢編項:
      標 簽: 暫缺

      購買(mǎi)這本書(shū)可以去


      ISBN: 9787302612247 出版時(shí)間: 2022-09-01 包裝: 平裝-膠訂
      開(kāi)本: 16開(kāi) 頁(yè)數: 字數:  

      內容簡(jiǎn)介

        本書(shū)主要介紹大數據關(guān)鍵技術(shù)中的大數據采集和數據預處理技術(shù),是大數據專(zhuān)業(yè)的入門(mén)級的專(zhuān)業(yè)基礎課教程(含教學(xué)課件、源代碼與視頻教程),旨在為學(xué)生搭建起大數據的知識架構,講述大數據采集和數據預處理的基本原理,開(kāi)展相關(guān)的實(shí)驗,為學(xué)生在大數據以及相關(guān)領(lǐng)域的學(xué)習奠定堅實(shí)的基礎。全書(shū)共分四部分:第一部分是理論基礎(第1~2章和第6章),主要介紹大數據技術(shù)、大數據采集和大數據預處理的基本概念以及基礎理論;第二部分是大數據采集(第3~5章),分別介紹3種大數據的采集方法、技術(shù)及4種工具;第三部分是大數據預處理(第7~8章),介紹4種大數據預處理技術(shù)、方法;第四部分是實(shí)驗指導(第9~11章),介紹大數據采集和大數據預處理的實(shí)驗平臺以及具體實(shí)驗的內容、方法、流程等。 為便于讀者高效學(xué)習,快速掌握大數據專(zhuān)業(yè)基礎知識。作者精心制作了完整的教學(xué)課件(11章PPT)與部分配套視頻教程(200分鐘)。本書(shū)可以作為高等院校計算機、電子信息、信息管理、軟件工程等專(zhuān)業(yè),尤其大數據相關(guān)專(zhuān)業(yè)的本科和碩士研究生教材或參考書(shū)。

      作者簡(jiǎn)介

      暫缺《大數據采集與預處理技術(shù)(HDFS+HBase+Hive+Python 微課視頻版)》作者簡(jiǎn)介

      圖書(shū)目錄

      第1章概述

      1.1大數據基礎

      1.1.1大數據的定義與特征

      1.1.2我國的大數據發(fā)展及趨勢

      1.1.3大數據的應用

      1.1.4大數據的層次架構

      1.2大數據技術(shù)

      1.2.1大數據關(guān)鍵技術(shù)

      1.2.2大數據支撐技術(shù)

      1.3大數據的影響及思維方式

      1.3.1大數據的影響

      1.3.2大數據的思維方式

      1.4大數據倫理及安全

      1.4.1大數據倫理

      1.4.2大數據安全

      1.5本章小結

      習題

      第2章大數據采集技術(shù)基礎

      2.1傳統數據采集技術(shù)

      2.1.1傳統數據采集及特點(diǎn)

      2.1.2傳統數據采集的硬件與軟件

      2.1.3傳統數據采集的關(guān)鍵技術(shù)

      2.2大數據采集基礎

      2.2.1大數據采集的概念

      2.2.2大數據采集的要點(diǎn)

      2.2.3大數據的來(lái)源

      2.2.4大數據采集的基本方法

      2.3大數據分布式文件系統

      2.3.1數據管理技術(shù)的發(fā)展

      2.3.2HDFS概述

      2.3.3HDFS特點(diǎn)

      2.3.4HDFS工作原理

      2.3.5HDFS的讀/寫(xiě)數據流程

      2.4分布式數據庫系統HBase

      2.4.1分布式關(guān)系數據庫系統的缺陷

      2.4.2HBase簡(jiǎn)介

      2.4.3HBase的數據模型關(guān)鍵要素

      2.4.4HBase的體系結構

      2.5大數據分布式數據倉庫

      2.5.1數據倉庫的特點(diǎn)

      2.5.2Hive的內部架構

      2.5.3Hive的數據組織

      2.6本章小結

      習題

      第3章系統日志數據采集

      3.1系統日志數據采集概述

      3.1.1系統日志分類(lèi)

      3.1.2日志分析應用場(chǎng)景

      3.1.3系統日志收集方法

      3.2Flume數據采集

      3.2.1Flume效益

      3.2.2Flume整體結構

      3.2.3Flume的核心部件Agent

      3.2.4Flume運行機構

      3.3Scribe數據采集

      3.3.1Scribe的功能

      3.3.2Scribe的架構

      3.3.3Scribe的流程

      3.3.4Scribe存儲類(lèi)型

      3.4Event Log Analyzer數據采集

      3.4.1Event Log Analyzer特點(diǎn)

      3.4.2Event Log Analyzer主要功能

      3.4.3Event Log Analyzer的可視化用戶(hù)界面

      3.5基于Log Parser的數據采集

      3.5.1Log Parser組成部分

      3.5.2Log Parser Lizard軟件功能

      3.5.3Log Parser Lizard軟件特色

      3.6本章小結

      習題

      第4章大數據遷移

      4.1數據遷移基礎

      4.1.1大數據遷移的需求

      4.1.2大數據遷移的風(fēng)險

      4.1.3大數據遷移的流程

      4.1.4大數據遷移任務(wù)類(lèi)型

      4.2數據遷移相關(guān)技術(shù)

      4.2.1基于存儲的數據遷移

      4.2.2基于主機邏輯卷的數據遷移

      4.2.3基于數據庫的數據遷移

      4.2.4基于服務(wù)器虛擬化的數據遷移

      4.3大數據遷移工具Sqoop

      4.3.1Sqoop概述

      4.3.2Sqoop的數據導入

      4.3.3Sqoop的數據導出

      4.4ETL數據遷移技術(shù)

      4.4.1ETL概述

      4.4.2ETL的實(shí)現模式

      4.4.3ETL工具

      4.5本章小結

      習題

      第5章互聯(lián)網(wǎng)數據采集

      5.1網(wǎng)絡(luò )爬蟲(chóng)概述

      5.1.1網(wǎng)絡(luò )爬蟲(chóng)的基本概念

      5.1.2網(wǎng)絡(luò )爬蟲(chóng)的爬行策略

      5.1.3Web更新策略

      5.1.4robots協(xié)議

      5.2網(wǎng)絡(luò )爬蟲(chóng)方法

      5.2.1按功能分類(lèi)的網(wǎng)絡(luò )爬蟲(chóng)

      5.2.2通用網(wǎng)絡(luò )爬蟲(chóng)

      5.2.3焦點(diǎn)網(wǎng)絡(luò )爬蟲(chóng)

      5.2.4Deep Web爬蟲(chóng)

      5.2.5分布式網(wǎng)絡(luò )爬蟲(chóng)

      5.3網(wǎng)絡(luò )爬蟲(chóng)工具

      5.3.1ParseHub

      5.3.2Web Scraper

      5.3.3后羿采集器

      5.3.4八爪魚(yú)收集器

      5.4Python爬蟲(chóng)技術(shù)

      5.4.1Python爬行器基礎知識

      5.4.2反爬蟲(chóng)與反爬蟲(chóng)技術(shù)

      5.5本章小結

      習題

      第6章數據預處理基礎

      6.1數據的描述

      6.1.1數據對象與屬性類(lèi)型

      6.1.2數據的統計描述

      6.1.3數據矩陣與相似(相異)矩陣

      6.2相似性或相異性度量方法

      6.2.1標稱(chēng)屬性相似性或相異性的度量

      6.2.2二元屬性相似性或相異性的度量

      6.2.3數值屬性相似性或相異性的度量

      6.2.4文檔相似性和相異性的度量

      6.3大數據質(zhì)量

      6.3.1常見(jiàn)的數據質(zhì)量問(wèn)題

      6.3.2大數據質(zhì)量標準

      6.4本章小結

      習題

      第7章數據清洗與集成

      7.1數據清洗基礎

      7.1.1數據清洗的任務(wù)

      7.1.2數據清洗的前期準備

      7.1.3數據清洗的一般性系統框架

      7.2數據清洗技術(shù)

      7.2.1缺失值處理

      7.2.2光滑噪聲數據處理

      7.2.3檢測偏差與糾正偏差

      7.3數據集成基礎

      7.3.1數據集成的難點(diǎn)

      7.3.2數據集成的方式

      7.4數據集成技術(shù)

      7.4.1模式識別和對象匹配

      7.4.2冗余處理

      7.4.3數據值沖突的檢測與處理

      7.5本章小結

      習題

      第8章數據歸約與變換

      8.1數據歸約基礎

      8.1.1數據歸約策略

      8.1.2數據歸約算法的特點(diǎn)

      8.1.3數據歸約的一般方法

      8.2數據歸約技術(shù)

      8.2.1小波變換

      8.2.2主成分分析

      8.2.3屬性子集選擇

      8.2.4回歸和對數線(xiàn)性模型

      8.2.5直方圖

      8.2.6數據立方體聚集

      8.3數據變換基礎


      8.3.1數據變換內容

      8.3.2數據變換的意義

      8.4數據變換技術(shù)

      8.4.1規范化變換

      8.4.2離散化變換

      8.4.3標稱(chēng)數據的概念層次變換

      8.5本章小結

      習題

      第9章大數據采集實(shí)驗

      9.1實(shí)驗1基于EventLog Analyzer的日志分析

      9.2實(shí)驗2基于Log Parser的日志處理

      9.3實(shí)驗3基于八爪魚(yú)采集器的網(wǎng)絡(luò )信息爬取

      9.4實(shí)驗4了解和使用Python和requests庫

      9.5實(shí)驗5使用PyCharm編寫(xiě)requests庫爬蟲(chóng)

      9.6實(shí)驗6使用PyCharm編寫(xiě)BeautifulSoup庫爬蟲(chóng)

      9.7本章小結


      第10章大數據預處理實(shí)驗

      10.1實(shí)驗1啟動(dòng)、了解SaCa大數據實(shí)驗平臺

      10.2實(shí)驗2使用SaCa大數據實(shí)驗平臺分析數據

      10.3實(shí)驗3大數據預處理基礎——數據集成

      10.4實(shí)驗4缺失值填充

      10.5實(shí)驗5數據規范化

      10.6實(shí)驗6連續特征離散化

      10.7實(shí)驗7主成分分析

      10.8實(shí)驗8相關(guān)性特征選擇

      10.9本章小結


      第11章大數據采集與預處理應用案例

      11.1基于Pandas圖書(shū)數據分析處理

      11.1.1案例意義

      11.1.2Pandas庫

      11.1.3圖書(shū)數據采集

      11.1.4數據預處理及分析

      11.2石油數據預處理系統

      11.2.1石油數據預處理系統需求

      11.2.2石油數據預處理系統流程

      11.2.3石油數據預處理算法

      11.2.4實(shí)驗數據預處理結果分析

      11.3電影票房預測數據分析處理

      11.3.1案例意義

      11.3.2數據處理流程

      11.3.3數據采集和分析

      11.3.4數據處理和預測


      參考文獻

      本目錄推薦

      掃描二維碼
      Copyright ? 讀書(shū)網(wǎng) www.hotzeplotz.com 2005-2020, All Rights Reserved.
      鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號
      欧洲亚洲色一区二区色99,99V久久综合狠狠综合久久,色婷婷亚洲十月十月色天