全國(guó)信息技術(shù)水平考試是由工業(yè)和信息化部教育與考試中心(全國(guó)電子信息應(yīng)用教育中心)負(fù)責(zé)具體實(shí)施的全國(guó)統(tǒng)一考試。該考試是對(duì)從事或即將從事信息技術(shù)的專業(yè)人員技術(shù)水平的綜合評(píng)價(jià),其目的是加快國(guó)民經(jīng)濟(jì)信息化技術(shù)人才的培養(yǎng),同時(shí)為企業(yè)合理選拔聘用信息化技術(shù)人才提供有效憑證。
本書以WIN10 和Python3.6.5 搭建Python開(kāi)發(fā)基礎(chǔ)平臺(tái)為起點(diǎn),重點(diǎn)闡述Python語(yǔ)言的基礎(chǔ)知識(shí)和三個(gè)典型的項(xiàng)目實(shí)戰(zhàn)案例。全書以理論引導(dǎo)、案例驅(qū)動(dòng)、上機(jī)實(shí)戰(zhàn)為理念打造Python語(yǔ)言學(xué)習(xí)的新模式。具體內(nèi)容分為兩大部分:第一部分以Python編程語(yǔ)言基礎(chǔ)知識(shí)普及為主,分別介紹了Python3概述、基本語(yǔ)法、流程控制、Python組合數(shù)據(jù)類型、字符串與正則式、函數(shù)、模塊、類和對(duì)象、異常處理、文件操作;第二部分:以項(xiàng)目實(shí)戰(zhàn)為核心,以學(xué)以致用為導(dǎo)向,以切近生活的案例為依托,分別介紹 Python爬蟲(chóng)項(xiàng)目實(shí)戰(zhàn)、Python數(shù)據(jù)可視化項(xiàng)目實(shí)戰(zhàn)、Python數(shù)據(jù)分析項(xiàng)目實(shí)戰(zhàn)。本書以作者十多年的計(jì)算機(jī)專業(yè)課程教學(xué)經(jīng)驗(yàn)及相應(yīng)的項(xiàng)目實(shí)戰(zhàn)心得為依托,力爭(zhēng)做到以理論知識(shí)為基礎(chǔ)、以案例實(shí)戰(zhàn)為手段、以解決問(wèn)題為根本的初衷。讓讀者從書中汲取他們所需要的編程知識(shí)和實(shí)戰(zhàn)體驗(yàn)。
本書可作為高等學(xué)校尤其是高職院校各專業(yè)的Python語(yǔ)言啟蒙教材,同時(shí)也可作為廣大Python語(yǔ)言愛(ài)好者自學(xué)的參考書。
數(shù)據(jù)清洗是大數(shù)據(jù)領(lǐng)域不可缺少的環(huán)節(jié),用來(lái)發(fā)現(xiàn)并糾正數(shù)據(jù)中可能存在的錯(cuò)誤。該步驟針對(duì)數(shù)據(jù)審查過(guò)程中發(fā)現(xiàn)的錯(cuò)誤值、缺失值、異常值、可疑數(shù)據(jù),選用適當(dāng)方法進(jìn)行“清理”,使“臟”數(shù)據(jù)變?yōu)?ldquo;干凈”數(shù)據(jù)。本書共分為8章:第1章主要介紹數(shù)據(jù)清洗的概念、任務(wù)和流程,數(shù)據(jù)標(biāo)準(zhǔn)化概念及數(shù)據(jù)倉(cāng)庫(kù)技術(shù)等;第2章主要介紹Windows和類UNIX操作系統(tǒng)下的數(shù)據(jù)常規(guī)格式、數(shù)據(jù)編碼及數(shù)據(jù)類型轉(zhuǎn)換等;第3章介紹ETL概念、數(shù)據(jù)清洗的技術(shù)路線、ETL工具及ETL子系統(tǒng)等;第4章介紹了Excel、Kettle、OpenRefine、DataWrangler和Hawk的安裝及使用等;第5章介紹Kettle下文本文件抽取、Web數(shù)據(jù)抽取、數(shù)據(jù)庫(kù)數(shù)據(jù)抽取及增量數(shù)據(jù)抽取等;第6章介紹數(shù)據(jù)清洗步驟、數(shù)據(jù)檢驗(yàn)和數(shù)據(jù)錯(cuò)誤處理,數(shù)據(jù)質(zhì)量評(píng)估及數(shù)據(jù)加載;第7章介紹網(wǎng)頁(yè)結(jié)構(gòu),利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)進(jìn)行數(shù)據(jù)采集,利用JavaScript技術(shù)進(jìn)行行為日志數(shù)據(jù)采集等;第8章介紹RDBMS的數(shù)據(jù)清洗方法和數(shù)據(jù)脫敏處理技術(shù)等。
本書系統(tǒng)地講解了數(shù)據(jù)清洗理論和實(shí)際應(yīng)用,可以作為培養(yǎng)應(yīng)用型人才的課程教材,也適用于希望了解數(shù)據(jù)清洗的廣大讀者。
本書是大數(shù)據(jù)應(yīng)用人才培養(yǎng)系列教材中的一冊(cè),講解了大數(shù)據(jù)系統(tǒng)運(yùn)行維護(hù)過(guò)程中的各個(gè)主要階段及其任務(wù),包括配置管理、系統(tǒng)管理、故障管理、性能管理、安全管理、高可用性管理、應(yīng)用變更管理、升級(jí)管理及服務(wù)資源管理,內(nèi)容全面且翔實(shí),兼具基礎(chǔ)理論知識(shí)與運(yùn)維實(shí)踐經(jīng)驗(yàn),特別是重點(diǎn)介紹了大數(shù)據(jù)系統(tǒng)的運(yùn)維特點(diǎn)及運(yùn)維技能,以保障大數(shù)據(jù)系統(tǒng)的穩(wěn)定可靠運(yùn)行,更好地支撐大數(shù)據(jù)的商業(yè)應(yīng)用價(jià)值。
本書具有很強(qiáng)的系統(tǒng)性和實(shí)踐指導(dǎo)性,可以作為培養(yǎng)應(yīng)用型人才的課程教材,也同樣適合于有意從事IT系統(tǒng)運(yùn)維工作的廣大從業(yè)者和愛(ài)好者作為參考書。
在大數(shù)據(jù)行業(yè)愈發(fā)火熱,人才需求不斷增加的趨勢(shì)下,清華大學(xué)博士、南京大數(shù)據(jù)研究院院長(zhǎng)劉鵬教授策劃編寫了這套“大數(shù)據(jù)應(yīng)用人才培養(yǎng)系列教材”。除了以上3冊(cè)圖書之外,該套叢書還包括《大數(shù)據(jù)實(shí)踐》、《大數(shù)據(jù)導(dǎo)論》、《數(shù)據(jù)挖掘基礎(chǔ)》、《R語(yǔ)言》、《云計(jì)算導(dǎo)論》、《數(shù)據(jù)標(biāo)注工程》6冊(cè)圖書。此外,該套叢書還有配套資源,免費(fèi)提供教學(xué)課件PPT,學(xué)習(xí)以及實(shí)驗(yàn)資料等。
本套叢書的講解側(cè)重于應(yīng)用,對(duì)知識(shí)點(diǎn)給出具體的操作,并且有配套的動(dòng)手實(shí)驗(yàn)。內(nèi)容安排遵循從簡(jiǎn)單到復(fù)雜、從理論到實(shí)踐的學(xué)習(xí)過(guò)程;同時(shí)也遵循系統(tǒng)性和覆蓋面寬的原則。本套叢書可以作為培養(yǎng)應(yīng)用型人才的課程教材,也同樣適用于有意從事大數(shù)據(jù)系統(tǒng)基礎(chǔ)工作的IT從業(yè)人員作為參考書。
訂購(gòu)圖書可前往天貓搜索“清華大學(xué)出版社官方旗艦店”店鋪: