SoundCloud公司最近的博客文章中表明,該公司最近對數(shù)據(jù)科學(xué)家和分析師的工作進(jìn)行了重組和優(yōu)化。其目的是幫助他們更快捷,更快樂,以及更有成效,并希望能夠改善許多內(nèi)部流程和運(yùn)作。
以下詳細(xì)地了解這個過程:本質(zhì)上,它將整個策略分解成更小的部分或步驟——從問題定義開始,到準(zhǔn)備,到解決方案開發(fā),到生產(chǎn)準(zhǔn)備部署,最后是驗證和維護(hù)。這是一個幫助解決問題并優(yōu)化其部署解決方案的過程。
要對此進(jìn)行理解,首先需要了解SoundCloud所實施的基礎(chǔ)和流程。
SoundCloud的數(shù)據(jù)系統(tǒng)需要什么?
音頻分享服務(wù)平臺SoundCloud在全球范圍內(nèi)經(jīng)營,其用戶每分鐘將上傳大約12小時的音頻內(nèi)容,這是在其服務(wù)器上存儲和處理的數(shù)據(jù)量極大的。對于上傳的每個音頻文件,它必須被轉(zhuǎn)碼并以不同的格式存儲。
這允許客戶或觀眾以他們喜歡的格式下載內(nèi)容,并在他們喜歡的設(shè)備上使用,例如通過標(biāo)準(zhǔn)MP3播放器的iPhone或iPod。
因為SoundCloud是數(shù)以百萬計的藝術(shù)家,樂隊,播客和音頻創(chuàng)作者的音樂網(wǎng)站樞紐,它需要提供非常大的存儲容量。此外,通過該服務(wù)上傳的所有內(nèi)容都可以通過博客,網(wǎng)站,社交網(wǎng)絡(luò),移動應(yīng)用和聊天服務(wù)共享。
該平臺的觀眾每天24小時在線,每周七天。這意味著流量和業(yè)績將會有一些波動。如果多個地區(qū)同時使用該平臺(如美國和英國)時,會出現(xiàn)極高的負(fù)荷尖峰。這意味著平臺后面的團(tuán)隊需要能夠收集所有這些用戶和性能數(shù)據(jù)并使其運(yùn)行。
SoundCloud公司工程副總裁Alexander Grosse說:“如果我們的存儲器崩潰了,那將是SoundCloud業(yè)務(wù)的終結(jié),我們必須關(guān)注平臺的核心功能。”
而這需要數(shù)據(jù)科學(xué)家收集的數(shù)據(jù)來改進(jìn),增強(qiáng)和支持該產(chǎn)品。此外,它需要轉(zhuǎn)換并提供給幾乎所有人,包括那些幾乎沒有分析經(jīng)驗的人。
(1)首先是理解
在組織解決數(shù)據(jù)之前,首先要了解問題,以及采用什么解決方案來解決問題。這意味著企業(yè)必須理解業(yè)務(wù)需求,通過指標(biāo)確定問題,縮小范圍,以便管理。
例如,SoundCloud可能面臨的一個問題是性能問題。一開始,它不會完全知道問題來自哪里或是什么原因造成的。在分析收集的數(shù)據(jù)并整理新的解決方案或策略之前,需要了解問題所在。
這將意味著收集有關(guān)流量峰值,性能和功率需求等的更多信息。這是SoundCloud的多步驟過程的準(zhǔn)備和問題定義階段。
當(dāng)今世界,每一秒都在創(chuàng)建新的數(shù)據(jù)。Google每秒有超過40,000個搜索查詢,每天約3.5億次搜索,每年搜索12萬億次。企業(yè)需要能夠選擇正確的數(shù)據(jù)來實施解決方案,因為有太多需要檢查的內(nèi)容。
(2)開發(fā)解決方案或解決問題
在了解可部署的問題和解決方案之后,企業(yè)需要將計劃付諸行動。這意味著企業(yè)需要提供一個解決方案,如果還沒有,采用集思廣益的各種步驟和解決方案,并觀察其是否會真正工作。其原型設(shè)計本質(zhì)上可以包括在內(nèi),因為它是開發(fā)和測試階段的重要組成部分。
此外,可以通過同行反饋和客戶響應(yīng)來進(jìn)一步解決復(fù)雜問題和擴(kuò)展情況。對于問題可能需要定期進(jìn)行維護(hù)或試驗才能得出解決方案。這也不僅需要通過相關(guān)數(shù)據(jù)進(jìn)行排序,而且需要首先發(fā)現(xiàn)和組織相關(guān)數(shù)據(jù)。如果企業(yè)做好了自己的準(zhǔn)備,這件事就已經(jīng)處理完畢。
(3)驗證和/或部署
在解決方案被認(rèn)為是成功之前,企業(yè)需要部署并驗證其進(jìn)度。更重要的是,企業(yè)需要保持維護(hù)和未來的更新,以確保其清潔,高效和工作。
SoundCloud使用A/ B測試和所述測試的結(jié)果來監(jiān)視其所在的解決方案。這也保證了它所帶來的任何東西都能滿足客戶的期望并使客戶滿意。
正如SoundCloud所做的那樣,啟用驗證和部署流程來收集和分析這些數(shù)據(jù)是必要的。這不僅提高了解決問題的能力,而且提高了解決方案的準(zhǔn)確性。
(4)傳播與分享
最后,數(shù)據(jù),解決方案和進(jìn)展都需要在團(tuán)隊或公司內(nèi)傳播與分享。
數(shù)據(jù)科學(xué)家需要把信息以其理解的方式提供給每個人。這是至關(guān)重要的,因為數(shù)據(jù)科學(xué)家可能會查看一組數(shù)據(jù),而不是立即知道如何以及在何處使用它。在組織中共享數(shù)據(jù)是流程的必要元素。
營銷團(tuán)隊可能有權(quán)利獲取客戶購買的數(shù)據(jù),并將其轉(zhuǎn)化為可用于將來促銷的內(nèi)容。另一方面,數(shù)據(jù)科學(xué)家查看這些數(shù)據(jù)是什么,可能在哪里應(yīng)用。此外,理解并將所有數(shù)據(jù)納入組織的行動并不是他們的工作。他們需要組織起來,使其更加方便易讀。
通過研究SoundCloud公司的優(yōu)化策略,數(shù)據(jù)科學(xué)家可以簡化自己的操作,并充分利用使其流程更加平穩(wěn)。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。