成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大數(shù)據(jù)時代的MicrosoftExcel,了解一下

大數(shù)據(jù)
這是一個眾所周知并且在日常生活中頻繁使用的工具。是Microsoft辦公軟件三巨頭之一,創(chuàng)建報告、生成表單甚至是項目規(guī)劃,我們可以使用它做任何事情。

 這是一個眾所周知并且在日常生活中頻繁使用的工具。是Microsoft辦公軟件三巨頭之一,創(chuàng)建報告、生成表單甚至是項目規(guī)劃,我們可以使用它做任何事情。

[[316737]]

沒錯,他就是MicrosoftExcel。

雖然它廣為人知,但其實人們從未真正學(xué)會使用它。

雖然對于大多數(shù)人來說,這不是一個主要的問題,但是對于那些需要處理復(fù)雜管道和系統(tǒng)的數(shù)據(jù)處理人員來說,這已經(jīng)開始成為問題了。

如果了解了如何構(gòu)建高效且一致的電子表格,事情會怎樣?

不僅是在工程任務(wù)上,日常任務(wù)中也有很多好處,它們可以通過提高效率、一致性和可重復(fù)性的設(shè)計來增強這些文件。

 

Microsoft Excel的常見誤用

當(dāng)Redmond公司于1985年發(fā)布Microsoft Excel時,它已經(jīng)很成功了。新興的個人計算機市場相當(dāng)開放,隨著Windows3.0的推出,Excel的銷售超過了其主要競爭對手——IBM的Lotus 1-2-3。

從那以后,Windows在整個個人電腦市場的占有率超過85%。因此,Excel和所有的Office套件是最常用的軟件。

這一成功并不令人驚訝:MicrosoftExcel易于使用,集合了許多特性,并且具有簡單的用戶界面。每個人都可以使用它,它無處不在。人們還想要什么?

事實上,做一個幾乎每個人都能使用的產(chǎn)品會帶來一些對應(yīng)產(chǎn)物。

Excel不是在學(xué)校學(xué)的。每個人都可以使用它,所以每個人都可以用不同的方式使用Excel。沒有明確界定的共識或良好做法。事實上,我們從小學(xué)起就不了解這類工具,導(dǎo)致一旦到達(dá)專業(yè)領(lǐng)域才意識到知識的缺乏。

Excel不可自動化。盡管Excel中嵌入了一種可編程語言(VisualBasic),但仍然難以自動執(zhí)行繁重的任務(wù),無法與其他軟件進行通信。而且,它仍然僅供內(nèi)部人員使用。

Excel不可擴展。人類正處于大數(shù)據(jù)時代,因此處理無法在Excel中加載的大文件是很常見的。所有這些都取決于個人的計算能力。在專用服務(wù)器上運行Microsoft軟件似乎也很困難。同樣,它不是為這種用途而設(shè)計的。

Excel是不可復(fù)制的。最后不得不提,當(dāng)收到一個包含大量匯總數(shù)據(jù)、顏色、縮寫或公式的Excel文件時,很難理解所有這些東西是如何設(shè)置和收集的。Excel不會保存構(gòu)建此類文件所涉及的任何工作流狀態(tài)。

 

內(nèi)部數(shù)據(jù)團隊

在過去的二十年中,這四點并不是什么大問題。

但與此同時,一個“新”領(lǐng)域開始了。隨著計算機資源的發(fā)展,公司發(fā)現(xiàn)他們現(xiàn)在擁有大量數(shù)據(jù),但不知道如何處理。

一系列新的工作崗位出現(xiàn)了:數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師、數(shù)據(jù)工程師、機器學(xué)習(xí)工程師、數(shù)據(jù)開發(fā)工程師等等。最重要的詞是DATA,新崗位的主要目標(biāo)是從海量數(shù)據(jù)中發(fā)現(xiàn)價值。

有了這些新奇的功能,就可以創(chuàng)建大量的工具來構(gòu)建數(shù)據(jù)管道,更好地可視化數(shù)據(jù)或創(chuàng)建數(shù)學(xué)模型來預(yù)測未來的值。

但大多數(shù)數(shù)據(jù)仍然保存在Excel文件中。此外,開發(fā)出來的工具有時使用起來很復(fù)雜,只有訓(xùn)練有素的工程師才能操作它們。

因此,這里仍然存在差距。一方面有很多人仍然使用電子表格作為他們的主要工具之一,另一方面工程師必須處理復(fù)雜的管道,但也要處理這些混亂的文件。

因此,在清理這些文件并將它們集成到整個數(shù)據(jù)管道中會損失大量的時間和金錢。數(shù)據(jù)團隊由學(xué)習(xí)數(shù)學(xué)、計算機科學(xué)等學(xué)科的杰出人才組成。

實際上,工程師們也不學(xué)Excel,他們只知道計算機和他們的數(shù)據(jù)管道,所以他們可以討價還價。然而,與他們在這段時間所能做的相比,這并沒有附加價值。

如果從一開始就學(xué)習(xí)如何創(chuàng)建和維護干凈的文件,而不是讓工程師來處理這些混亂的文件,那會怎么樣呢?通過遵循簡單的規(guī)則,就可以構(gòu)建高效、可重復(fù)和自動化的文件,并停止創(chuàng)建混亂的電子表格。

 

簡單整理電子表格

下面是一個常見電子表格的例子:

 

大數(shù)據(jù)時代的MicrosoftExcel,了解一下

 

一個常見的電子表格

盡管它看起來設(shè)計得不錯,但是從可重復(fù)的角度來看并非如此。

通過這個簡單的示例,筆者將描述什么是最好的做法,以建立一個容易讓計算機理解的文件。

第一行與特定字段不對應(yīng)。在此應(yīng)將其替換為“年份” (year) ,“類型” (type) ,“產(chǎn)品” (product),“數(shù)量” (quantity)。這就是所謂的“標(biāo)題”。

使用顏色和字體形狀格式化單元格。雖然添加顏色和粗體/斜體文本便于查看,但對計算機卻沒什么用。此外,這些設(shè)置不是目標(biāo),并且對文件的理解可能會因用戶而異。

將不同性質(zhì)的數(shù)據(jù)放在同一行。如上所述,它看起來很方便,但實際上,每一行應(yīng)該只包含一個觀察值的信息。同樣,聚集總體值(如total或average)與其他值在同一條線上通常不是一個好方式。這是不一致的,計算機也無法理解。

合并單元格。同樣的事情:每一行應(yīng)只包含有關(guān)一個數(shù)據(jù)觀察的信息。

在同一工作表或標(biāo)簽中中分隔表。用不同的標(biāo)簽區(qū)分年份是使表格更易于閱讀的一種常見做法,但如果計算機只讀取一張表,則該表將無法被讀取。

這些是簡單的規(guī)則,不是嗎?以下是應(yīng)用這些準(zhǔn)則后的結(jié)果。

 

大數(shù)據(jù)時代的MicrosoftExcel,了解一下

 

整齊的電子表格

 

兩全其美

讀者如果不是在技術(shù)領(lǐng)域工作,可能會說這不是一個很有用的電子表格。說對了一部分。這種設(shè)計無法處理總和或平均值之類的聚合值,而且查找特定值也不太方便。

盡管如此,仍然有一些方法可以處理這些文件,甚至改進以前的設(shè)計。

保存一份數(shù)據(jù)完整的表格。首先,一定要像上面演示的那樣,保留一個帶有數(shù)據(jù)格式的表單。這樣,數(shù)據(jù)科學(xué)家或任何使用特定軟件的人將能夠加載文件,而不需要在以后處理它。

在另一個工作表或應(yīng)用程序中處理和聚合數(shù)據(jù)。進行求和、添加過濾器、創(chuàng)建繪圖或任何其他數(shù)據(jù)處理,只需打開另一個工作表并執(zhí)行所需操作。將這個空間視為一個實驗室,可以在這里對數(shù)據(jù)進行試驗并生成報告。這樣就可以保護原始數(shù)據(jù)。

此外,有人可能希望使用或?qū)W習(xí)其他工具。現(xiàn)在,有很多用戶友好的工具來創(chuàng)建儀表板或報告。它們提供了很好的設(shè)計選項,并包含了許多構(gòu)建和導(dǎo)出報告的功能。

如果想更進一步,可以使用這些數(shù)據(jù)人員每天都在使用的工具。這些大多是像Python或R這樣的可編程語言,它們帶來了更多的自由和可復(fù)制性。因為它實際上是代碼,所以創(chuàng)建圖表和報告的整個工作流程都被保存了。因此可以共享代碼,任何人都可以編輯它以適應(yīng)自己的需要。

盡管它比Excel更復(fù)雜,但高自由度允許用戶構(gòu)建任何想要的東西。最后不得不提:它是免費的。

 

這只是一種小小的適應(yīng)

改進這些文件設(shè)計有兩個主要優(yōu)勢:

首先,對技術(shù)人員有幫助。不僅僅是利他主義,它還可以加速工程師建立數(shù)據(jù)管道的方式,從而增加洞察力,為公司帶來更多的價值。

其次,通過在團隊甚至公司規(guī)模上應(yīng)用這些規(guī)則,可以最終得到一個更相似的“語言”來處理這些文件,從而更好地理解和操縱公司的數(shù)據(jù)。

現(xiàn)在是2020年,人們的耳邊充斥著關(guān)于人工智能、大數(shù)據(jù)、機器學(xué)習(xí)等的流行語,卻不知道它是什么。

事實上,它始于數(shù)據(jù),存在于每個人的手上和電腦中。

責(zé)任編輯:華軒 來源: 今日頭條
相關(guān)推薦

2024-04-11 12:19:01

Rust數(shù)據(jù)類型

2021-09-30 16:28:34

大數(shù)據(jù)數(shù)據(jù)管理企業(yè)

2015-08-17 13:29:36

大數(shù)據(jù)社交

2020-02-10 14:26:10

GitHub代碼倉庫

2020-12-10 08:44:35

WebSocket輪詢Comet

2021-09-17 13:34:57

大數(shù)據(jù)Redis 應(yīng)用

2020-08-08 08:25:58

數(shù)據(jù)科學(xué)認(rèn)證數(shù)據(jù)科學(xué)在線認(rèn)證

2022-03-24 13:36:18

Java悲觀鎖樂觀鎖

2021-01-21 10:23:43

數(shù)據(jù)庫架構(gòu)技術(shù)

2015-05-14 15:56:27

2020-04-20 10:55:57

大數(shù)據(jù)人工智能技術(shù)

2014-06-10 09:20:14

大數(shù)據(jù)車聯(lián)網(wǎng)

2015-04-17 19:46:04

2019-02-20 14:16:43

2018-06-05 17:40:36

人工智能語音識別

2019-09-21 21:15:36

MapReduce大數(shù)據(jù)分布式

2017-02-23 10:27:59

2018-04-25 06:46:52

2013-09-27 15:43:14

2016-10-19 16:50:43

大數(shù)據(jù)
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 精品一二三区视频 | 中文字幕免费 | 中文字幕日韩欧美一区二区三区 | 亚洲免费观看视频 | 天天射中文 | 一区二区av | 亚洲狠狠丁香婷婷综合久久久 | 美女久久| 亚洲视频在线观看 | 欧美日韩免费一区二区三区 | 久久国色 | 色频| 天天射色综合 | 国产精品国产精品国产专区不卡 | 蜜桃毛片 | 亚洲精品1区 | 国产一区二区免费 | 久久免费大片 | 国产成人在线视频免费观看 | 亚洲 日本 欧美 中文幕 | 中文字幕精品一区 | 欧美寡妇偷汉性猛交 | 天天天天天天天干 | 中文字幕亚洲国产 | 国产真实精品久久二三区 | 黄色香蕉视频在线观看 | 久久狠狠| 成人精品久久久 | 亚洲精品国产精品国自产在线 | 国产精品美女在线观看 | 999国产精品视频 | 免费性视频 | 国产视频久久 | 91精品久久久久久久久中文字幕 | 久日精品| 一级黄色网页 | 日本不卡免费新一二三区 | 成人在线视频一区 | 成人在线网 | 亚洲天堂一区 | 91在线视频观看免费 |