Skip to content

Latest commit

 

History

History
234 lines (167 loc) · 10.8 KB

阿里云天池Python训练营-Part6.md

File metadata and controls

234 lines (167 loc) · 10.8 KB

本笔记为阿里云天池龙珠计划Python训练营的学习内容,链接为:https://tianchi.aliyun.com/specials/promotion/aicamppython

阿里云天池 Python 训练营 [国际人学校 - 林肯老师 22 年情人节版本] - Part5

rhtKQR

  • 2022 年 02 月 14 日版本
  • 本文档是以 CC 开源的模式的发布,你能且将获得本文档的 PDF 版本已经 Jupyter Notebook 版本
  • 本文档并不申明自己的版权信息,为了更好的知识传播,我们授权你使用本文档,你可以使用它,进行二次创作,进行分发,进行修改,并可以以此为蓝本进行授课。
  • 请保留本文档的原始来源。
  • 本文档首先在国际人学校组织的“阿里云天池 Python 训练营课程”中使用。
  • 本文档由林肯老师首次组织和编辑。你可以通过网址 数据大咖 找到他。

TWy9b7

Excel是我们工作中经常使用的一种工具,对于资料分析来说,这也是处理资料最基础的工具。很多传统行业的资料分析师甚至只要掌握Excel和SQL即可。

对于初学者,有的时候并不需要急于苦学R语言等专业工具(当然会也是加分项),因为Excel涵盖的功能足够多,也有很多统计、分析、视觉化的插件。只不过我们平时处理资料的时候,很多函数都不知道怎麽用。

关于Excel的进阶学习,主要分为两块:一个是资料分析常用的Excel函数,另一个分享用Excel做一个简单完整的分析。这篇文章将介绍资料分析常用的43个Excel函数及用途。

关于函数: Excel的函数实际上就是一些複杂的计算公式,函数把複杂的计算步骤交由程序处理,只要按照函数格式录入相关参数,就可以得出结果。如求一个区域的和,可以直接用SUM(A1:C100)的形式。

所以对于函数,不用刻意记刻意背,只要知道比如“选取栏位,用Left/Right/Mid”函数,并且需要哪些参数怎麽用就行了,複杂的就交给万能的google吧。

一、关联匹配类

经常性的,需要的资料不在同一个excel表或同一个excel表不同sheet中,资料太多,copy麻烦也不准确,该如何整合呢?这类函数就是用于多表关联或者列栏比对时的场景,而且表越複杂,用得越多。

函数HLOOKUP和VLOOKUP都是用来在表格中查找资料。

1、VLOOKUP

功能:用于查找首列满足条件的元素。 语法:=VLOOKUP(要查找的值,要在其中查找值的区域,区域中包含返回值的列号,精确匹配或近似匹配 — 指定为 0/FALSE 或 1/TRUE)。

txKG8Q

2、HLOOKUP

功能:搜索表的顶行或值的阵列中的值,并在表格或阵列中指定的栏的同一lan中返回一个值。 语法:=VLOOKUP(要查找的值,要在其中查找值的区域,区域中包含返回值的行号,精确匹配或近似匹配 — 指定为 0/FALSE 或 1/TRUE)。 区别:HLOOKUP返回的值与需要查找的值在同一列上,而VLOOKUP返回的值与需要查找的值在同一行上。

3、INDEX

功能:返回表格或区域中的值或引用该值。 语法:= INDEX(要返回值的储存格区域或阵列,所在列,所在栏)

eMF0hG

4、MATCH

功能:用于返回指定内容在指定区域(某列或者某栏)的位置。 语法:= MATCH (要返回值的储存格区域或阵列,查找的区域,查找方式)

5、RANK

功能:求某一个数值在某一区域内一组数值中的排名。 语法:=RANK(参与排名的数值, 排名的数值区域, 排名方式-0是降序-1是升序-默认为0)。

6、Row

功能:返回储存格所在的列

7、Column

功能:返回储存格所在的栏

8、Offset

功能:从指定的基准位置按列栏偏移量返回指定的引用 语法:=Offset(指定点,偏移多少列,偏移多少栏,返回多少列,返回多少栏)

二、清理处理类

资料处理之前,需要对提取的资料进行初步清理,如清除字串空格,合并储存格、替换、截取字串、查找字串出现的位置等。

清除字串空格:使用Trim/Ltrim/Rtrim 合并储存格:使用concatenate 截取字串:使用Left/Right/Mid 替换储存格中内容:Replace/Substitute 查找文本在储存格中的位置:Find/Search

9、Trim

功能:清除掉字串两边的空格

10、Ltrim

功能:清除储存格右边的空格

11、Rtrim

功能:清除储存格左边的空格

12、Concatenate

语法:=Concatenate(储存格1,储存格2……) 合并储存格中的内容,还有另一种合并方式是&,需要合并的内容过多时,concatenate效率更快。

13、Left

功能:从左截取字串 语法:=Left(值所在储存格,截取长度)

14、Right

功能:从右截取字串 语法:= Right (值所在储存格,截取长度)

15、Mid

功能:从中间截取字串 语法:= Mid(指定字串,开始位置,截取长度)

ILNLbF

16、Replace

功能:替换掉储存格的字串 语法:=Replace(指定字串,哪个位置开始替换,替换几个字元,替换成什麽)

17、Substitute

和replace接近,不同在于Replace根据位置实现替换,需要提供从第几位开始替换,替换几位,替换后的新的文本;而Substitute根据文本内容替换,需要提供替换的旧文本和新文本,以及替换第几个旧文本等。因此Replace实现固定位置的文本替换,Substitute实现固定文本替换。

0P72Zc

18、Find

功能:查找文本位置 语法:=Find(要查找字元,指定字串,第几个字元)

19、Search

功能:返回一个指定字元或文本字串在字串中第一次出现的位置 ,从左到右查找 语法:=search(要查找的字元,字元所在的文本,从第几个字元开始查找) Find和Search这两个函数功能几乎相同,实现查找字元所在的位置,区别在于Find函数精确查找,区分大小写;Search函数模糊查找,不区分大小写。

20、Len

功能:文本字串的字元个数

21、Lenb

功能:返迴文本中所包含的字元数

三、逻辑运算类

22、IF

功能:使用逻辑函数 IF 函数时,如果条件为真,该函数将返回一个值;如果条件为假,函数将返回另一个值。 语法:=IF(条件, true时返回值, false返回值)

23、AND

功能:逻辑判断,相当于“并”。 语法:全部参数为True,则返回True,经常用于多条件判断。

24、OR

功能:逻辑判断,相当于“或”。 语法:只要参数有一个True,则返回Ture,经常用于多条件判断。

四、计算统计类

在利用excel表格统计资料时,常常需要使用各种excel自带的公式,也是最常使用的一类,重要性不言而喻,不过excel都自带快捷功能。

MIN函数:找到某区域中的最小值 MAX函数:找到某区域中的最大值 AVERAGE函数:计算某区域中的平均值 COUNT函数: 计算某区域中包含数字的储存格的数目 COUNTIF函数:计算某个区域中满足给定条件的储存格数目 COUNTIFS函数:统计一组给定条件所指定的储存格数 SUM函数:计算单元格区域中所有数值的和 SUMIF函数:对满足条件的储存格求和 SUMIFS函数:对一组满足条件指定的储存格求和 SUMPRODUCT函数:返回相应的阵列或区域乘积的和

25、MIN

功能:找到某区域中的最小值

26、MAX函数

功能:找到某区域中的最大值

27、AVERAGE

功能:计算某区域中的平均值

28、COUNT

功能:计算含有数字的储存格的个数。

29、COUNTIF

功能:计算某个区域中满足给定条件的储存格数目 语法:=COUNTIF(储存格1: 储存格2 ,条件) 比如=COUNTIF(Table1!A1:Table1!C100, “YES” ) 计算Table1中A1到C100区域储存格中值为”YES”的储存格个数

COq5BL

30、COUNTIFS

功能:统计一组给定条件所指定的储存格数 语法:=COUNTIFS(第一个条件区域,第一个对应的条件,第二个条件区域,第二个对应的条件,第N个条件区域,第N个对应的条件) 比如:=COUNTIFS(Table1!A1: Table1!A100, “YES”,Table1!C1: Table1!C100, “NO” ) 计算Table1中A1到A100区域储存格中值为”YES”,而且同时C区域值为”NO”的储存格个数

31、SUM

计算储存格区域中所有数值的和

32、SUMIF

功能:求满足条件的储存格和 语法:=SUMIF(储存格1: 储存格2 ,条件,储存格3: 储存格4)

32、SUMIFS

功能:对一组满足条件指定的储存格求和 语法:=SUMIFS(实际求和区域,第一个条件区域,第一个对应的求和条件,第二个条件区域,第二个对应的求和条件,第N个条件区域,第N个对应的求和条件) 比如=SUMIFS(Table1!C1:Table1!C100,Table1!A1: Table1!A100, “YES” ,Table1!B1:Table1B100, “NO” ) 计算Table1中C1到C100区域,同时相应行A列值为”YES”,而且对应B列值为”NO”的储存格的和。

fsSBkP

33、SUMPRODUCT

功能:返回相应的阵列或区域乘积的和 语法: =SUMPRODUCT(储存格1: 储存格2 ,储存格3: 储存格4) 比如:=SUMPRODUCT(Table1!A1:Table1!A100, Table2!B1Table2!B100) 计算表格1的A1到A100与表格2的B1到B100的乘积和,即A1B1+A2B2+A3*B3+…

34、Stdev

统计型函数,求标准差。

35、Substotal

语法:=Substotal(引用区域,参数) 汇总型函数,将平均值、计数、最大最小、相乘、标准差、求和、方差等参数化,换言之,只要会了这个函数,上面的都可以抛弃掉了。

36、Int/Round

取整函数,int向下取整,round按小数位取数。 round(3.1415,2)=3.14 ; round(3.1415,1)=3.1

五、时间序列类

专门用于处理时间格式以及转换。

37、TODAY

返回今天的日期,动态函数。

38、NOW

返回当前的时间,动态函数。

39、YEAR

功能:返回日期的年份。

40、MONTH

功能:返回日期的月份。

41、DAY

功能:返回以序列数表示的某日期的天数。

42、WEEKDAY

功能:返回对应于某个日期的一周中的第几天。 默认情况下,天数是 1(星期日)到 7(星期六)范围内的整数。 语法:=Weekday(指定时间,参数)

43、Datedif

功能:计算两个日期之间相隔的天数、月数或年数。 语法:=Datedif(开始日期,结束日期,参数)