python数据分析用什么软件

2024-05-14

1. python数据分析用什么软件

Python是数据处理常用工具，可以处理数量级从几K至几T不等的数据，具有较高的开发效率和可维护性，还具有较强的通用性和跨平台性，这里就为大家分享几个不错的数据分析工具。Python数据分析需要安装的第三方扩展库有：Numpy、Pandas、SciPy、Matplotpb、Scikit-Learn、Keras、Gensim、Scrapy等，以下是第三方扩展库的简要介绍：（推荐学习：Python视频教程）
1. Pandas
Pandas是Python强大、灵活的数据分析和探索工具，包含Series、DataFrame等高级数据结构和工具，安装Pandas可使Python中处理数据非常快速和简单。
Pandas是Python的一个数据分析包，Pandas最初被用作金融数据分析工具而开发出来，因此Pandas为时间序列分析提供了很好的支持。
Pandas是为了解决数据分析任务而创建的，Pandas纳入了大量的库和一些标准的数据模型，提供了高效的操作大型数据集所需要的工具。Pandas提供了大量是我们快速便捷的处理数据的函数和方法。Pandas包含了高级数据结构，以及让数据分析变得快速、简单的工具。它建立在Numpy之上，使得Numpy应用变得简单。
带有坐标轴的数据结构，支持自动或明确的数据对齐。这能防止由于数据结构没有对齐，以及处理不同来源、采用不同索引的数据而产生的常见错误。
使用Pandas更容易处理丢失数据。合并流行数据库（如：基于SQL的数据库）Pandas是进行数据清晰/整理的最好工具。
2. Numpy
Python没有提供数组功能，Numpy可以提供数组支持以及相应的高效处理函数，是Python数据分析的基础，也是SciPy、Pandas等数据处理和科学计算库最基本的函数功能库，且其数据类型对Python数据分析十分有用。
Numpy提供了两种基本的对象：ndarray和ufunc。ndarray是存储单一数据类型的多维数组，而ufunc是能够对数组进行处理的函数。Numpy的功能：
N维数组，一种快速、高效使用内存的多维数组，他提供矢量化数学运算。可以不需要使用循环，就能对整个数组内的数据进行标准数学运算。非常便于传送数据到用低级语言编写(CC++)的外部库,也便于外部库以Numpy数组形式返回数据。
Numpy不提供高级数据分析功能，但可以更加深刻的理解Numpy数组和面向数组的计算。
3. Matplotpb
Matplotpb是强大的数据可视化工具和作图库，是主要用于绘制数据图表的Python库，提供了绘制各类可视化图形的命令字库、简单的接口，可以方便用户轻松掌握图形的格式，绘制各类可视化图形。
Matplotpb是Python的一个可视化模块，他能方便的只做线条图、饼图、柱状图以及其他专业图形。 使用Matplotpb，可以定制所做图表的任一方面。他支持所有操作系统下不同的GUI后端，并且可以将图形输出为常见的矢量图和图形测试，如PDF SVG JPG PNG BMP GIF.通过数据绘图，我们可以将枯燥的数字转化成人们容易接收的图表。 Matplotpb是基于Numpy的一套Python包，这个包提供了吩咐的数据绘图工具，主要用于绘制一些统计图形。 Matplotpb有一套允许定制各种属性的默认设置，可以控制Matplotpb中的每一个默认属性：图像大小、每英寸点数、线宽、色彩和样式、子图、坐标轴、网个属性、文字和文字属性。
4. SciPy
SciPy是一组专门解决科学计算中各种标准问题域的包的集合，包含的功能有最优化、线性代数、积分、插值、拟合、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算等，这些对数据分析和挖掘十分有用。
Scipy是一款方便、易于使用、专门为科学和工程设计的Python包，它包括统计、优化、整合、线性代数模块、傅里叶变换、信号和图像处理、常微分方程求解器等。Scipy依赖于Numpy，并提供许多对用户友好的和有效的数值例程，如数值积分和优化。
Python有着像Matlab一样强大的数值计算工具包Numpy；有着绘图工具包Matplotpb;有着科学计算工具包Scipy。 Python能直接处理数据，而Pandas几乎可以像SQL那样对数据进行控制。Matplotpb能够对数据和记过进行可视化，快速理解数据。Scikit-Learn提供了机器学习算法的支持，Theano提供了升读学习框架（还可以使用CPU加速）。
5. Keras
Keras是深度学习库，人工神经网络和深度学习模型，基于Theano之上，依赖于Numpy和Scipy，利用它可以搭建普通的神经网络和各种深度学习模型，如语言处理、图像识别、自编码器、循环神经网络、递归审计网络、卷积神经网络等。
6. Scikit-Learn
Scikit-Learn是Python常用的机器学习工具包，提供了完善的机器学习工具箱，支持数据预处理、分类、回归、聚类、预测和模型分析等强大机器学习库，其依赖于Numpy、Scipy和Matplotpb等。
Scikit-Learn是基于Python机器学习的模块，基于BSD开源许可证。 Scikit-Learn的安装需要Numpy Scopy Matplotpb等模块，Scikit-Learn的主要功能分为六个部分，分类、回归、聚类、数据降维、模型选择、数据预处理。
Scikit-Learn自带一些经典的数据集，比如用于分类的iris和digits数据集，还有用于回归分析的boston house prices数据集。该数据集是一种字典结构，数据存储在.data成员中，输出标签存储在.target成员中。Scikit-Learn建立在Scipy之上，提供了一套常用的机器学习算法，通过一个统一的接口来使用，Scikit-Learn有助于在数据集上实现流行的算法。 Scikit-Learn还有一些库，比如：用于自然语言处理的Nltk、用于网站数据抓取的Scrappy、用于网络挖掘的Pattern、用于深度学习的Theano等。
7. Scrapy
Scrapy是专门为爬虫而生的工具，具有URL读取、HTML解析、存储数据等功能，可以使用Twisted异步网络库来处理网络通讯，架构清晰，且包含了各种中间件接口，可以灵活的完成各种需求。
8. Gensim
Gensim是用来做文本主题模型的库，常用于处理语言方面的任务，支持TF-IDF、LSA、LDA和Word2Vec在内的多种主题模型算法，支持流式训练，并提供了诸如相似度计算、信息检索等一些常用任务的API接口。
更多Python相关技术文章，请访问Python教程栏目进行学习！以上就是小编分享的关于python数据分析用什么软件的详细内容希望对大家有所帮助，更多有关python教程请关注环球青藤其它相关文章！

python数据分析用什么软件

2. 数据分析工具有哪些 python

　IPython
　　
 
　　IPython 是一个在多种编程语言之间进行交互计算的命令行 shell，最开始是用 python 开发的，提供增强的内省，富媒体，扩展的 shell
语法，tab 补全，丰富的历史等功能。IPython 提供了如下特性：

　　更强的交互 shell(基于 Qt 的终端)

　　一个基于浏览器的记事本，支持代码，纯文本，数学公式，内置图表和其他富媒体

　　支持交互数据可视化和图形界面工具

　　灵活，可嵌入解释器加载到任意一个自有工程里

　　简单易用，用于并行计算的高性能工具

　　由数据分析总监，Galvanize 专家 Nir Kaldero 提供。

　　
 
　　GraphLab Greate 是一个 Python 库，由 C++ 引擎支持，可以快速构建大型高性能数据产品。

　　这有一些关于 GraphLab Greate 的特点：

　　可以在您的计算机上以交互的速度分析以 T 为计量单位的数据量。

　　在单一平台上可以分析表格数据、曲线、文字、图像。

　　最新的机器学习算法包括深度学习，进化树和 factorization machines 理论。

　　可以用 Hadoop Yarn 或者 EC2 聚类在你的笔记本或者分布系统上运行同样的代码。

　　借助于灵活的 API 函数专注于任务或者机器学习。

　　在云上用预测服务便捷地配置数据产品。

　　为探索和产品监测创建可视化的数据。

　　由 Galvanize 数据科学家 Benjamin Skrainka 提供。

 

　　Pandas

 

　　pandas 是一个开源的软件，它具有 BSD 的开源许可，为 Python
编程语言提供高性能，易用数据结构和数据分析工具。在数据改动和数据预处理方面，Python 早已名声显赫，但是在数据分析与建模方面，Python
是个短板。Pands 软件就填补了这个空白，能让你用 Python 方便地进行你所有数据的处理，而不用转而选择更主流的专业语言，例如 R 语言。

　　整合了劲爆的 IPyton 工具包和其他的库，它在 Python 中进行数据分析的开发环境在处理性能，速度，和兼容方面都性能卓越。Pands
不会执行重要的建模函数超出线性回归和面板回归;对于这些，参考 statsmodel 统计建模工具和 scikit-learn 库。为了把 Python
打造成顶级的统计建模分析环境，我们需要进一步努力，但是我们已经奋斗在这条路上了。

　　由 Galvanize 专家，数据科学家 Nir Kaldero 提供。

　　PuLP

　　线性编程是一种优化，其中一个对象函数被最大程度地限制了。PuLP 是一个用 Python
编写的线性编程模型。它能产生线性文件，能调用高度优化的求解器，GLPK，COIN CLP/CBC，CPLEX，和GUROBI，来求解这些线性问题。

　　由 Galvanize 数据科学家 Isaac Laughlin 提供

 

　　Matplotlib

　　
 
　　matplotlib 是基于 Python 的
2D(数据)绘图库，它产生(输出)出版级质量的图表，用于各种打印纸质的原件格式和跨平台的交互式环境。matplotlib 既可以用在 python 脚本，
python 和 ipython 的 shell 界面 (ala MATLAB? 或 Mathematica?)，web 应用服务器，和6类 GUI
工具箱。

　　matplotlib 尝试使容易事情变得更容易，使困难事情变为可能。你只需要少量几行代码，就可以生成图表，直方图，能量光谱(power
spectra)，柱状图，errorcharts，散点图(scatterplots)等，。

　　为简化数据绘图，pyplot 提供一个类 MATLAB 的接口界面，尤其是它与 IPython
共同使用时。对于高级用户，你可以完全定制包括线型，字体属性，坐标属性等，借助面向对象接口界面，或项 MATLAB 用户提供类似(MATLAB)的界面。

　　Galvanize 公司的首席科学官 Mike Tamir 供稿。

 

　　Scikit-Learn

　　
 
　　Scikit-Learn 是一个简单有效地数据挖掘和数据分析工具(库)。关于最值得一提的是，它人人可用，重复用于多种语境。它基于
NumPy，SciPy 和 mathplotlib 等构建。Scikit 采用开源的 BSD 授权协议，同时也可用于商业。Scikit-Learn
具备如下特性：

　　分类(Classification) – 识别鉴定一个对象属于哪一类别

　　回归(Regression) – 预测对象关联的连续值属性

　　聚类(Clustering) – 类似对象自动分组集合

　　降维(Dimensionality Reduction) – 减少需要考虑的随机变量数量

　　模型选择(Model Selection) –比较、验证和选择参数和模型

　　预处理(Preprocessing) – 特征提取和规范化

　　Galvanize 公司数据科学讲师，Isaac Laughlin提供

 

　　Spark

　　
 
　　Spark 由一个驱动程序构成，它运行用户的 main 函数并在聚类上执行多个并行操作。Spark
最吸引人的地方在于它提供的弹性分布数据集(RDD)，那是一个按照聚类的节点进行分区的元素的集合，它可以在并行计算中使用。RDDs 可以从一个 Hadoop
文件系统中的文件(或者其他的 Hadoop 支持的文件系统的文件)来创建，或者是驱动程序中其他的已经存在的标量数据集合，把它进行变换。用户也许想要 Spark
在内存中永久保存 RDD，来通过并行操作有效地对 RDD 进行复用。最终，RDDs 无法从节点中自动复原。

　　Spark 中第二个吸引人的地方在并行操作中变量的共享。默认情况下，当 Spark
在并行情况下运行一个函数作为一组不同节点上的任务时，它把每一个函数中用到的变量拷贝一份送到每一任务。有时，一个变量需要被许多任务和驱动程序共享。Spark
支持两种方式的共享变量：广播变量，它可以用来在所有的节点上缓存数据。另一种方式是累加器，这是一种只能用作执行加法的变量，例如在计数器中和加法运算中。

3. python可以做哪些数据分析

1、检查数据表
Python中使用shape函数来查看数据表的维度，也就是行数和列数。你可以使用info函数查看数据表的整体信息，使用dtypes函数来返回数据格式。Isnull是Python中检验空值的函数，你可以对整个数据表进行检查，也可以单独对某一列进行空值检查，返回的结果是逻辑值，包含空值返回True，不包含则返回False。使用unique函数查看唯一值，使用Values函数用来查看数据表中的数值。
2、数据表清洗
Python中处理空值的方法比较灵活，可以使用Dropna函数用来删除数据表中包含空值的数据，也可以使用fillna函数对空值进行填充。Python中dtype是查看数据格式的函数，与之对应的是astype函数，用来更改数据格式，Rename是更改列名称的函数，drop_duplicates函数删除重复值，replace函数实现数据替换。
3、数据预处理
数据预处理是对清洗完的数据进行整理以便后期的统计和分析工作，主要包括数据表的合并、排序、数值分列、数据分组及标记等工作。在Python中可以使用merge函数对两个数据表进行合并，合并的方式为inner，此外还有left、right和outer方式。使用ort_values函数和sort_index函数完成排序，使用where函数完成数据分组，使用split函数实现分列。
4、数据提取
主要是使用三个函数：loc、iloc和ix，其中loc函数按标签值进行提取，iloc按位置进行提取，ix可以同时按标签和位置进行提取。除了按标签和位置提起数据以外，还可以按具体的条件进行数据，比如使用loc和isin两个函数配合使用，按指定条件对数据进行提取。
5、数据筛选汇总
Python中使用loc函数配合筛选条件来完成筛选功能，配合sum和 count函数还能实现excel中sumif和countif函数的功能。Python中使用的主要函数是groupby和pivot_table。groupby是进行分类汇总的函数，使用方法很简单，制定要分组的列名称就可以，也可以同时制定多个列名称，groupby 按列名称出现的顺序进行分组。

python可以做哪些数据分析

4. 如何用python进行数据分析

5. 如何利用python进行数据分析

近年来分析学在数据、网络、金融等领域获得了突出的地位。应用各种软件组合起来进行数据收集，数据管理，以及数据分析，得出的结论用作商业决策，业务需求分析等等。分析学用于研究一个产品的市场效应，银行的贷款决定，这些都只是分析学的冰山一角。它在大数据，安全，数字和软件分析等领域有很深远的影响，下面是Python在分析学中的主要作用的一个延续：
在这个信息过载的世界，只有那些可以利用解析数据的优势来得出见解的人会获益。Python对于大数据的解释和分析具有很重要的作用。分析公司开发的很多工具都是基于Python来约束大数据块。分析师们会发现Python并不难学，它是一个强有力的数据管理和业务支持的媒介。
使用单一的语言来处理数据有它的好处。如果你以前曾经使用过C++或者Java，那么对你来说，Python应该很简单。数据分析可以使用Python实现，有足够的Python库来支持数据分析。 Pandas是一个很好的数据分析工具，因为它的工具和结构很容易被用户掌握。对于大数据来说它无疑是一个最合适的选择。即使是在数据科学领域，Python也因为它的“开发人员友好性”而使其他语言相形见绌。一个数据科学家熟悉Python的可能性要比熟悉其他语言的可能性高得多。
除了Python在数据分析中那些很明显的优点(易学，大量的在线社区等等)之外，在数据科学中的广泛使用，以及我们今天看到的大多数基于网络的分析，是Python在数据分析领域得以广泛传播的主要原因。
不论是金融衍生品还时大数据分析，Python都发挥了重要的作用。就前者而言，Python能够很好地和其它系统，软件工具以及数据流结合在一起，当然也包括R。用Python来对大数据做图表效果更好，它在速度和帮助方面也一样可靠。有些公司使用Python进行预测分析和统计分析。

如何利用python进行数据分析

6. 用python做数据分析

您好，很高兴为您解答用Python做数据分析的情况。一、Python介绍Python是一种高级编程语言，它已经被广泛应用于商业、科学、统计学和机器学习等领域，受到众多开发者的青睐。它拥有快速、简单、易学和丰富的库，因此被誉为能够结合大量现有工具来快速开发程序的绝佳编程语言。二、使用Python做数据分析Python中的NumPy、Pandas和Scikit-learn这三个库都可以用来进行数据的分析与处理，其中NumPy可以用来进行数学计算和数组操作，Pandas可以用来处理各种表格和时间序列数据，而Scikit-learn可以用来构建分类和回归模型。这些都是Python在数据分析方面十分有用的工具，可以帮助我们较快进行数据处理。以上就是关于用Python做数据分析的情况介绍，希望我的回答能够帮助您，祝您生活愉快！【摘要】
用python做数据分析【提问】
您好，很高兴为您解答用Python做数据分析的情况。一、Python介绍Python是一种高级编程语言，它已经被广泛应用于商业、科学、统计学和机器学习等领域，受到众多开发者的青睐。它拥有快速、简单、易学和丰富的库，因此被誉为能够结合大量现有工具来快速开发程序的绝佳编程语言。二、使用Python做数据分析Python中的NumPy、Pandas和Scikit-learn这三个库都可以用来进行数据的分析与处理，其中NumPy可以用来进行数学计算和数组操作，Pandas可以用来处理各种表格和时间序列数据，而Scikit-learn可以用来构建分类和回归模型。这些都是Python在数据分析方面十分有用的工具，可以帮助我们较快进行数据处理。以上就是关于用Python做数据分析的情况介绍，希望我的回答能够帮助您，祝您生活愉快！【回答】

7. 可以让你快速用Python进行数据分析的10个小技巧

 
   一些小提示和小技巧可能是非常有用的，特别是在编程领域。有时候使用一点点黑客技术，既可以节省时间，还可能挽救“生命”。
   一个小小的快捷方式或附加组件有时真是天赐之物，并且可以成为真正的生产力助推器。所以，这里有一些小提示和小技巧，有些可能是新的，但我相信在下一个数据分析项目中会让你非常方便。
   Pandas中数据框数据的Profiling过程
   Profiling（分析器）是一个帮助我们理解数据的过程，而Pandas Profiling是一个Python包，它可以简单快速地对Pandas 的数据框数据进行 探索 性数据分析。
   Pandas中df.describe()和df.info()函数可以实现EDA过程第一步。但是，它们只提供了对数据非常基本的概述，对于大型数据集没有太大帮助。 而Pandas中的Profiling功能简单通过一行代码就能显示大量信息，且在交互式HTML报告中也是如此。
   对于给定的数据集，Pandas中的profiling包计算了以下统计信息：
   由Pandas Profiling包计算出的统计信息包括直方图、众数、相关系数、分位数、描述统计量、其他信息——类型、单一变量值、缺失值等。
    安装 
   用pip安装或者用conda安装
   pip install pandas-profiling
   conda install -c anaconda pandas-profiling
    用法 
   下面代码是用很久以前的泰坦尼克数据集来演示多功能Python分析器的结果。
   #importing the necessary packages
   import pandas as pd
   import pandas_profiling
   df = pd.read_csv('titanic/train.csv')
   pandas_profiling.ProfileReport(df)
   一行代码就能实现在Jupyter Notebook中显示完整的数据分析报告，该报告非常详细，且包含了必要的图表信息。
   还可以使用以下代码将报告导出到交互式HTML文件中。
   profile = pandas_profiling.ProfileReport(df)
   profile.to_file(outputfile="Titanic data profiling.html")
    Pandas实现交互式作图 
   Pandas有一个内置的.plot（）函数作为DataFrame类的一部分。但是，使用此功能呈现的可视化不是交互式的，这使得它没那么吸引人。同样，使用pandas.DataFrame.plot（）函数绘制图表也不能实现交互。 如果我们需要在不对代码进行重大修改的情况下用Pandas绘制交互式图表怎么办呢？这个时候就可以用Cufflinks库来实现。
   Cufflinks库可以将有强大功能的plotly和拥有灵活性的pandas结合在一起，非常便于绘图。下面就来看在pandas中如何安装和使用Cufflinks库。
    安装 
   pip install plotly
   # Plotly is a pre-requisite before installing cufflinks
   pip install cufflinks
    用法 
   #importing Pandas
   import pandas as pd
   #importing plotly and cufflinks in offline mode
   import cufflinks as cf
   import plotly.offline
   cf.go_offline()
   cf.set_config_file(offline=False, world_readable=True)
   是时候展示泰坦尼克号数据集的魔力了。
   df.iplot()
   df.iplot() vs df.plot()
   右侧的可视化显示了静态图表，而左侧图表是交互式的，更详细，并且所有这些在语法上都没有任何重大更改。
    Magic命令 
   Magic命令是Jupyter notebook中的一组便捷功能，旨在解决标准数据分析中的一些常见问题。使用命令％lsmagic可以看到所有的可用命令。
   所有可用的Magic命令列表
   Magic命令有两种：行magic命令（line magics），以单个％字符为前缀，在单行输入操作；单元magic命令（cell magics），以双%%字符为前缀，可以在多行输入操作。如果设置为1，则不用键入%即可调用Magic函数。
   接下来看一些在常见数据分析任务中可能用到的命令：
    % pastebin 
   ％pastebin将代码上传到Pastebin并返回url。Pastebin是一个在线内容托管服务，可以存储纯文本，如源代码片段，然后通过url可以与其他人共享。事实上，Github gist也类似于pastebin，只是有版本控制。
   在file.py文件中写一个包含以下内容的python脚本，并试着运行看看结果。
   #file.py
   def foo(x):
   return x
   在Jupyter Notebook中使用％pastebin生成一个pastebin url。
    %matplotlib notebook 
   函数用于在Jupyter notebook中呈现静态matplotlib图。用notebook替换inline，可以轻松获得可缩放和可调整大小的绘图。但记得这个函数要在导入matplotlib库之前调用。
    %run 
   用％run函数在notebook中运行一个python脚本试试。
   %run file.py
   %%writefile
   %% writefile是将单元格内容写入文件中。以下代码将脚本写入名为foo.py的文件并保存在当前目录中。
    %%latex 
   %%latex函数将单元格内容以LaTeX形式呈现。此函数对于在单元格中编写数学公式和方程很有用。
    查找并解决错误 
   交互式调试器也是一个神奇的功能，我把它单独定义了一类。如果在运行代码单元时出现异常，请在新行中键入％debug并运行它。 这将打开一个交互式调试环境，它能直接定位到发生异常的位置。还可以检查程序中分配的变量值，并在此处执行操作。退出调试器单击q即可。
    Printing也有小技巧 
   如果您想生成美观的数据结构，pprint是首选。它在打印字典数据或JSON数据时特别有用。接下来看一个使用print和pprint来显示输出的示例。
    让你的笔记脱颖而出 
   我们可以在您的Jupyter notebook中使用警示框/注释框来突出显示重要内容或其他需要突出的内容。注释的颜色取决于指定的警报类型。只需在需要突出显示的单元格中添加以下任一代码或所有代码即可。
    蓝色警示框：信息提示 
   
   Tip: Use blue boxes (alert-info) for tips and notes.
   If it’s a note, you don’t have to include the word “Note”.
   
    黄色警示框：警告 
   
   Example: Yellow Boxes are generally used to include additional examples or mathematical formulas.
   
    绿色警示框：成功 
   
   Use green box only when necessary like to display links to related content.
   
    红色警示框：高危 
   
   It is good to avoid red boxes but can be used to alert users to not delete some important part of code etc.
   
    打印单元格所有代码的输出结果 
   假如有一个Jupyter Notebook的单元格，其中包含以下代码行：
   In [1]: 10+5
   11+6
   Out [1]: 17
   单元格的正常属性是只打印最后一个输出，而对于其他输出，我们需要添加print()函数。然而通过在notebook顶部添加以下代码段可以一次打印所有输出。
   添加代码后所有的输出结果就会一个接一个地打印出来。
   In [1]: 10+5
   11+6
   12+7
   Out [1]: 15
   Out [1]: 17
   Out [1]: 19
   恢复原始设置：
   InteractiveShell.ast_node_interactivity = "last_expr"
    使用'i'选项运行python脚本 
   从命令行运行python脚本的典型方法是：python hello.py。但是，如果在运行相同的脚本时添加-i，例如python -i hello.py，就能提供更多优势。接下来看看结果如何。
   首先，即使程序结束，python也不会退出解释器。因此，我们可以检查变量的值和程序中定义的函数的正确性。
   其次，我们可以轻松地调用python调试器，因为我们仍然在解释器中：
   import pdb
   pdb.pm()
   这能定位异常发生的位置，然后我们可以处理异常代码。
    自动评论代码 
   Ctrl / Cmd + /自动注释单元格中的选定行，再次命中组合将取消注释相同的代码行。
    删除容易恢复难 
   你有没有意外删除过Jupyter notebook中的单元格？如果答案是肯定的，那么可以掌握这个撤消删除操作的快捷方式。
   如果您删除了单元格的内容，可以通过按CTRL / CMD + Z轻松恢复它。
   如果需要恢复整个已删除的单元格，请按ESC + Z或EDIT>撤消删除单元格。
    结论 
   在本文中，我列出了使用Python和Jupyter notebook时收集的一些小提示。我相信它们会对你有用，能让你有所收获，从而实现轻松编码！

可以让你快速用Python进行数据分析的10个小技巧

8. 如何用python进行数据分析

1、Python数据分析流程及学习路径
数据分析的流程概括起来主要是：读写、处理计算、分析建模和可视化四个部分。在不同的步骤中会用到不同的Python工具。每一步的主题也包含众多内容。
根据每个部分需要用到的工具，Python数据分析的学习路径如下：
相关推荐：《Python入门教程》
2、利用Python读写数据
Python读写数据，主要包括以下内容：
我们以一小段代码来看：
可见，仅需简短的两三行代码即可实现Python读入EXCEL文件。
3、利用Python处理和计算数据
在第一步和第二步，我们主要使用的是Python的工具库NumPy和pandas。其中，NumPy主要用于矢量化的科学计算，pandas主要用于表型数据处理。

4、利用Python分析建模
在分析和建模方面，主要包括Statsmdels和Scikit-learn两个库。
Statsmodels允许用户浏览数据，估计统计模型和执行统计测试。可以为不同类型的数据和每个估算器提供广泛的描述性统计，统计测试，绘图函数和结果统计列表。

Scikit-leran则是著名的机器学习库，可以迅速使用各类机器学习算法。

5、利用Python数据可视化
数据可视化是数据工作中的一项重要内容，它可以辅助分析也可以展示结果。