简单来说Anaconda是包管理器和环境管悝器,Jupyter notebook 可以将数据分析的代码、图像和文档全部组合到一个web文档中
不过在开始前我需要强调下,下面的步骤你要亲自跟着敲一遍并在自巳的电脑上实践虽然下面你会遇到很多命令,给了谁都记不住的但是别怕,也别中途放弃因为你没必要记住命令,因为当你在后面學习数据分析用的多了自然就记住了。
记不住也没关系学会在哪查找就可以了。你只需要跟着上面步骤操作下并理解了每一步是干什么的就可以了。后面遇到要做的事情忘记了回头查这个文档就可以了。
刚开始学习的过程会遇到困难只要中途不放弃,自己实际操莋一遍我保证你可以熟练上手。
Anaconda在英文中是“蟒蛇”有首歌就叫《Anaconda》,表示像蟒蛇一样性感妖娆的身体
所有你看下面Anaconda的图标就像一個收尾互相咬住的“蟒蛇”。
你可能已经安装了 Python那么为什么还需要 Anaconda?有以下3个原因:
1)Anaconda install附带了一大批常用数据科学包它附带了 conda、Python 和 150 多個科学包及其依赖项。因此你可以立即开始处理数据
Anaconda install是在 conda(一个包管理器和环境管理器)上发展出来的。
在数据分析中你会用到很多苐三方的包,而conda(包管理器)可以很好的帮助你在计算机上安装和管理这些包包括安装、卸载和更新包。
为什么需要管理环境呢比如伱在A项目中用了 Python 2,而新的项目B老大要求使用Python 3而同时安装两个Python版本可能会造成许多混乱和错误。这时候 conda就可以帮助你为不同的项目建立不哃的运行环境
还有很多项目使用的包版本不同,比如不同的pandas版本不可能同时安装两个 Numpy 版本,你要做的应该是为每个 Numpy 版本创建一个环境,然后项目的对应环境中工作这时候conda就可以帮你做到。
Anaconda install可用于多个平台( Windows、Mac OS X 和 Linux)你可以在下面地址上找到安装程序和安装说明。根據你的操作系统是32位还是64位选择对应的版本下载
(Anaconda已经不支持Windows XP;同时查看自己电脑是32位还是64位,不要装错了)
如果官网地址网速太慢無法下载,可以从我公众号中回复“资料”从网盘下载
Anaconda install的下载文件比较大(约 500 MB)因为它附带了 Python 中最常用的数据科学包。
如果计算机上已經安装了 Python安装不会对你有任何影响。实际上脚本和程序使用的默认 Python 是 Anaconda install附带的 Python。
注意:如果你是windows 10系统注意在安装Anaconda软件的时候,右击安裝软件→选择以管理员的身份运行
注意:如果你是windows 10系统,按下图操作
如果win10系统没有按上述操作后面会报下面的错误信息:
可以在终端戓命令提示符中键入 conda installlist,以查看你安装的内容
PS:如果按上面操作后在Anaconda installPrompt中都无法使用Conda命令,按以下顺序的解决办法来尝试(正常使用的朋友忽畧这一步继续往下):
1)检查你是否原来安装过Python,如果安装过请彻底删除Python(同时要删除环境变量)后重装Anaconda
2)检查自己是否将Conda命令添加到叻环境变量
3)确保你的Anaconda安装路径不包含中文或其他非英语常用字符
4)经过以上步骤还是没有任何改善,请卸载Anaconda重装一遍
为了避免后面使鼡报错你需要先更新下所有包。在终端输入更新所有包的命令:
并在提示是否更新的时候输入 y(Yes)让更新继续初次安装下的软件包版夲一般都比较老旧,因此提前更新可以避免未来不必要的问题
如果运行以上命令或者安装包报下面的错误信息:
可以用下面的解决办法(在终端中运行以下命令):
如果命令行方法添加不上,可以在“notebook工作文件夹”找到文件.condarc
什么是你的“notebook工作文件夹”呢?
打开该文件夹修改文件内容如下:
(如果没有找到.condarc,用notepad++软件在“notebook工作文件夹”下新建一个该文件即可并添加以下内容)
为了方便,你可以将下面部汾直接复制到上面的文件中:
安装了 Anaconda install之后就可以很方便的管理包了(安装,卸载更新)。
例如要安装 pandas,在终端中输入:
如果想更新環境中的所有包(这样做常常很有用)使用:conda installupdate --all。
例如我已经成功安装了numpy和pandas这两个常用的包
如果不知道要找的包的确切名称,可以尝试使用 conda installsearch search_term 进行搜索例如,我知道我想安装numpy但我不清楚确切的包名称。我可以这样尝试:conda installsearch num
conda install可以为你不同的项目建立不同的运行环境。
上面嘚命令中env_name 是设置环境的名称(-n 是指该命令后面的env_name是你要创建环境的名称),package_names 是你要安装在创建环境中的包名称
2)创建环境时,可以指萣要安装在环境中的 Python 版本
当你同时使用 Python 2.x 和 Python 3.x 中的代码时这很有用要创建具有特定 Python 版本的环境,例如创建环境名称为py3并安装最新版本的Python3在終端中输入:
或也可以这样创建环境名称为py2,并安装最新版本的Python2:
因为我做的项目不同有时候会用到Python2,还有时候会用到Python3所以我在自己嘚计算机上创建了这两个环境,并分别取了这样的环境名称:py2,py3这样我可以根据不同的项目轻松使用不同版本的python。
进入环境后你会在终端提示符中看到环境名称,下面图片是我进入py3的环境(这里的py3是我上面创建环境时自己起的名称你可以起个自己喜欢的名称)。
进入环境后我可以用conda installlist 查看环境中默认安装的几个包:
不过,这次你安装的特定包仅在你进入环境后才可用
共享环境非常有用,它能让其他人咹装你的代码中使用的所有包并确保这些包的版本正确。比如你开发了一个药店数据分析系统你要提交给项目部署系统的王二狗来部署你的项目,但是王二狗并不知道你当时开发时使用的是哪个python版本以及使用了哪些包和包的版本。这怎么办呢
命令的第一部分 conda installenv export 用于输絀环境中的所有包的名称(包括 Python 版本)。
在“notebook工作文件夹”下(及你在终端中上图的路径)可以看到导出的环境文件:
在 GitHub 上共享代码时朂好同样创建环境文件并将其包括在代码库中。这能让其他人更轻松地安装你的代码的所有依赖项
导出的环境文件,在其他电脑环境中洳何使用呢
然后在使用以下命令更新你的环境:
#其中-f表示你要导出文件在本地的路径,所以/path/to/environment.yml要换成你本地的实际路径
举个例子你可能更嫆易理解这个使用场景:
首先我在自己的电脑上在conda中将项目的包导出成environment.txt 文件:
然后我将该文件包含在项目的代码库中,其他项目成员即使在他的电脑上没有安装conda也可以使用该文件来安装和我一样的开发环境:
他在自己的电脑上进入python命令环境然后运行以下命令就可以安装該项目需要的包:
我有时候会忘记自己创建的环境名称,这时候用 conda installenv list 就可以列出你创建的所有环境
你会看到环境的列表,而且你当前所在環境的旁边会有一个星号默认的环境(即当你不在选定环境中时使用的环境)名为 root。
最后重新再强调下不要被上面的命令吓到。虽然仩述命令多给了谁都记不住的。后面你跟着我在知乎上多做项目用的多了自然记住了。你只需要跟着上面步骤操作下并理解了每一步是干什么的就可以了。后面遇到要做的事情忘记了回头查这个文档就可以了。
conda的官方文档:
按照上面的步骤你亲自操作一遍后你已經学会了Anaconda,并安装好你的数据分析Pyhton环境了接下来你就可以愉快的使用Jupyter notebook来做数据分析了。
推荐:即使有房贷我也支持自己的决定再见,富士康
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。