使用 Jupyter Notebook 配置 Stata\Python\Julia\R

发布时间:2020-03-25 阅读 525

作者:许梦洁 (中山大学)
E-mail: xumj9@mail2.sysu.edu.cn

原文链接:磐石若水使用 Jupyter Notebook 配置 Stata/Python/Julia/R

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」

Note: 许梦洁同学已前往德国深造,但考虑到这篇推文是在中山大学读书期间完成的,因此,署名仍然为中山大学。

Stata连享会   主页 || 视频 || 推文

连享会 - Stata 暑期班

线上直播 9 天:2020.7.28-8.7
主讲嘉宾:连玉君 (中山大学) | 江艇 (中国人民大学)
课程主页https://gitee.com/arlionn/PX | 微信版

连享会 - 文本分析与爬虫 - 专题视频

主讲嘉宾:司继春 || 游万海

连享会-文本分析与爬虫-专题视频教程
连享会-文本分析与爬虫-专题视频教程

早在去年在 Coursera 上学 Julia 的时候就用过 Jupyter Notebook,当时感觉没啥特别的。然鹅最近和连老师交流的时候突然发现了 Jupyter 的妙处,就像一个美人儿,看一眼觉得还行,多看几眼就发现了韵味,所以写篇 Jupyter 配置笔记来记录一下。


目录


1. 为什么使用 Jupyter Notebook

官网上的解释:

The notebook extends the console-based approach to interactive computing in a qualitatively new direction, providing a web-based application suitable for capturing the whole computation process: developing, documenting, and executing code, as well as communicating the results. The Jupyter notebook combines two components:

  • A web application: a browser-based tool for interactive authoring of documents which combine explanatory text, mathematics, computations and their rich media output.
  • Notebook documents: a representation of all content visible in the web application, including inputs and outputs of the computations, explanatory text, mathematics, images, and rich media representations of objects.

总结起来就是一个汇集开发、执行和文档为一体,而且支持包含 Python、Julia、Stata、R、Ruby、Matlab、SAS 等多种语言并可以实现交互式代码的网页版 IDE。直观来讲是 IPython 在多种语言上的网页版外推。有了这个神器,我们能规避掉的目前主流 IDE 里存在的问题包括但不局限于:

  • 在 IDE 里测试,看不到每个部分的 output 效果。在命令行里测试,则没法轻松撤销前面的代码
  • 没办法一边编辑一边显示每部分执行的效果,
  • 没办法一边编辑一边在旁边用 Markdown 做笔记
  • 不方便和合作者协同交互

所以 Jupyter Notebook 真的是个很酷的小东西了 hhh。

2. 使用效果

2.1 Stata

Jupyter 中的 Stata 实操 A
Jupyter 中的 Stata 实操 A
Jupyter 中的 Stata 实操 B
Jupyter 中的 Stata 实操 B

2.2 Julia

Jupyter 中的 Julia 实操
Jupyter 中的 Julia 实操

不得不说,把「敲代码」、「运行程序」和「记好看的笔记」集于一身的 Jupyter 真是太优秀啦!最重要的是导出格式也丰富多样 (Latex 和 Markdown 都有,看了都激动):

Jupyter Notebook 界面
Jupyter Notebook 界面

3. 如何安装 Jupyter Notebook?

有两种方案,但不管哪种方案,都需要电脑已经安装好了 Python (推荐 3.X 版本)。

3.1 第一种方案

  • Anaconda 下载地址 上下载并安装 Anaconda。
  • 在 Mac 的 终端 / Windows 里的 cmd 里输入:jupyter notebook 即可使用:
jupyter 页面
jupyter 页面

3.2 第二种方案

在 Mac 的 终端 / Windows 里的 cmd 里输入:

  • ounter(line
  • ounter(line
python3 -m pip install --upgrade pippython3 -m pip install jupyter

然后输入:

  • ounter(line
jupyter notebook

看能不能打开 jupyter 页面。

3.3 两种方案的选择

如果只是想测试下 Jupyter 环境,并且日常主要使用的不是 Python 语言,就没必要安装庞大的 Anaconda 大礼包啦,研究数据科学、机器学习和自然语言处理的同学墙裂推荐安装。因为 Anaconda 包括:

  • 1500+ Python/R 的数据科学包
  • scikit-learn、TensorFlow、Theano 等一系列机器学习和深度学习包
  • Dask、NumPy、pandas、Numba 等数据分析包
  • Matplotlib、Bokeh、Datashader、Holoviews 等数据可视化包

有些包装起来还挺麻烦的, Anaconda 一键安装省了很多事。除了这些丰富的包外,丰富的集成环境 Anaconda Navigator 和功能强大的 conda 命令也是一大亮点:

Anaconda Navigator
Anaconda Navigator

如果对数据科学并不感兴趣,直接用第二种方法即可,更加轻便快捷。

4. 在 Jupyter 里添加 Kernal

如果我们想在 Jupyter 上面运行 Python3.X / Stata /Julia/R 的程序,就需要手动加 Kernal。

4.1 Stata Kernal

在 Mac 的 终端 / Windows 里的 cmd 里输入:

  • ounter(line
  • ounter(line
pip3 install stata_kernelpython -m stata_kernel.install

4.2 Python3.X Kernal

  • ounter(line
  • ounter(line
pip3 install ipykernelpython -m ipykernel install

4.3 Julia Kernal

可以直接使用内嵌 Jupyter 的 JuliaBox(需要登录):

juliabox
juliabox

也可以使用 IJulia 配置:

  • Step1: 在 Mac 的 终端 / Windows 里的 cmd 里输入 julia 进入 julia :
julia
julia
  • Step2: 英文字符下输入 ] 进入 pkg 模式:
  • Step3: 输入命令 add IJulia 安装(或升级) IJulia:
  • Step4: 在 Mac 的 终端 / Windows 里的 cmd 里输入 jupyter notebook 启动 jupyter

4.4 R Kernal

R kernal 我是用 Anaconda Navigator 装的:

  • Step1: 打开 Anaconda Navigator
  • Step2: 选择 Environment 中的 create 创建一个新环境
  • Step3: 将环境命名为 "r-tutorial",在下拉菜单中选择 Python3.7 和 R
  • Step4: 环境创建完成后,右键选择 Open the environment with the R package,就完成啦

到此为止,我们已经在 Jupyter 里安装了 Stata/Python/Julia/R 的 Kernal,启动后我们可以看到如下的效果:

5. 主要参考资料

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」

  1. Jupyter Stata_kernel 设定方法
  2. Using the R programming language in Jupyter Notebook
  3. Julia in Jupyter——配置使用Julia语言
  4. 安装stata并在jupyter-notebook中调用
  5. Julia Box
  6. Jupyter官网-安装
  7. Anaconda官网-下载
  8. Jupyter Notebook for Beginners: A Tutorial
  9. Jupyter Notebook之初识及入门
  10. Jupyter Notebook介绍、安装及使用教程

相关课程

连享会-直播课 上线了!
http://lianxh.duanshu.com

免费公开课:


课程一览

支持回看,所有课程可以随时购买观看。

专题 嘉宾 直播/回看视频
Stata暑期班 连玉君
江艇
线上直播 9 天
2020.7.28-8.7
效率分析-专题 连玉君
鲁晓东
张 宁
视频-TFP-SFA-DEA
已上线,3天
文本分析/爬虫 游万海
司继春
视频-文本分析与爬虫
已上线,4天
空间计量系列 范巧 空间全局模型, 空间权重矩阵
空间动态面板, 空间DID
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
直击面板数据模型 [免费公开课,2小时]

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类: 计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:
    • 课程, 直播, 视频, 客服, 模型设定, 研究设计, 暑期班
    • stata, plus,Profile, 手册, SJ, 外部命令, profile, mata, 绘图, 编程, 数据, 可视化
    • DID,RDD, PSM,IV,DID, DDD, 合成控制法,内生性, 事件研究, 交乘, 平方项, 缺失值, 离群值, 缩尾, R2, 乱码, 结果
    • Probit, Logit, tobit, MLE, GMM, DEA, Bootstrap, bs, MC, TFP, 面板, 直击面板数据, 动态面板, VAR, 生存分析, 分位数
    • 空间, 空间计量, 连老师, 直播, 爬虫, 文本, 正则, python
    • Markdown, Markdown幻灯片, marp, 工具, 软件, Sai2, gInk, Annotator, 手写批注, 盈余管理, 特斯拉, 甲壳虫, 论文重现, 易懂教程, 码云, 教程, 知乎

连享会主页  lianxh.cn
连享会主页 lianxh.cn

连享会小程序:扫一扫,看推文,看视频……


扫码加入连享会微信群,提问交流更方便

✏ 连享会学习群-常见问题解答汇总:
https://gitee.com/arlionn/WD